La grêle est un phénomène météorologique causant des dommages importants aux cultures et aux infrastructures. La France est exposée à des pertes importantes dues aux orages de grêle. Entre Janvier et Juin 2022, les dégâts totaux causés par la grêle ont été estimés à 5,2 milliards d'euros (France Assureurs).
Les techniques actuelles de détection et d'estimation de la taille des grêlons sont basées sur les données des radars météorologiques. Elles présentent de nombreuses difficultés à détecter et à estimer la taille des grêlons au sol avec précision. Les techniques actuelles de détection de la grêle existante ne prennent pas en compte les informations contenues dans la morphologie de l'orage.
L'objectif de cette thèse, financée par Descartes Underwriting, une compagnie d'assurance paramétrique basée à Paris, et Météo-France, est de développer une nouvelle technique de détection de la grêle plus précise en France. La méthodologie utilise des réseaux de neurones convolutionnels (CNN) pour analyser la morphologie des orages et considérer le problème de la détection et de l'estimation de la taille des grêlons comme un problème de reconnaissance d'images.
Dans notre première contribution, les CNN sont appliqués à des images radar afin de détecter la grêle sévère au sol (sup. à 2 cm). Un seul pas de temps est utilisé pour effectuer une prédiction. La construction d'un ensemble de données de haute qualité et le développement d'un plan expérimental rigoureux ont permis de montrer que les CNN sont plus performants que les techniques existantes. En outre, il a été constaté que les architectures de CNN peu profondes sont plus efficaces que les CNN complexes, et que les variables radar les plus importantes pour cette détection sont principalement basées sur la réflectivité. Il a été démontré que l'incorporation d'indicateurs de grêle existants en entrée des CNN permettait d'améliorer ses performances. Une partie essentielle de la première contribution montrer que la majorité des méthodes de détection de la grêle existantes peuvent atteindre des niveaux de performance comparables lorsqu'elles sont correctement ajustées. Un exemple d'inférence à l’aide d’un algorithme de suivi des cellules a démontré que les CNN peu profonds appliqués aux orages permettent des prédictions rapides et cohérentes, bien qu'une validation plus poussée soit nécessaire.
La deuxième contribution de la thèse concerne l'application de CNN à l'estimation de la taille des grêlons au sol. Le problème est abordé comme un problème multi-classes, les grêlons étant classés comme moyens (20-35 mm), grands (35-50 mm) ou géants (sup. à 50 mm). Un nouvel ensemble de données radar est construit à partir d'images radar autour des barycentres des cellules oragauses détectées par un algorithme de suivi des cellules. Chaque échantillon radar englobe six images différentes du cycle de vie de la cellule, pour une durée totale de 25 minutes. Ces nouvelles informations temporelles sont intégrées dans l'apprentissage des CNN. Une analyse statistique a révélé que la valeur maximale de l’echo top à 45dBZ et la hauteur de la colonne de ZDR augmentent avec la taille de la grêle au sol. L'analyse statistique suggère également que les cellules orageuses de grande taille, telles que les supercellules, produisent souvent les grêlons plus plus grands. Une phase de réglage a montré que les CNN peu profonds entraînés avec des pas de temps antérieurs de la chute de grêle étaient les plus robustes, par rapport à l'utilisation d'un seul pas de temps. Les résultats d'une étude d'importance ont montré que l'écho top était la variable la plus importante pour l'estimation de la taille des grêlons, suivie de près par les variables radar polarimétriques au-dessous du niveau de gel. Enfin, une comparaison avec les algorithmes existants a montré que les CNN peuvent être meilleurs pour estimer de taille de grêle, avec des conclusions mitigées étant donné la taille limitée des données de test. |
Hail is a severe weather phenomenon that can cause significant damage to crops, infrastructure, vehicles and solar panels. France is susceptible to significant losses due to hail storms. Between January and June 2022, the total damage produced by hail was estimated at 5.2 billion euros (France Assureurs).
Current hail detection and hail size estimation techniques are based on weather radar data. Most struggle in many ways to detect and estimate hail size on the ground. Many were developed to detect hail in regions other than France, using different ground observations and radar hardware, and a long time ago. In addition, hail size estimation remains the Achilles' heel of all existing methods, with limited performance when compared to hail observations. Finally, existing hail detection techniques struggle to take into account the possible information embedded in the storm morphology.
The objective of this PhD thesis, funded by Descartes Underwriting, a parametric insurance company based in Paris, France, and Météo-France, is to develop a new and more precise hail detection technique in France. The methodology employs convolutional neural networks (CNNs) to analyse storm morphology and consider the problem of hail detection and size estimation as an image recognition problem.
In our initial contribution, CNNs are applied to radar images to detect severe hail on the ground. Only a single timestep is utilized to perform a prediction. The construction of a high-quality dataset for the training of the CNNs and the development of a rigorous experimental design enabled the discovery that CNNs can outperform existing hail detection techniques. Furthermore, it was found that simple CNNs are more effective than complex CNNs in the task of severe hail detection, and that the most important radar variables for it were mostly reflectivity-based. The incorporation of existing hail proxies as inputs to the CNN was demonstrated to enhance its performance. An essential part of the first contribution was to illustrate that the majority of the existing hail detection methods can achieve comparable levels of performance when properly fine-tuned. An example of the inference of the CNN method for severe hail detection coupled with a cell tracking algorithm demonstrated that shallow CNNs applied to tracked storms in real-time allow fast and consistent predictions, although further validation will be needed.
The second contribution of the thesis concerns the application of the CNN architectures developed for severe hail detection to hail size estimation. The problem of hail size estimation is approached as a multi-class problem, with hail classified as either medium (20-35 mm), large (35-50 mm) or giant (above 50 mm). A new radar dataset is constructed using radar images around cell centroids detected by a cell tracking algorithm. Each radar sample encompasses six different time steps of the cell's lifecycle, for a total duration of 25 minutes. This novel time information is incorporated into the training of the CNNs. Basic statistical analysis revealed that the maximum value within images of the echo top at 45 dBZ (ET45) and the ZDR column height increased with hail size. The statistical analysis also suggests that large and highly organised storms, such as supercells, may produce larger hail than isolated cells or multicells. Several CNN models were trained during a tuning phase that showed that simpler models trained with prior timesteps of the hail fall were the most robust, compared to using one timestep only. The results of an importance study showed that the echotop was the most important feature for hail size estimation, narrowly followed by polarimetric variables below the freezing level. Finally, a comparison with existing algorithms showed that CNNs can be better in average at discriminating between hail size categories, but with mixed conclusions given the small size of the test dataset. |