La prévision d'ensemble est une évolution majeure de la prévision numérique du temps (PNT) sur les 30 dernières années. Elle permet d'estimer les incertitudes qui affectent les prévisions, en calculant plusieurs trajectoires (ou membres) possibles du système atmosphérique à partir de conditions initiales. Cependant, la grande sensibilité des équations de la physique à ces conditions initiales rend cette tâche très coûteuse. En effet, un grand nombre de membres est parfois nécessaire pour estimer correctement les probabilités d'occurrence d'événements météorologiques extrêmes. Les modèles de PNT régionaux atteignant des résolutions kilométriques, le nombre de membres calculable est limité à quelques dizaines. Savoir si des méthodes statistiques peuvent enrichir à moindre coût les prévisions fournies par les modèles de PNT "traditionnels" à résolution kilométrique est donc une question ouverte. Les progrès rapides de l'apprentissage profond, en tant que technique efficace d'émulation de modèles de PNT, permettent d'envisager l'usage des réseaux de neurones génératifs dans ce but.
Cette thèse cherche à appliquer ces méthodes au système de prévision d'ensemble à 16 membres PEARO, utilisé par Météo-France pour la prévision opérationnelle. Nous évaluons d'abord la capacité des GANs à émuler de façon aléatoire des champs de vent et de température issus de PEARO. Le réalisme physique de ces champs et les propriétés statistiques des distributions ainsi créées sont évalués par des métriques variées et complémentaires. Nous montrons, avec une architecture simple, que les GANs peuvent effectivement émuler les distributions de PEARO de façon satisfaisante, en termes de qualité et de diversité. Cependant, les données générées peuvent introduire certains biais dans l'entraînement, qui l'accélèrent, mais empêchent le GAN de reproduire complètement la distribution-cible.
L'architecture StyleGAN-2, fortement régularisée, s'affranchit de cet obstacle. Nous l'adaptons donc pour générer des événements précipitants. Pour entraîner le GAN avec succès dans ce cadre, il faut prendre en compte la variabilité extrême des précipitations. Nous présentons une façon de contrôler cette variabilité, et montrons son intérêt pour construire une représentation latente de qualité au sein du générateur, utilisable pour conditionner la génération à une situation météorologique quelconque.
Ensuite, nous présentons une méthode originale d'enrichissement des ensembles PEARO à l'aide de StyleGAN-2. La représentation latente du générateur permet de projeter les prévisions de PEARO dans un espace de basse dimension, où des perturbations linéaires des membres de PEARO sont utilisées pour créer de nouveaux membres. Cette méthode génère des membres réalistes et spécifiques de la situation météorologique considérée. A partir de 16 membres conditionneurs, les nouveaux ensembles peuvent notamment reproduire les extrêmes d'un ensemble AROME de 875 membres. En comparant ces nouveaux ensembles à des observations, cette méthode obtient des scores satisfaisants, en particulier pour l'estimation des occurrences d'événements extrêmes. Nous identifions également les facteurs qui restent à améliorer pour permettre un usage opérationnel.
En comparant StyleGAN-2 avec des modèles diffusifs, nous montrons enfin qu'un modèle de débruitage diffusif génère des champs de qualité comparable à ceux d'un GAN. Nous utilisons ensuite ce modèle diffusif dans un algorithme de génération conditionnelle récemment proposé par la littérature : il peut alors enrichir les prévisions de PEARO, obtenant des scores aux observations très légèrement dégradés par rapport à la méthode utilisant StyleGAN-2.
Les modèles génératifs peuvent ainsi émuler de façon convaincante les modèles de PNT à haute résolution, pour un faible coût de calcul. Néanmoins, ils font intervenir des compromis de performance et d'efficacité, qu'il faut contrôler pour faire de ces modèles des outils puissants de prévision. |
Ensemble forecasting has been a pivotal transformation of numerical weather
prediction (NWP) in the past 30 years, enabling the estimation
of the uncertainties affecting the forecasts. It aims at sampling several possible trajectories (also called members) of the atmospheric system from initial conditions. However, the sensitivity of
the physical equations to these conditions make the task a heavy computational burden. Indeed, some situations require many members to be computed so as to estimate the probabilities of occurrence of extreme weather events. With NWP regional models reaching kilometric resolution, the affordable number of members is limited to a few tens. It is thus an open question whether statistical methods can enrich the physical forecasts performed by "traditional", kilometer-scale NWP models, at lower computational costs. With the recent rise of deep learning as a compute-efficient technique to emulate NWP models, it seems natural to ask whether generative neural networks can emulate ensemble forecasts of kilometer-scale NWP models.
The purpose of this thesis apply these methods the 16-members, kilometric-scale AROME ensemble prediction system (AROME-EPS), operated by Météo-France.
We first evaluate the ability of GANs to recover the diversity of AROME-
EPS wind speed and temperature fields when generating them at random. The physical realism of these samples, as well as the statistical properties of the created distributions, are evaluated through a variety of metrics. We show, on a simple architecture, that GANs are able to generate convincingly-looking samples with a correct diversity. However, the training data can endow them with inductive biases, that may as well accelerate the training as they can limit the full recovery of target distributions. Choosing a strongly regularized StyleGAN-2 architecture allows to overcome this detrimental effect. We then adapt this architecture to the generation of precipitating events. The extreme variability of precipitation data must also be tempered for the training to be successful : we present a way to control this variability, which proves to be an essential factor for the quality of the generator's latent representation. This representation can then be used to condition the sampling with respect to a given weather situation.
Then, an original method is presented to enrich the available AROME-EPS with StyleGAN-2. The latent representation learnt by the generator is used to project existing AROME-EPS ensembles into a low-dimensional space. There, tuned linear perturbations of these existing members allow to create new ensemble members. This method can appropriately sample realistic members that are specific to the situation. It is also able to recover the distribution tails of a 875-members AROME-EPS ensemble with only 16 conditioning members. Evaluating this method against ground observations, we show that it has satisfying scores, in particular when it comes to the evaluation of extreme events. We also identify the bottlenecks that currently limit its use in an operational setting. A comparison with diffusion models finally shows that a denoising diffusion model has similar generation capabilities to StyleGAN-2. Using this model in a recently proposed conditional setting, we show that it is also capable to enrich AROME-EPS ensembles, with comparable but slightly worse scores with respect to StyleGAN-2.
This work demonstrates the capabilities of generative models to convincingly
emulate ensemble NWP models at high resolution, at a very low sampling cost ; however, we also emphasize that these methods come with their own trade-offs regarding performance and efficiency : controlling these trade-offs is necessary to make them powerful forecasting tools. |