Soutenance de thèse de Blanka BALOGH

Vers une utilisation de l'Intelligence Artificielle dans un modèle numérique de climat


Titre anglais : Towards the use of Artificial Intelligence in a numerical climate model
Ecole Doctorale : SDU2E - Sciences de l'Univers, de l'Environnement et de l'Espace
Spécialité : Océan, Atmosphère, Climat
Etablissement : Institut National Polytechnique de Toulouse
Unité de recherche : UMR 3589 - CNRM - Centre National de Recherches Météorologiques
Direction de thèse : David SAINT-MARTIN- Aurélien RIBES


Cette soutenance a eu lieu vendredi 07 octobre 2022 à 14h00
Adresse de la soutenance : Météopole 42, avenue Gaspard Coriolis 31057 Toulouse CEDEX 1 - salle Centre International de Conférences (CIC)

devant le jury composé de :
David SAINT-MARTIN   ICPEF   Météo France / CNRM   Directeur de thèse
Aurélien RIBES   ICPEF   Météo France / CNRM   CoDirecteur de thèse
Fabrice GAMBOA   Professeur des universités   Université Toulouse III Paul Sabatier / Institut de Mathématique de Toulouse   Président
Valérie MONBET   Professeure des universités   Université de Rennes 1   Rapporteur
Pierre GENTINE   Professor   Columbia University, New York   Rapporteur
Tom BEUCLER   Assistant professor   Université de Lausanne   Examinateur


Résumé de la thèse en français :  

Dans un modèle de climat, les paramétrisations physiques ont pour rôle de représenter l'effet moyen des processus sous-maille (e.g., convection profonde, turbulence) à la résolution du modèle. Elles sont numériquement efficaces, mais aussi la principale source d'incertitude dans les modèles de climat. Depuis quelques années, l'utilisation des techniques d'Intelligence Artificielle (IA), en particulier celle des réseaux de neurones (Neural Networks, NN), a permis de développer des paramétrisations d'un genre nouveau. Contrairement aux paramétrisations physiques traditionnelles, développées en utilisant des connaissances théoriques et des observations, les paramétrisations apprises sont ajustées à un jeu de données issu d'une simulation haute-résolution directement, dans le but d'apprendre une représentation plus précise des différents processus sous-maille. Les premiers résultats sont prometteurs, mais il reste des problèmes majeurs à résoudre avant leur utilisation dans un modèle de climat, en remplacement des paramétrisations traditionnelles. Le but de cette thèse est l'étude de quelques-uns de ces problèmes à l'aide de modèles jouets et à travers l'apprentissage d'une partie de la paramétrisation physique implémentée dans un modèle de climat.

Tout d'abord, l'utilisation d'une physique apprise par des NN peut rendre instable le modèle de climat dans lequel elle est branchée. La première partie de cette thèse est dédiée à l'étude de cette instabilité avec l'aide d'un modèle jouet, spécifiquement développée pour étudier ce problème. Un deuxième problème concerne la performance des physiques apprises, une fois celles-ci branchées dans un modèle de climat, notamment en terme de climatologie du modèle (e.g., biais de long-terme). Nous avons développé une méthode permettant d'ajuster les statistiques de long-terme d'une physique apprise. La méthode a été illustrée à l'aide de modèles jouets. Enfin, nous nous sommes intéressés à l'apprentissage d'un schéma de convection profonde à l'aide de NN. Le schéma appris a été implémenté avec succès dans le modèle de climat global développé au CNRM, ARPEGE-Climat, en remplacement du schéma physique. Nous avons réalisé plusieurs années de simulation sans constater de divergence du modèle. Les principales caractéristiques du climat moyen sont bien représentées. La physique apprise est interprétée en utilisant des outils d'analyse de sensibilité. Cette étude pose quelques bases en vue du développement de paramétrisations apprises à partir de données haute-résolution, dont l'utilisation pourrait améliorer la précision des modèles numériques du climat.

 
Résumé de la thèse en anglais:  

In a numerical climate model, the role of physical parameterizations is to represent the average effect of subgrid-scale processes (e.g., deep convection, turbulence) at model resolution. They are numerically efficient, but also the main source of uncertainty in climate models. In recent years, the use of Artificial Intelligence (AI) techniques, in particular neural networks (NN), has made it possible to develop a new kind of parameterization. As opposed to traditional physical parametrizations, developed using theoretical knowledge and observations, learned parametrizations are fitted to a dataset derived from a high-resolution simulation directly, in order to learn a more accurate representation of the different subgrid processes. The first results are promising, but major problems remain to be solved before their use in a climate model, as a replacement of traditional parameterizations. The aim of this thesis is to study some of these problems using toy models and through the learning of a part of the physical parameterization implemented in a climate model.

First of all, the use of NN-learned physics can make the climate model in which it is plugged unstable. The first part of this thesis is dedicated to the study of this instability on a toy model, specifically developed to investigate this problem. A second problem concerns the performance of the learned physics, once they are plugged into a climate model, especially in terms of model climatology (e.g., long-term bias). We have developed a method to adjust the long-term statistics of a learned physics. The method was illustrated using toy models. Finally, we focused on the learning of a deep convection scheme using NN. The learned scheme was successfully implemented in the global climate model developed at CNRM, ARPEGE-Climat, as a replacement of the physical scheme. We have performed several years of simulation without noticing any divergence of the model. The main characteristics of the mean climate are well represented. The learned physics is interpreted using sensitivity analysis tools. This study lays some groundwork for the development of learned parameterizations from high-resolution data, the use of which could improve the accuracy of numerical climate models.

Mots clés en français :Machine Learning, Modèle atmosphérique, Climat, Réseaux de neurones, Intelligence Artificielle, Modèles jouets,
Mots clés en anglais :   Machine Learning, Atmospherical Models, Climate, Artificial Intelligence, Neural Networks, Toy models,