Soutenance de thèse de Timothée CORCHIA

Apport de l’apprentissage automatique pour l'intégration d'observations satellitaires dans un modèle global du système sol-plante


Titre anglais : Contribution of machine learning to the integration of satellite observations into a global model of the soil-plant system
Ecole Doctorale : SDU2E - Sciences de l'Univers, de l'Environnement et de l'Espace
Spécialité : Surfaces et interfaces continentales, Hydrologie
Etablissement : Université de Toulouse
Unité de recherche : UMR 3589 - CNRM - Centre National de Recherches Météorologiques
Direction de thèse : Jean-Christophe CALVET- Nemesio RODRIGUEZ-FERNANDEZ


Cette soutenance a eu lieu lundi 30 septembre 2024 à 14h00
Adresse de la soutenance : 42 av Gaspard Coriolis, CNRM, Météo-France, 31000 Toulouse - salle Salle Joël Noilhan

devant le jury composé de :
Jean-Christophe CALVET   IGPEF   Météo France   Directeur de thèse
Filipe AIRES   Directeur de recherche   CNRS Île-de-France Meudon   Rapporteur
Pierre-Louis FRISON   Maître de conférences   Université Gustave Eiffel   Rapporteur
Patricia DE ROSNAY   Senior Scientist   ECMWF   Examinateur
Jean-Pierre WIGNERON   Directeur de recherche   INRAE Nouvelle Aquitaine Bordeaux   Examinateur
Nemesio RODRIGUEZ-FERNANDEZ   Ingénieur de recherche   CNRS Occitanie Ouest   CoDirecteur de thèse
Philippe MAISONGRANDE   Ingénieur de recherche   CNES   Examinateur
Lionel JARLAN   Directeur de recherche   IRD Occitanie   Président


Résumé de la thèse en français :  

Dans un contexte marqué par le réchauffement climatique, où les événements météorologiques extrêmes comme les sécheresses deviennent plus fréquents et plus intenses, une modélisation améliorée de la réponse de la végétation au climat est cruciale. Pour surveiller l'impact de ces événements sur les surfaces terrestres, il est essentiel de prendre en compte diverses variables du système sol-plante, telles que l'humidité et la température du sol ainsi que l'indice de surface foliaire (LAI). Ces variables influent sur les échanges de carbone, d'eau et d'énergie à la surface du sol et peuvent être suivies soit grâce à la quantité sans précédent de données provenant de la flotte de satellites d'observation de la Terre, soit en utilisant des modèles des surfaces terrestres. Une approche efficace consiste à combiner ces différentes sources d'informations grâce à l'assimilation de données. Cette méthode prend en compte les incertitudes et produit une analyse des variables terrestres qui représente au mieux la réalité en intégrant des observations satellitaires dans un modèle. Le modèle doit être capable de simuler les observations à assimiler. Le système d'assimilation LDAS-Monde, développé par le Centre National de Recherches Météorologiques (CNRM), est un outil qui permet l’intégration dans le modèle des surfaces terrestres ISBA de Météo-France de produits satellitaires élaborés, tels que l'humidité superficielle du sol et de LAI. Les variables analysées sont la biomasse foliaire et l'humidité du sol de plusieurs couches de sol dans la zone racinaire. Les produits satellitaires élaborés utilisés jusqu'à présent proviennent de radiances observées par les instruments embarqués. La récupération de produits élaborés à partir des radiances peut engendrer une perte d'information et compliquer la quantification des incertitudes. Il est préférable d’assimiler directement des radiances ou des produits proches de l’observation initiale, mais cela nécessite le développement d'opérateurs d'observation pour établir un lien entre ces produits et les variables de sortie du modèle ISBA. L'objectif de ce travail de thèse est de développer des opérateurs d’observation dans ISBA pour assimiler des données micro-ondes. Deux types de données ont été considérés : (1) les coefficients de rétrodiffusion radar (sigma0) de l’instrument Advanced SCATterometer (ASCAT) sur MetOp, (2) les températures de brillance (Tb) du satellite Soil Moisture and Ocean Salinity (SMOS). Une première étape a consisté à élaborer des opérateurs d'observation basés sur des réseaux de neurones entraînés à simuler sigma0 et Tb à partir d’observations de LAI et de sorties du modèle ISBA. Une deuxième étape a consisté à intégrer ces opérateurs d’observation dans LDAS-Monde et à assimiler sigma0 et Tb. Une étude de cas sur le sud-ouest de la France a montré que l'assimilation des sigma0 dans ISBA améliore la simulation des variables de la végétation et l'humidité du sol, notamment dans les zones agricoles. Ce résultat a été généralisé à l’ensemble des zones agricoles à l’échelle mondiale, avec sigma0 et avec Tb. Les avantages et des inconvénients de l'assimilation des produits provenant d'ASCAT et de SMOS ont pu être déterminés. Enfin, il est démontré que l'apprentissage automatique peut également être utilisé pour explorer les relations entre les variables des surfaces terrestres. Des réseaux de neurones entraînés sur les données d'une station de mesure, Météopole-flux, permettent de simuler l'albédo, le LAI et d'autres variables. Une analyse de sensibilité des réseaux de neurones permet d'explorer l'impact de ces variables les unes sur les autres.

 
Résumé de la thèse en anglais:  

In a context marked by global warming, where extreme weather events such as droughts are becoming more frequent and more intense, improved modeling of the response of vegetation to climate is crucial. To monitor the impact of these events on land surfaces, it is essential to take into account various variables in the soil-plant system, such as soil moisture, soil temperature and leaf area index (LAI). These variables influence the exchange of carbon, water and energy at the soil surface, and can be monitored either using the unprecedented amount of data from the fleet of Earth observation satellites, or using land surface models. An effective approach is to combine these different sources of information using data assimilation. This method takes account of uncertainties and produces an analysis of surface variables that best represents reality by integrating satellite observations into a model. The model must be capable of simulating the observations to be assimilated. The LDAS-Monde assimilation system, developed by the Centre National de Recherches Météorologiques (CNRM), is a tool that allows the integration of processed satellite products such as surface soil moisture and LAI into Météo-France's ISBA land surface model. The analyzed variables are the leaf biomass and the soil moisture for several soil layers in the root zone. The processed satellite products used to date come from radiances observed by on-board instruments. Recovering products derived from radiances can lead to a loss of information and complicate the quantification of uncertainties. It is preferable to assimilate radiances or products close to the initial observation directly, but this requires the development of observation operators to establish a link between these products and the output variables of the ISBA model. The aim of this thesis work is to develop observation operators in ISBA to assimilate microwave data. Two types of data were considered: (1) radar backscatter coefficients (sigma0) from the Advanced SCATterometer (ASCAT) instrument on MetOp, and (2) brightness temperatures (Tb) from the Soil Moisture and Ocean Salinity (SMOS) satellite. The first step was to develop observation operators based on neural networks trained to simulate sigma0 and Tb from LAI observations and ISBA model outputs. A second stage involved integrating these observation operators into LDAS-Monde and assimilating sigma0 and Tb. A case study on south-western France showed that assimilating sigma0 in ISBA improves the simulation of vegetation variables and soil moisture, particularly in agricultural areas. This result was generalized to all agricultural areas worldwide, with sigma0 and with Tb. The advantages and disadvantages of assimilating products from ASCAT and SMOS were determined. Finally, it is shown that machine learning can also be used to explore the relationships between land surface variables. Neural Networks are trained on data from an in-situ station, Météopole-Flux, allowing the predictions of Albedo, LAI and other variables. A sensitivity analysis of the neural networks allows to explore the impact that these variables have on one another.

Mots clés en français :Assimilation de données, Apprentissage automatique, Télédétection, Modélisation,
Mots clés en anglais :   Data assimilation, Machine learning, Remote sensing, Modelling,