Soutenance de thèse de Lassana COULIBALY

Apprentissage profond en télédétection pour la maîtrise des risques.


Titre anglais : Deep Learning in remote sensing for risk management.
Ecole Doctorale : AA - Aéronautique, Astronautique
Spécialité : Mathématiques et Applications
Etablissement : Institut National Polytechnique de Toulouse
Unité de recherche : EA 1905 - LGP - Laboratoire Génie de Production
Direction de thèse : Bernard KAMSU-FOGUEM- Fana TANGARA


Cette soutenance a eu lieu jeudi 17 décembre 2020 à 14h00
Adresse de la soutenance : LGP-ENIT-INPT 47 Avenue Azereix, BP 1629, 65016 Tarbes, France - salle Amphi B

devant le jury composé de :
Bernard KAMSU-FOGUEM   MCF   Institut National Polytechnique de Toulouse   Directeur de thèse
Mohamed LEMDANI   Professeur   Université de Lille 2, Faculté de pharmacie, Laboratoire de biomathématiques.   Rapporteur
Mamadou MBOUP   Professeur   Université de Reims Champagne-Ardenne   Rapporteur
Fana TANGARA   Professeur   Université des Sciences, des Techniques et des Technologies de Bamako (USTTB)   CoDirecteur de thèse
Sylvie LE HEGARAT-MASCLE   Professeur   POLYTECH PARIS-SACLAY   Président
Fabienne LOHOU   Maître de conférences   Université Toulouse III – PAUL SABATIER (UPS)   Examinateur
Jules SADEFO KAMDEM   Professeur   Université de Montpellier, Faculté d’Économie   Examinateur


Résumé de la thèse en français :  

Les changements climatiques entraînent régulièrement des phénomènes menaçant directement l’environnement et l’humanité. Dans ce contexte, la météorologie joue de plus en plus un rôle important dans la maîtrise de ces phénomènes. Le problème de fiabilisation des observations est essentiel pour le raisonnement numérique et la qualité de la simulation. En plus, l'interopérabilité est importante tant pour les entreprises que pour les services publics traitant des données et des modèles complexes. Dans les services météorologiques, la fiabilité est une exigence fondamentale. En particulier, les incertitudes sont dynamiques dans les observations de chaleur sensible et de chaleur latente. Il est donc important de rechercher des moyens permettant de contribuer à l’amélioration du modèle numérique de prévision. Nous proposons l'utilisation de méthodes d’apprentissage automatique susceptibles d'améliorer la production de connaissances pour l'interopérabilité. Cela peut appuyer la communication des modèles d'observation et numériques.
L’objectif de ce travail est de diagnostiquer les modèles numériques de prévision pour chercher les faiblesses de ces modèles dans la simulation des échanges entre la surface et l’atmosphère. Ces échanges sont quantifiés par les flux de chaleur sensible et de chaleur latente. Dans un premier temps, des processus gaussiens tenant compte des incertitudes sont utilisés pour modéliser les valeurs mesurées afin de rendre la base de données d'observation plus fiable. Cette modélisation est réalisée par un processus d'apprentissage approfondi qui inclut la régression en intégrant les connaissances sur le terrain. Ensuite la méthode d’extraction des règles d’association est choisie pour: mettre en évidence les faiblesses du modèle; effectuer des comparaisons entre les observations effectuées et les simulations réalisées par le modèle numérique. Enfin, un optimiseur a été défini à partir de quelques propriétés sur les transformations géométriques en mathématiques. Cet optimiseur permet d'effectuer un ajustement aux données simulées pour minimiser les erreurs de simulation.
Ces méthodes sont déployées sur une base de données contenant des variables mesurées (flux de chaleur sensible et latente, température et humidité de l'air, vitesse et direction du vent, pluie, rayonnement global, etc.) sur le site expérimental du Centre de Recherches Atmosphériques (CRA) qui est l'un des deux sites composant la Plateforme Pyrénéenne d'Observation de l'Atmosphère (P2OA) en France.
Les résultats obtenus et exprimés sous forme de règles d’association ont permis de mettre en évidence certaines faiblesses dans les modèles numériques : d’abord, la mise en évidence des différences (erreurs) entre les observations et les simulations ; ensuite l'analyse des règles générées a montré que les différences importantes sur le rayonnement global sont souvent concomitantes à des différences importantes sur les flux de chaleur sensible et latente. Ceci est souvent dû à des perturbations naturelles (par exemple, emplacement des nuages) qui impacte la qualité des observations/simulations des flux de chaleur sensible et chaleur latente. Les bénéfices escomptés sont relatifs à la génération de connaissances utiles à l’amélioration de la qualité de la simulation numérique des processus de surface.
En plus, l’optimiseur proposé a donné des résultats satisfaisants. La fonction coût est 100% optimale dans le cas des formes similaires et est 98% optimale dans le cas des formes avec présence de piques. Cet optimiseur peut être appliqué à toutes les autres variables pour encore mieux améliorer la fiabilité du modèle numérique de prévision.

 
Résumé de la thèse en anglais:  

Climate change regularly leads to phenomena that directly threaten the environment and humanity. In this context, meteorology is playing an increasingly important role in controlling these phenomena. The problem of the reliability of observations is essential for numerical reasoning and the quality of simulation. In addition, interoperability is important both for companies and for public services dealing with complex data and models. In meteorological services, reliability is a fundamental requirement. In particular, uncertainties are dynamic in sensible and latent heat observations. It is therefore important to look for ways to contribute to the improvement of the numerical prediction model. We propose the use of machine learning methods that can improve knowledge production for interoperability. This can support the communication of observation and numerical models.
The objective of this work is to diagnose numerical prediction models in order to look for the weaknesses of these models in the simulation of exchanges between the surface and the atmosphere. These exchanges are quantified by sensible and latent heat fluxes. Initially, Gaussian processes taking into account uncertainties are used to model the measured values in order to make the observation database more reliable. This modelling is carried out through a thorough learning process that includes regression by integrating knowledge from the field. Then the method for extracting the association rules is chosen in order to: highlight the weaknesses of the model; make comparisons between the observations made and the simulations made by the numerical model. Finally, an optimizer has been defined based on some properties on geometric transformations in mathematics. This optimizer allows to perform an adjustment to the simulated data in order to minimize simulation errors.
These methods are deployed on a database containing measured variables (sensible and latent heat flux, air temperature and humidity, wind speed and direction, rain, global radiation, etc.) on the experimental site of the Centre de Recherches Atmosphériques (CRA) which is one of the two sites making up the Pyrenean Platform for Observing the Atmosphere (P2OA) in France.
The results obtained and expressed in the form of association rules have made it possible to highlight certain weaknesses in the numerical models: firstly, the highlighting of differences (errors) between the observations and the simulations; secondly, the analysis of the rules generated showed that significant differences in global radiation are often concomitant with significant differences in sensible and latent heat fluxes. This is often due to natural perturbations (e.g. cloud location) that impact the quality of observations/simulations of sensible and latent heat fluxes. The expected benefits are related to the generation of knowledge useful for improving the quality of numerical simulation of surface processes.
In addition, the proposed optimizer gave satisfactory results. The cost function is 100% optimal in the case of similar shapes and is 98% optimal in the case of shapes with spikes. This optimizer can be applied to all other variables to further improve the reliability of the numerical prediction model.

Mots clés en français :Télédétection, Météorologie, risques, Apprentissage profond,
Mots clés en anglais :   remote sensing, Meteorology, Risk management, Deep Learning,