Soutenance de thèse de Anthony ZULLO

Analyse de données fonctionnelles en télédétection hyperspectrale : Application à l’étude des paysages agri-forestiers


Titre anglais : Functional data analysis in hyperspectral remote sensing: Application to the study of agri-forest landscape
Ecole Doctorale : EDMITT - Ecole Doctorale Mathématiques, Informatique et Télécommunications de Toulouse
Spécialité : MATHEMATIQUES APPLIQUEES
Etablissement : Université de Toulouse
Unité de recherche : UMR 5219 - IMT : Institut de Mathématiques de Toulouse
Direction de thèse : Frédéric FERRATY
Co-encadrement de thèse : Mathieu FAUVEL


Cette soutenance a eu lieu lundi 19 septembre 2016 à 10h30
Adresse de la soutenance : Institut de Mathématiques de Toulouse Université Paul Sabatier 118 route de Narbonne 31400 Toulouse - salle Amphi Schwartz

devant le jury composé de :
Frédéric FERRATY   Professeur   Université Toulouse Jean Jaurès   Directeur de thèse
Mathieu FAUVEL   Maître de conférences   Ecole Nationale Supérieure d'Agronomie de Toulouse   CoDirecteur de thèse
Hervé CARDOT   Professeur   Institut de Mathématiques de Bourgogne   Rapporteur
Stéphane GIRARD   Directeur de recherche   Inria Grenoble Rhône-Alpes   Président


Résumé de la thèse en français :  

En imagerie hyperspectrale, chaque pixel est associé à un spectre provenant de
la réflectance observée en d points de mesure (i.e., longueurs d'onde). On se retrouve souvent dans une situation où la taille d'échantillon n est relativement faible devant le nombre d de variables. Ce phénomène appelé «fléau de la dimension» est bien connu en statistique multivariée. Plus d augmente devant n, plus les performances des méthodologies statistiques standard se dégradent. Les spectres de réflectance intègrent dans leur dimension spectrale un continuum qui leur confère une nature fonctionnelle. Un hyperspectre peut être modélisé par une fonction univariée de la longueur d'onde, sa représentation produisant une courbe. L'utilisation de méthodes fonctionnelles sur de telles données permet de prendre en compte des aspects fonctionnels tels
que la continuité, l'ordre des bandes spectrales, et de s'affranchir des fortes corrélations liées à la finesse de la grille de discrétisation. L'objectif principal de cette thèse est d'évaluer la pertinence de l'approche fonctionnelle dans le domaine de la télédétection hyperspectrale lors de
l'analyse statistique. Nous nous sommes focalisés sur le modèle non-paramétrique de régression fonctionnelle, couvrant la classification supervisée. Dans un premier temps, l'approche fonctionnelle a été comparée avec des méthodes multivariées usuellement employées en télédétection. L'approche fonctionnelle surpasse les méthodes multivariées dans des situations délicates où l'on dispose d'une petite taille d'échantillon d'apprentissage combinée à des classes relativement homogènes (c'est-à-dire difficiles à discriminer). Dans un second temps, une alternative à l'approche fonctionnelle pour s'affranchir du fléau de la dimension a été développée à l'aide d'un
modèle parcimonieux. Ce dernier permet, à travers la sélection d'un petit nombre de points de mesure, de réduire la dimensionnalité du problème tout en augmentant l'interprétabilité des résultats. Dans un troisième temps, nous nous sommes intéressés à la situation pratique quasi-systématique où l'on dispose de données fonctionnelles contaminées. Nous avons démontré que pour une taille d'échantillon fixée, plus la discrétisation est fine, meilleure sera la prédiction. Autrement dit, plus d est grand devant n, plus la méthode statistique fonctionnelle développée est performante.

 
Résumé de la thèse en anglais:  

In hyperspectral imaging, each pixel is associated with a spectrum derived from
observed reflectance in d measurement points (i.e., wavelengths). We are often facing a situation where the sample size n is relatively low compared to the number d of variables. This phenomenon called "curse of dimensionality" is well known in multivariate statistics. The more d increases with respect to n, the more standard statistical methodologies performances are degraded. Reflectance spectra incorporate in their spectral dimension a continuum that gives them a functional nature. A hyperspectrum can be modelised by an univariate function of wavelength and his representation produces a curve. The use of functional methods allows to take into account functional aspects such as continuity, spectral bands order, and to overcome strong correlations coming from the discretization grid fineness. The main aim of this thesis is to assess the relevance of the functional approach in the field of hyperspectral remote sensing for statistical analysis. We focused on the nonparametric fonctional regression model, including supervised classification. Firstly, the functional approach has been compared with multivariate methods usually involved in remote sensing. The functional approach outperforms multivariate methods in critical situations where one has a small training sample size combined with relatively homogeneous classes (that is to say, hard to discriminate). Secondly, an alternative to the functional approach to overcome the curse of dimensionality has been proposed using parsimonious models. This latter allows, through the selection of few measurement points, to reduce problem dimensionality while increasing results interpretability. Finally, we were interested in the almost
systematic situation where one has contaminated functional data. We proved that for a fixed sample size, the finer the discretization, the better the prediction. In other words, the larger d is compared to n, the more effective the functional statistical method is.

Mots clés en français :Télédétection hyperspectrale, données fonctionnelles, régression non-paramétrique, classification supervisée, signal bruité, méthodes parcimonieuses,
Mots clés en anglais :   Hyperspectral remote sensing, functional data, nonparametric regression, supervised classification, noised signal, parsimonious methods,