Soutenance de thèse de Adrien LAGRANGE

De l'apprentissage de représentation à la classification thématique - Application à l'analyse hiérarchique d'images hyperspectrales


Titre anglais : From representation learning to thematic classification - Application to hierarchical analysis of hyperspectral images
Ecole Doctorale : EDMITT - Ecole Doctorale Mathématiques, Informatique et Télécommunications de Toulouse
Spécialité : Informatique et Télécommunications
Etablissement : Institut National Polytechnique de Toulouse
Unité de recherche : UMR 5505 - IRIT : Institut de Recherche en Informatique de Toulouse
Direction de thèse : Nicolas DOBIGEON- Mathieu FAUVEL


Cette soutenance a eu lieu mercredi 06 novembre 2019 à 10h00
Adresse de la soutenance : ENSEEIHT 2 rue Camichel 31000 Toulouse - salle salle des thèses (C002)

devant le jury composé de :
Nicolas DOBIGEON   PR   Institut National Polytechnique de Toulouse   Directeur de thèse
Paul SCHEUNDERS   Professeur   University of Antwerp   Rapporteur
Jérome BOBIN   Senior researcher   CEA Saclay   Rapporteur
Charles BOUVEYRON   Professeur des Universités   Université Côte d'Azur   Président
Bertrand LE SAUX   Ingénieur de Recherche   ONERA   Examinateur
Mathieu FAUVEL   Chargé de Recherche   INRA Toulouse, CESBIO   CoDirecteur de thèse
Mauro DALLA MURA   Maître de Conférences   Grenoble-INP, GIPSA-lab   Examinateur
Émilie CHOUZENOUX   Maître de Conférences   University Paris-Est Marne-La-Vallée   Examinateur


Résumé de la thèse en français :  

Face à l'augmentation continue du nombre d'images de télédétection disponibles, de nombreuses méthodes ont été développées pour en extraire automatiquement de l'information. En particulier, les algorithmes de classification ont reçu une attention considérable. Dans le contexte de la classification supervisée, ils visent à inférer, à partir d'exemples labellisés par un expert, une règle de classification estimant la classe de pixels inconnus. Même si ces méthodes sont très efficaces, l'analyse produite demeure limitée puisque qu'on attribue une unique classe à chaque pixel.
Dans le cas des images hyperspectrales, les images contiennent une mesure très riche puisque chaque pixel est un échantillonnage fin du spectre de réflectance de la zone observée, en général dans le domaine visible et infrarouge avec plusieurs centaines de valeurs mesurées. Pour exploiter ces images, des méthodes d'interprétation alternatives ont été développées. Le démélange spectral est basé sur une modélisation physique du signal qui suppose que chaque pixel est issu d'un mélange d'un nombre réduit de spectres élémentaires. Chaque spectre élémentaire est caractéristique d'un matériau et le but d'une méthode de démélange est d'estimer les proportions de chaque matériau dans un pixel donné, regroupées dans ce qu'on appelle un vecteur d'abondances.
Bien que la classification et le démélange sont deux méthodes couramment utilisées, elles n'ont que très rarement été envisagées conjointement. Ce travail de thèse a pour but d'introduire le concept de démélange et classification conjoints.
La première approche envisagée vise à mettre en place un nouveau modèle bayésien permettant d'estimer simultanément les classes et les vecteurs d'abondances. Pour cela, nous proposons un algorithme de démélange effectuant une segmentation spatiale selon l'homogénéité des coefficients d'abondances des pixels. Dans l'approche proposée, le modèle de segmentation est complété de sorte à dépendre également des classes, supposées inconnues. La classification est donc intégrée au modèle et exploite la donnée supervisée et la segmentation, qui intègre l'information bas-niveau, obtenant ainsi un classifieur robuste aux erreurs sur les données externes. L'algorithme fournit alors une description hiérarchique de l'image en termes d'abondances, de segmentation spatiale et de classification thématique.
La deuxième approche considérée s'appuie sur la même description hiérarchique mais l'inférence est formulée comme un problème d'optimisation. La fonction de coût comprend alors trois termes principaux correspondant aux trois tâches considérées : le démélange, la segmentation et la classification. Le problème obtenu s'apparente à un problème de co-factorisation de matrices avec un terme de segmentation liant les activations des deux factorisations agissant respectivement comme modèle de démélange et de classification. Une solution de ce problème non-convexe et non-lisse est ensuite approchée à l'aide d'un algorithme de descente de gradient proximale alternée.
Le troisième travail réalisé vise à intégrer dans le processus de démélange une information spatiale complémentaire. L’originalité de la proposition réside dans le fait que l’information spatiale n’est pas introduite via un terme de régularisation spatiale mais comme un second terme d’attache aux données calculé à partir d’une image panchromatique de la scène. Ce modèle complète en particulier les deux approches précédentes en mettant en place une méthode de démélange permettant une bonne estimation des spectres élémentaires en capitalisant sur la méthode de co-factorisation développée précédemment.

 
Résumé de la thèse en anglais:  

Numerous frameworks have been developed in order to analyze the increasing amount of remote sensing images. Among those methods, supervised classification has received considerable attention leading to the development of state-of-the-art classification methods. These methods aim at inferring the class of each pixel of the image given a specific class nomenclature. Within a supervised framework, a set of pixels is assumed to be annotated by an expert and subsequently used as examples through a learning process. Thanks to extensive research efforts of the community, classification methods have become very efficient. Nevertheless, the resulting classification remains a high-level interpretation of the scene since it only gives a single class to summarize all information in a given pixel.
In the specific context of hyperspectral imaging, acquired images capture a very rich signal since each pixel is a sampling of the reflectance spectrum of the corresponding area, typically in the visible and near-infrared spectral domains with hundreds of measurements. To fully exploit the available information, it is interesting to resort to alternative methods of interpretation such as representation learning methods, namely spectral unmixing in the case of hyperspectral images. Spectral unmixing relies on a physic-based modeling which assumes that a given pixel, i.e., a given measured spectrum, is the result of the combination of a reduced number of elementary spectra, each specific to a given material. The aim of unmixing methods is to retrieve the proportion of each material present in a given pixel. The resulting abundance maps provide the spatial distribution of the material in the observed scene.
Even though classification and spectral unmixing are two widely-used techniques, they have been scarcely considered jointly. This Ph.D. thesis aims at introducing new unified frameworks for the joint classification and spectral unmixing of hyperspectral images.
The first considered approach introduces a hierarchical Bayesian model to jointly perform spectral unmixing and supervised classification. To do so, the spectral unmixing tasks performs a spatial clustering to identify areas with homogeneous abundance vectors. The clustering model is designed such that it also depends on the classification labels. Classification thus becomes part of the hierarchical model and benefits from the supervised data and the clustering bringing the low-level information. The proposed model offers a hierarchical description of the data and additionally provides a classifier which is robust to labeling error in the training set.
The second proposed model considers a different approach by resorting to a cofactorization model. The spectral unmixing task and the classification task are both modeled as factorization matrix problems. A coupling term is then introduced to enable a joint estimation. Similarly to the previous approach, the coupling term is interpreted as a clustering task performed on the abundance vectors. Finally, the cluster attribution vectors are used as feature vectors for the classification task. The overall non-smooth, non-convex optimization problem is solved using a proximal alternating linearized minimization algorithm ensuring convergence to a critical point.
The last part of this work intends to enrich the spectral unmixing model by adding spatial information. In the previous models, the spatial information is only exploited through regularization terms. Conversely, a cofactorization model with two data fitting terms is considered. The first is a spectral mixture model based on the hyperspectral image accounting for the spectral information. The second one is a dictionary learning model based on an image containing spatial features computed from the panchromatic image of the same area. The coupling term is again a clustering task identifying groups of pixels with similar spectral and spatial signature.

Mots clés en français :analyse d'image, classification, démélange spectral, télédétection, imagerie hyperspectrale,
Mots clés en anglais :   image analysis, classification, spectral unmixing, remote sensing, hyperspectral imaging,