Soutenance de thèse de Thi Thien Trang BUI

Modèle de régression pour des données non-Euclidiennes en grande dimension. Application à la classification de taxons en anatomie computationnelle.


Titre anglais : Regression model for non-Euclidean dimension data. Application to the classification of taxa in computational anatomy.
Ecole Doctorale : EDMITT - Ecole Doctorale Mathématiques, Informatique et Télécommunications de Toulouse
Spécialité : Mathématiques et Applications
Etablissement : Institut National des Sciences Appliquées de Toulouse
Unité de recherche : UMR 5219 - IMT : Institut de Mathématiques de Toulouse


Cette soutenance a eu lieu lundi 14 octobre 2019 à 10h30
Adresse de la soutenance : Institut de Mathématiques de Toulouse Université Paul Sabatier 118, route de Narbonne F-31062 Toulouse Cedex 9 - salle salle MIP (bâtiment 1R3, 1er étage)

devant le jury composé de :
Jean-Michel LOUBES   Professeur   Université Toulouse Paul Sabatier, Institut de Mathématiques de Toulouse   Directeur de thèse
André  MAS   Professeur   Equipe de Probabilités-Statistique. UMR CNRS 5149. Institut Montpelliérain Alexander Grothendieck   Rapporteur
Erwan LE PENNEC   Professeur   École polytechnique   Rapporteur
Béatrice LAURENT-BONNEAU   Professeur   INSA, Département de Génie Mathématique et Membre de l’Institut de Mathématiques de Toulouse   Examinateur
Thanh Mai PHAM NGOC   Maître de Conférences   Laboratoire de mathematiques Universite Paris Sud - Orsay. Equipe Probabilites et Statistiques   Examinateur
Magalie  FROMONT-RENOIR   Professeur   Département MIASHS et à la composante Rennes 2 de l'équipe de Statistique de l'IRMAR   Président
Laurent RISSER   Ingénieur de Recherche   Toulouse Mathematics Institute   Examinateur


Résumé de la thèse en français :  

Dans cette thèse, nous étudions le modèle de régression avec des entrées de distribution et les tests d'hypothèse pour la détection de signaux dans un modèle de régression. Nous visons à appliquer ces études aux données relatives aux émissions otoacoustiques évoquées transitoires (TEOAE) pour l'évolution de l l'auditif.
Dans la première partie, un nouveau modèle de régression de distribution pour les distributions de probabilité est introduit. Ce modèle est basé sur un cadre de régression RKHS (Reproducing Kernel Hilbert Space), dans lequel les noyaux universels sont construits à l'aide de distances de Wasserstein pour les distributions appartenant à W_2(Omega) et Omega est un sous-espace compact de R. Nous prouvons la propriété de noyau universel de tels noyaux et utilisons ce paramètre pour effectuer des régressions sur des fonctions. Différents modèles de régression sont d'abord comparés à celui proposé sur des données fonctionnelles simulées. Nous appliquons ensuite notre modèle de régression aux réponses de distribution des émissions otoascoutiques évoquées transitoires (TEOAE) et aux prédicteurs réels de l'âge. Cette partie est une collaboration avec Loubes, J-M., Risser, L. et Balaresque, P.
Dans la deuxième partie, en considérant un modèle de régression, nous abordons
la question du test de la nullité de la fonction de régression. Nous abordons la question
du test de la nullité de la fonction f. Nous proposons tout d’abord une nouvelle
procédure de test unique basée sur un noyau symétrique général et une estimation de
la variance des observations. Les valeurs critiques correspondantes sont construites
pour obtenir des tests de niveau non asymptotiques alpha. Nous introduisons ensuite
une procédure d’agrégation afin d’optimism le choix des parametres du noyau. Les
tests multiples vérifient les propriétés non asymptotiques et adaptatives au sens minimax de plusieurs classes d’alternatives classiques.

 
Résumé de la thèse en anglais:  

In this thesis, we study the regression model with distribution entries and the
testing hypothesis problem for signal detection in a regression model. We aim to
apply these studies to the transient evoked otoacoustic emissions (TEOAEs) data
in the evolution of the auditory.
In the first part, a new distribution regression model for probability distributions
is introduced. This model is based on a Reproducing Kernel Hilbert Space
(RKHS) regression framework, where universal kernels are built using Wasserstein
distances for distributions belonging to W2(Omega) and Omega is a compact subspace of R.
We prove the universal kernel property of such kernels and use this setting to perform
regressions on functions. Different regression models are first compared with
the proposed one on simulated functional data. We then apply our regression model
to transient evoked otoacoustic emission (TEOAE) distribution responses and real
predictors of the age. This part is joint work with Loubes, J-M., Risser, L. and
Balaresque, P.
In the second part, considering a regression model, we address the question of
testing the nullity of the regression function. The testing procedure is available
when the variance of the observations is unknown and does not depend on any prior
information on the alternative. We first propose a single testing procedure based on
a general symmetric kernel and an estimation of the variance of the observations.
The corresponding critical values are constructed to obtain non-asymptotic level-alpha
tests. We then introduce an aggregation procedure to avoid the difficult choice
of the kernel and of the parameters of the kernel. The multiple tests satisfy nonasymptotic
properties and are adaptive in the minimax sense over several classes of
regular alternatives.

Mots clés en français :Régression,Reproduction de l'espace de Hilbert du noyau,Distance de Wasserstein,Taux de séparation,Tests adaptatifs,Méthodes du noyau
Mots clés en anglais :   Regression model,Reproducing kernel Hilbert space,Wasserstein distance,Separation rates,Adaptive tests,Kernel methods