Cette thèse étudie l’intégration de contraintes fonctionnelles dans des problèmes de régression, en se concentrant sur la monotonie et la parité statistique (indépendance des prédictions vis-à-vis de la variable d'appartenance à un groupe), à travers deux prismes complémentaires : les processus gaussiens contraints et l’analyse convexe.
Les premier et troisième chapitres étendent le cadre des processus gaussiens contraints. Le premier généralise les modèles existants à des structures block-additives, c'est-à-dire des sommes de fonctions définies sur des sous-ensembles disjoints des variables d'entrée. Ces structures permettent des applications à des problèmes de plus grande dimension tout en conservant une certaine flexibilité. Le troisième intègre la contrainte de parité statistique dans un processus gaussien et en dérive des prédicteurs permettant de contrôler le compromis entre précision et équité, ainsi que le degré de traitement différencié entre individus. Il établit des propriétés asymptotiques de ces prédicteurs.
Les deuxième et quatrième chapitres analysent les propriétés géométriques des espaces fonctionnels associés. Le deuxième établit, en particulier, la non-convexité de l'ensemble des fonctions satisfaisant la parité statistique, montrant qu'aucune fonction de perte convexe ne peut caractériser cette contrainte et excluant ainsi le cadre de l'optimisation convexe. Le quatrième exploite la structure de cône convexe des fonctions monotones pour reformuler la régression sous contrainte de monotonie via la dualité en analyse convexe. Plus précisément, la caractérisation du cône dual des fonctions monotones ouvre une nouvelle approche de ce problème. |
This thesis studies the integration of functional constraints in regression problems, focusing on monotonicity and statistical parity (independence of predictions from the group-membership variable), through two complementary perspectives: constrained Gaussian processes and convex analysis.
The first and third chapters extend the framework of constrained Gaussian processes. The first generalizes existing models to block-additive structures, that is, sums of functions defined on disjoint subsets of the input variables. These structures enable applications to higher-dimensional problems while retaining a degree of flexibility. The third incorporates the statistical parity constraint into a Gaussian process and derives predictors that allow control of the trade-off between accuracy and fairness, as well as the degree of differential treatment between individuals. It establishes asymptotic properties of these predictors.
The second and fourth chapters analyze the geometric properties of the associated functional spaces. The second, in particular, establishes the non-convexity of the set of functions satisfying statistical parity, showing that no convex loss function can characterize this constraint and thereby ruling out the convex optimization framework. The fourth exploits the convex cone structure of monotone functions to reformulate regression under monotonicity constraints via convex duality. More precisely, the characterization of the dual cone of monotone functions opens up a new approach to this problem. |