Les missions du poste

Établissement : Institut Polytechnique de Paris École nationale supérieure de techniques avancées École doctorale : Mathématiques Hadamard Laboratoire de recherche : UMA - Unité de Mathématiques Appliquées Direction de la thèse : Zacharie ALES ORCID 0000000346022638 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-04-30T23:59:59 Les récents progrès de l'apprentissage supervisé ont conduit à des modèles très performants tels que les réseaux de neurones profonds ou les forêts aléatoires. Cependant, ces modèles manquent souvent d'interprétabilité, qui est cependant essentielle lorsque les algorithmes sont utilisés dans des contextes sensibles, comme la santé, le recrutement ou la justice. De plus, la prise de conscience croissante des biais algorithmiques a fait de l'équité un enjeu central de l'intelligence artificielle. Garantir que les modèles prédictifs ne discriminent pas des individus ou des groupes en fonction d'attributs sensibles constitue aujourd'hui un défi à la fois scientifique et sociétal.Les arbres de décision représentent une méthode classique d'apprentissage supervisé, offrant un bon compromis entre performance prédictive et interprétabilité. Les algorithmes traditionnels, comme CART, reposent sur des heuristiques, tandis que des travaux plus récents ont proposé des formulations exactes du problème d'apprentissage d'arbres de décision sous forme de programmes linéaires en nombres entiers (ILP). Ces approches permettent d'obtenir des modèles optimaux et interprétables, mais restent limitées en termes de passage à l'échelle et ne prennent que rarement en compte des contraintes d'équité.

L'objectif de cette thèse est de concevoir des arbres de décision à la fois équitables et optimaux grâce à une approche de programmation mathématique. La flexibilité de ce cadre permet d'intégrer directement des contraintes d'équité variées (équité de groupe, équité individuelle, contrôle de l'impact disparate, etc.) dans le modèle, offrant ainsi un moyen explicite de concilier équité, interprétabilité et précision.

La thèse sera structurée en deux grandes parties. La première sera consacrée à l'étude et à l'intégration de l'équité dans les arbres de décision. Elle commencera par une revue bibliographique approfondie des notions d'équité et des principales stratégies de réduction des biais en apprentissage automatique, afin de comprendre comment les formaliser dans un cadre d'optimisation. Dans un second temps, les contraintes associées seront modélisées et intégrées dans la formulation ILP du problème d'arbre de décision. Enfin, une phase expérimentale permettra d'évaluer l'impact de ces contraintes sur le compromis entre performance, interprétabilité et équité, et d'identifier les formulations les plus efficaces.

La seconde partie visera à améliorer les performances de calcul des formulations proposées. Elle débutera par une étude polyédrale détaillée afin d'identifier des inégalités valides et de caractériser les facettes du polytope associé aux arbres de décision équitables. Ces résultats théoriques serviront à développer un algorithme de type branch-and-cut intégrant les contraintes d'équité et exploitant la structure polyédrale du problème pour accélérer la résolution. Enfin, des techniques de décomposition et de passage à l'échelle inspirées de travaux récents permettront d'appliquer ces méthodes à des ensembles de données de grande taille tout en conservant les garanties d'optimalité.

Cette recherche vise à combler l'écart entre équité, interprétabilité et optimisation mathématique, afin de produire des arbres de décision à la fois précis, transparents et équitables. Les résultats attendus incluent des avancées théoriques et algorithmiques contribuant à une meilleure compréhension et à une mise en oeuvre pratique de l'équité dans les modèles interprétables d'apprentissage automatique. Le stage aura lieu au sein de l'Unité de Mathématiques de l'ENSTA Paris Déterminer des méthodes permettant d'obtenir efficacement des arbres de classifications optimaux et équitables Etude bibliographique.
Modélisation des contraintes d'équité sous forme de contraintes linéaires.
Etude polyédrale.
Expérimentations.

Le profil recherché

Programmation mathématique
Machine learning

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Technicien IT H/F

  • Paris 16e - 75
  • CDI
  • GR Intérim & Recrutement
Publié le 16 Avril 2026
Je postule

Recherches similaires