Recherchez une offre d'emploi

Thèse Amélioration des Modèles de Diffusion et de Flot du Réglage Fin à l'Accélération H/F - 75

Description du poste

Institut Polytechnique de Paris École polytechnique
Paris - 75
CDD
Publié le 17 Mars 2026

Établissement : Institut Polytechnique de Paris École polytechnique
École doctorale : Mathématiques Hadamard
Laboratoire de recherche : CMAP - Centre de Mathématiques appliquées
Direction de la thèse : Alain DURMUS
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-06-01T23:59:59

Cette thèse porte sur le développement de nouveaux modèles génératifs pour
l'échantillonnage de lois complexes à partir de données, en statistique et en
apprentissage automatique. Les modèles de diffusion et de flot ont récemment
connu des succès remarquables, en particulier pour la génération de données de
grande dimension, mais ils restent souvent trop rigides pour traiter des
situations structurées, telles que les problèmes multimarginaux ou les cadres
où des contraintes dynamiques riches doivent être prises en compte. L'objectif
de cette thèse est de concevoir, analyser et tester de nouvelles méthodes
génératives capables d'exploiter plus finement la géométrie et la structure
temporelle des données.

Le projet s'organise autour de trois axes complémentaires. Le premier concerne
le réglage fin de modèles de diffusion par repondération exponentielle
itérative, avec pour objectif de développer des approximations d'ordre élevé
des scores et d'analyser conjointement les erreurs statistiques et de
discrétisation. Le deuxième axe porte sur la conception de modèles de flot
fondés sur l'accélération, en remplacement des approches classiques basées sur
un champ de vitesse, afin de mieux traiter les tâches génératives
multimarginales et de relier ces méthodes à des formulations de type
Vlasov-Fokker-Planck et aux splines en espace de Wasserstein. Enfin, le
troisième axe vise à développer des modèles génératifs basés sur les ponts de
Schrödinger, en étudiant notamment des extensions à coût courant général et au
transport non équilibré.

Être capable de synthétiser des échantillons d'une loi cible à laquelle
on n'a accès qu'au travers d'un jeu de données est une tâche fondamentale
en statistique et en apprentissage automatique. Ce problème intervient dans de
nombreux domaines applicatifs, notamment en physique statistique et en chimie
computationnelle \cite{carleo2019machine,noe2019boltzmann,brehmer2020madminer},
en médecine pour l'augmentation de données \cite{sandfort2019data}, en
météorologie \cite{ravuri2021skillful}, en apprentissage par renforcement
\cite{ho2016generative,houthooft2016curiosity}, pour le transfert de style
\cite{zhu2017unpaired}, ainsi que pour les problèmes inverses en imagerie
\cite{song2021solving}. En pratique, ce problème est abordé à l'aide de
modèles génératifs, c'est-à-dire de procédures capables de transformer
un échantillon issu d'une loi simple, par exemple gaussienne, en un
échantillon approximativement distribué selon la loi cible.

Plusieurs familles de modèles ont ainsi été proposées, parmi lesquelles les
modèles basés sur l'énergie \cite{lecun2006tutorial}, les modèles antagonistes
génératifs \cite{goodfellow2014generative} et les autoencodeurs variationnels
\cite{kingma2013auto}. Plus récemment, les modèles génératifs basés sur le
score et les modèles de diffusion se sont imposés comme une approche de premier
plan pour la synthèse de données de grande dimension, en particulier pour la
génération d'images
\cite{song2019generative,song2020score,ho2020denoising,dhariwal2021diffusion}.
En parallèle, les modèles de flot constituent une autre famille importante de modèles
génératifs. Leur principe consiste à apprendre un champ de vitesses dont le
flot transporte une loi simple vers la distribution des données
\cite{albergo2023building,lipman2023flow}.

Le principe des modèles de diffusion est le suivant. On considère d'abord une
dynamique de bruitage qui transforme progressivement la distribution cible en
une loi de référence facile à échantillonner, par exemple une loi gaussienne,
souvent obtenue via une diffusion de type Ornstein--Uhlenbeck. On cherche
ensuite à approximer la dynamique inverse en temps de ce processus. Les travaux
fondateurs sur les diffusions inversées montrent que cette dynamique fait
intervenir le gradient logarithmique de la densité marginale du processus,
appelé {score}, et qu'elle peut donc être approchée dès lors que ce score
est estimé avec suffisamment de précision
\cite{anderson1982reverse,haussmann1986time,song2021score}. Il est en outre
possible de caractériser ce score comme minimiseur d'une fonction de perte, ce
qui permet de l'apprendre à l'aide de réseaux de neurones, puis d'utiliser la
dynamique inverse correspondante afin de générer approximativement des
échantillons de la loi d'intérêt à partir d'une initialisation gaussienne. Ces
approches ont montré une efficacité remarquable en pratique, tout en
bénéficiant d'un cadre mathématique suffisamment souple pour permettre une
analyse théorique fine
\cite{song2021score,dhariwal2021diffusion,conforti2025kl,oko2023diffusion}.

Les modèles de flot reposent sur une philosophie voisine, mais remplacent la
dynamique de bruitage par une interpolation entre une loi de base facilement
échantillonnable et la distribution cible. Dans les approches modernes
d'interpolation stochastique, également connues sous le nom de \emph{flow
matching}, on construit ainsi un chemin de probabilités reliant une loi simple
à la loi cible, que l'on interprète comme la famille des marginales d'une
dynamique, ordinaire ou stochastique. L'objectif est alors d'apprendre le champ
de vitesses correspondant. Cette formulation permet d'unifier, dans un même
cadre, certaines méthodes de diffusion et des approches de transport
déterministe \cite{lipman2023flow,tong2024simulationfree,albergo2023building}.

Malgré ces succès, une question centrale demeure : comment concevoir de
{nouveaux modèles génératifs} capables d'exploiter plus finement la
structure du problème considéré ? En effet, dans de nombreuses applications,
les modèles classiques de diffusion ou de flot apparaissent trop rigides. C'est
notamment le cas lorsque l'on dispose d'informations à plusieurs temps, comme
dans les problèmes génératifs multimarginaux motivés par des applications en
génomique, ou lorsque l'on souhaite incorporer des contraintes dynamiques plus
riches que celles décrites par un simple champ de vitesses. Ces situations
suggèrent que l'enjeu n'est pas seulement d'améliorer des modèles existants,
mais aussi de développer de nouvelles classes de modèles, mieux adaptées à la
géométrie et à la structure temporelle des données.