Les missions du poste

Établissement : CY Cergy Paris Université École doctorale : ED EM2PSI - Économie, Management, Mathématiques, Physique et Sciences Informatiques Laboratoire de recherche : ETIS - Equipes Traitement de l'Information et Systèmes Direction de la thèse : Sylvain ILOGA ORCID 0000000246037744 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-19T23:59:59 L'apprentissage des réseaux de neurones repose sur des algorithmes d'optimisation dont la dynamique interne demeure encore peu comprise et rarement modélisée de manière formelle. Au cours de son entraînement, un réseau de neurones traverse différents régimes dynamiques tels que l'apprentissage optimal, le sous-apprentissage, le sur-apprentissage ou encore la divergence. Les méthodes actuelles de suivi et d'arrêt précoce reposent principalement sur l'analyse de courbes de perte ou sur des heuristiques qui ne permettent pas une caractérisation probabiliste explicite de ces régimes.

Cette thèse propose de modéliser l'apprentissage d'un perceptron multicouche (MLP) comme un processus stochastique séquentiel à l'aide des modèles de Markov cachés (HMM). Des indicateurs statistiques extraits au cours de l'entraînement, notamment à partir des rapports signal-sur-bruit de la perte et des gradients, seront utilisés pour construire des modèles probabilistes capables d'identifier et de suivre les différentes phases d'apprentissage.

À partir de ces modèles, un descripteur vectoriel interprétable sera développé afin de résumer l'état dynamique du réseau et de permettre un pilotage adaptatif automatique de l'entraînement. Ce descripteur servira notamment à ajuster les hyperparamètres d'optimisation ou à déclencher un arrêt précoce intelligent lorsque les conditions de convergence sont jugées favorables.

L'approche sera appliquée à des systèmes de santé exploitant des données physiologiques acquises par radar FMCW. Les résultats attendus concernent le développement d'un cadre probabiliste innovant pour l'analyse des dynamiques d'apprentissage, l'amélioration de la robustesse des réseaux neuronaux et la conception de mécanismes d'optimisation plus interprétables et plus fiables pour les applications médicales. L'entraînement des réseaux neuronaux repose généralement sur des algorithmes de descente de gradient dont les trajectoires d'optimisation présentent des comportements complexes et difficilement interprétables. Les travaux récents ont montré l'existence de différentes phases dynamiques au cours de l'apprentissage, mais celles-ci sont principalement étudiées à travers des analyses géométriques ou statistiques globales. Les méthodes actuelles d'arrêt précoce et de réglage des hyperparamètres demeurent largement heuristiques et ne reposent pas sur une modélisation probabiliste explicite des états d'apprentissage.

Parallèlement, les modèles de Markov cachés ont démontré leur efficacité pour représenter des processus séquentiels complexes dans de nombreux domaines tels que la reconnaissance de la parole, la bio-informatique ou la finance. Leur utilisation pour caractériser les dynamiques internes de l'apprentissage des réseaux neuronaux reste cependant peu explorée.

Cette thèse s'inscrit à l'intersection de ces deux champs de recherche en proposant une représentation probabiliste des dynamiques d'apprentissage permettant d'améliorer l'interprétabilité, le pilotage adaptatif et la robustesse des systèmes d'intelligence artificielle. Développer un cadre probabiliste fondé sur les modèles de Markov cachés permettant de détecter, caractériser et exploiter les régimes dynamiques de l'apprentissage d'un réseau de neurones afin de piloter automatiquement son optimisation et d'améliorer ses performances. La démarche proposée comprend les étapes suivantes :

1-Collecte des statistiques d'apprentissage
2-Discrétisation des observations
3-Construction des chaînes de Markov
4-Entraînnement des HMM
5-Construction des descripteurs probabilistes
6-Pilotage adaptatif
7-Arrêt précoce intelligent
8-Validation expérimentale sur des données physiologiques acquises par radar FMCW.

Le profil recherché

Le candidat devra être titulaire d'un Master 2 (ou diplôme équivalent) en informatique, intelligence artificielle, mathématiques appliquées, traitement du signal ou discipline connexe.

Il devra posséder de solides connaissances en apprentissage automatique, réseaux de neurones artificiels, probabilités et statistiques. Une bonne maîtrise des méthodes d'optimisation utilisées en apprentissage profond (descente de gradient, optimisation stochastique, réglage d'hyperparamètres) sera particulièrement appréciée.

Des compétences en programmation scientifique, notamment en Python, ainsi qu'une expérience des bibliothèques d'apprentissage automatique et profond (TensorFlow, PyTorch, Scikit-learn ou équivalents) constitueront un atout important. Une connaissance des modèles probabilistes séquentiels, en particulier des modèles de Markov cachés, ou du traitement des séries temporelles sera également appréciée.

Le candidat devra faire preuve d'autonomie, de rigueur scientifique, d'esprit d'analyse et de capacités rédactionnelles lui permettant de conduire des travaux de recherche originaux et de valoriser ses résultats dans des publications scientifiques internationales. Une bonne maîtrise de l'anglais scientifique est souhaitée.

Compétences requises

  • Statistiques
  • Python
  • Programmation
  • Anglais
  • Autonomie
  • Traitement du signal
  • Machine learning
  • Compétences rédactionnelles
  • TensorFlow
  • Esprit d'analyse
Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Recherches similaires

L’emploi par métier dans le domaine Mode à Paris