Thèse Exploitation Explicite de la Dynamique Naturelle de Robots Humanoïdes pour la Génération de Comportements Stables Versatiles et à Faible Coût Énergétique H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire des Signaux et Systèmes Direction de la thèse : Pedro RODRIGUEZ-AYERBE ORCID 0000000174524155 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-13T23:59:59 Les robots humanoïdes approchent le cap d'industrialisation dans des domaines allant de l'industrie manufacturière à la santé. Parmi les défis majeurs pour leur déploiement à grande échelle figurent la sécurité de l'interaction physique humain-robot, la génération de comportements dynamiques stables, robustes et versatiles en environnement évolutif et non structuré, l'autonomie énergétique et décisionnelle sur une journée de travail, la motricité fine avec une maitrise fine des efforts d'interaction et la réduction des coûts.
Ce projet de thèse porte sur une nouvelle approche de génération de comportements dynamiques adaptatifs à faible coût énergétique tout en garantissant un comportement stable et sécurisé du robot, et ce, à partir d'une approche hybride combinant modèles et apprentissage. La thèse proposée consiste à formuler et mettre en oeuvre une approche hybride inédite alliant modèles dynamiques explicites et intelligence artificielle. Les modèles dynamiques explicites structurants permettront l'exploitation des dynamiques naturelles via la maîtrise du dosage des effets dynamiques intrinsèques (efforts actionneurs, effets liés aux forces de contact, à la gravité, effets inertiels), pour contrôler, via les articulations actives, certains points ou segments éventuellement non actionnés d'un robot dont on prouvera la convergence vers un comportement stable (position fixe ou mouvement régulier). Les méthodes de l'IA, issues des approches d'optimisation bio-inspirées et du deep learning, permettront d'une part l'exploration de mouvements difficilement paramétrables analytiquement, et d'autre part une modélisation synthétique représentative des incertitudes (simulées dans un premier temps) tout en conservant dans la mesure du possible un sens mécanique. Cette modélisation pourra en partie être obtenue par régression symbolique composée uniquement de fonctions différentiables. Cette propriété pourra ainsi être exploitée i/ pour générer des données synthétiques et entraîner le robot, éliminant ainsi le besoin de démonstrations réelles, ii/ pour optimiser les paramètres de la commande, et iii/ pour établir des garanties de stabilité à partir d'approximations encadrant ces fonctions différentiables. Une vérification formelle de la convergence, de la stabilité et de la robustesse de l'ensemble de la méthode de génération de mouvement et de sa commande devra alors conclure l'étude.
Dans la robotique humanoïde, trois grandes classes de méthodes sont développées depuis plus de trente ans pour la génération des mouvements : 1) les méthodes fondées sur des modèles élémentaires (simple, double ou multi-pendules, modèles à volant d'inertie de un à trois degrés de liberté) représentant la dynamique d'ensemble du système, ayant l'avantage d'être peu coûteuses en temps de calcul, physiquement interprétables et souvent couplées à l'élaboration de points spécifiques (Zero Moment Point, Foot Rotation Indicator, Capture point, Centroidal Dynamics) mais ne saisissant pas tous les mouvements internes du robot, ne permettant pas l'exploitation optimale des dynamiques et présentant l'inconvénient du manque de généricité relativement au robot et relativement à la tâche ; 2) les méthodes fondées sur l'intelligence artificielle (IA) au sens large (central pattern generators, réseaux de neurones, logique floue, apprentissage par renforcement, algorithmes génétiques) et plus récemment du deep learning offrent des solutions avec un effort de modélisation analytique très réduit, mais présentant des défauts majeurs comme la perte d'interprétabilité physique des résultats obtenus, l'absence de preuves formelles de convergence/stabilité/robustesse, la forte dépendance à de larges bases de données d'apprentissage, et la faible généralisabilité à d'autres architectures mécatroniques ; 3) les méthodes « corps complet » fondées sur la composition de primitives comportementales hiérarchisées par priorité incluant les contraintes (contacts, limites articulaires, limites des actionneurs générant les efforts, auto-collisions...), les tâches opérationnelles (manipulation, locomotion) et les postures - ces approches sont structurellement trop conservatives, limitant ainsi l'exploitation de la dynamique naturelle du système et augmentant ainsi le coût énergétique. Les travaux de thèse (36 mois temps plein) pourront s'articuler selon le planning suivant :
- To-To+9 (phase 1) : Un état de l'art sera établi et des premières validations expérimentales pourront être effectuées sur deux manipulations à CentraleSupélec : un pendule de Furuta et un pendulé inversé passif simple sur chariot, en présence de perturbations externes. La démarche proposée sera comparée aux méthodes classiques d'optimisation et de commande sur ces systèmes en termes d'énergie, de puissance mécanique, de taux d'accélération, de pics de couples ou de durée pour effectuer la tâche.
- To+9-To+18 (phase 2) : Selon l'avancement, une généralisation sera étudiée pour le maintien de l'équilibre, en simulation, d'un robot humanoïde (23 ddl actifs + 6 ddl passifs). Le robot debout en contact unilatéral avec le sol sera soumis à des forces de perturbations externes sur le tronc, avec des caractéristiques variables.
- To+18-To+30 (phase 3) : Selon l'avancement, une extension de l'approche sera réalisée pour la génération d'une marche stable exploitant la dynamique intrinsèque du système, sur le même robot que décrit précédemment.
- To+30-To+36 (phase 4) : La dernière partie de la thèse sera consacrée à la valorisation des derniers résultats obtenus, à la rédaction du manuscrit et à la préparation de la soutenance de thèse.
Le profil recherché
- Automatique - automatique avancée classique, analyse des systèmes dynamiques non linéaires
- Aisance en programmation pour l'apprentissage automatique
- Robotique - expérience en modélisation et simulation physique de systèmes robotiques polyarticulés
- Capacité à présenter les résultats techniques en français et en anglais, à l'écrit comme à l'oral