Thèse Intégration de Modèles Épidémiologiques Évolutifs et d'Observation pour Reconstruire les Arbres de Transmission Développements Méthodologiques à Partir d'Une Étude de Cas sur la Fièvre Aphte H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Paris-Est Créteil École doctorale : Santé Publique Laboratoire de recherche : Epidémiologie des Maladies Infectieuses Multi-hôtes Direction de la thèse : Laetitia CANINI ORCID 0000000176431219 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-07-01T23:59:59 Ce projet de thèse vise à développer un cadre comparatif permettant de reconstruire des arbres de transmission à partir de données génomiques et épidémiologiques, en prenant la fièvre aphteuse comme cas d'étude. Les travaux porteront sur la simulation de foyers épidémiques réalistes à l'aide de modèles mécanistes intégrant les processus épidémiologiques, l'évolution génétique et les incertitudes liées aux observations. Des modèles évolutifs associés à des arbres de transmission seront développés afin de rendre compte de la dynamique au intra- et inter-hôtes, tout en garantissant la cohérence avec les données de terrain. Une évaluation comparative structurée sera ensuite réalisée afin d'analyser les outils existants de reconstitution des épidémies sur des ensembles de données simulés, en mesurant leur précision, leur robustesse et leur pertinence épidémiologique dans divers scénarios. Enfin, les approches les plus fiables seront appliquées aux ensembles de données sur la fièvre aphteuse provenant de pays où la maladie est endémique, tels que l'Égypte et l'Éthiopie. Parmi les résultats attendus figurent un simulateurs open source, un cadre comparatif pour les outils de reconstitution des épidémies, des lignes directrices méthodologiques pour la combinaison des données génomiques et épidémiologiques, ainsi que des connaissances empiriques sur la transmission de la fièvre aphteuse. Les résultats seront diffusés par le biais de publications évaluées par des pairs, de conférences et de collaborations avec des laboratoires de référence internationaux. La reconstitution d'arbres de transmission à partir de données épidémiologiques et génomiques est devenue une approche essentielle pour mieux comprendre la propagation des agents pathogènes (1). Contrairement aux arbres phylogénétiques, qui représentent des relations évolutives entre les séquences et permettent de déduire l'existence d'ancêtres hypothétiques, les arbres de transmission fournissent explicitement une représentation directe de qui a infecté qui et quand, au niveau des unités épidémiologiques, qu'il s'agisse d'individus ou d'exploitations agricoles, par exemple. Cela rend les arbres de transmission particulièrement utiles pour éclairer les stratégies de gestion des épidémies, en permettant aux décideurs politiques d'identifier et de hiérarchiser les meilleures cibles pour leurs interventions (2).
Si les analyses phylogénétiques fournissent des informations indirectes sur la dynamique de transmission, elles ne reflètent pas directement les événements d'infections. L'intégration des données génomiques dans les analyses épidémiologiques s'est révélée très prometteuse pour pallier les limites des données de surveillance classiques, en particulier lorsque la recherche des contacts ou les données spatio-temporelles sont incomplètes ou incertaines. Les données génomiques, grâce à l'accumulation de mutations le long des chaînes de transmission, portent les traces du processus de transmission sous-jacent. Pour exploiter correctement ces signaux, il faut recourir à des méthodes combinant la modélisation épidémiologique et la modélisation évolutive (1,3).
La fièvre aphteuse constitue un cas d'étude idéal pour développer et évaluer de telles méthodes. Le virus de la fièvre aphteuse (FMDV) évolue rapidement, générant suffisamment de variations génétiques sur de courtes périodes pour permettre de tirer des conclusions sur la transmission (4,5). La région 1D du génome du virus de la fièvre aphteuse (FMDV) codant pour une protéine de la capside externe (VP1) constitue la partie la plus variée du génome ; elle est donc fréquemment utilisée pour les analyses épidémiologiques moléculaires. Elle ne subit pas de réassortiment génétique, ce qui en fait un système plus simple du point de vue des mécanismes évolutifs, tout en restant complexe sur le plan épidémiologique. Le FMDV circule de manière endémique en Amérique du Sud, en Afrique et en Asie (6). En 2025, des foyers de fièvre aphteuse ont été signalés en Europe (en Allemagne, puis plus récemment en Hongrie et en Slovaquie) pour la première fois depuis le dernier foyer survenu en Bulgarie en 2011. Le virus de la fièvre aphteuse affecte la production animale des artiodactyles (bovins, ovins, caprins, porcins), entraînant des pertes de production, la mortalité des jeunes animaux et des coûts permanents liés à la vaccination contre la fièvre aphteuse et à la restriction des échanges d'animaux, ce qui représente un fardeau économique important (6). La fièvre aphteuse présente donc un intérêt pour le développement d'outils qui pourraient ensuite être étendus à d'autres maladies du bétail. Cette thèse utilisera la fièvre aphteuse comme système modèle pour développer, tester et appliquer de nouveaux cadres méthodologiques permettant de reconstituer des arbres de transmission.
L'objectif principal est de mettre au point un cadre méthodologique permettant de reconstruire et d'analyser les arbres de transmission à partir de données génomiques et épidémiologiques. Les objectifs spécifiques sont les suivants :
1. Concevoir des outils de simulation permettant de générer des arbres de transmission réalistes pour la fièvre aphteuse, en intégrant les principaux processus épidémiologiques, ainsi que des modèles d'observation tenant compte de la complexité et des incertitudes inhérentes aux programmes d'observation sur le terrain (axe 1).
2. Développer des modèles évolutifs s'appliquant à ces arbres de transmission, qui rendent compte des dynamiques évolutives intra- et inter-hôtes et les relier aux processus d'observation afin de garantir la cohérence entre les données simulées et les structures des données de terrain réelles (axe 2).
3. Évaluer les outils existants de reconstruction d'arbres de transmission à l'aide d'ensembles de données simulées générés par le cadre de simulation, en utilisant des critères et des indicateurs standardisés pour comparer les arbres inférés aux arbres de référence (axe 3).
4. Appliquer les approches les plus prometteuses à des ensembles de données réels provenant de zones d'endémie (Égypte et/ou Éthiopie) (axe 4).
La thèse s'articulera autour de quatre axes principaux :
Axe 1 : Simulation des arbres de transmission et des processus d'observation.
Conception et mise en oeuvre d'un cadre de simulation permettant de générer des épidémies simulées de fièvre aphteuse. Une revue exhaustive de la littérature sera menée afin d'identifier et d'évaluer les approches de modélisation existantes, garantissant ainsi que le développement du modèle s'appuie sur des connaissances établies. Le modèle inclura des processus clefs tels que la transmission intra-exploitation, la propagation inter-exploitations, les périodes d'incubation et de contagiosité, ainsi que les schémas de déclaration des données.
Axe 2 : Modèles évolutifs le long des arbres de transmission.
Développement de modèles d'évolution des séquences le long des arbres de transmission simulés. Les modèles initiaux supposeront une évolution simple selon l'horloge moléculaire stricte, puis seront progressivement enrichis par la diversité intra-hôte, les goulots d'étranglement de transmission et les taux de mutation hétérogènes. Un aspect central consistera à développer des modèles d'observation pour reproduire la manière dont les données de terrain sont collectées, en intégrant l'hétérogénéité de l'échantillonnage, la détection imparfaite, les retards de déclaration et les métadonnées manquantes ou incertaines. Ces modèles d'observation garantiront que les ensembles de données simulés reproduisent la complexité et l'incertitude présentes dans les données de surveillance du monde réel, permettant ainsi des évaluations plus réalistes des outils d'inférence. Les résultats simulés comprendront des arbres de transmission complets avec les métadonnées épidémiologiques associées et les séquences génétiques ayant évolué le long des arbres.
Axe 3 : Évaluation comparative des outils de reconstitution des épidémies.
Sélection d'outils existants représentatifs (par exemple TransPhylo, outbreaker2, SCOTTI, beastlier, phybreak...) et évaluation sur des ensembles de données simulées. Les indicateurs comprendront la précision topologique (mesures de distance entre les arbres), la précision temporelle et la pertinence épidémiologique (par exemple, identification correcte des super-propagateurs). Des analyses de sensibilité permettront d'étudier la robustesse face aux données manquantes, à un échantillonnage peu dense et à des informations temporelles bruitées.
Axe 4 : Application à des données réelles.
Les outils les plus performants seront appliqués à des données génomiques et épidémiologiques issues d'épidémies de fièvre aphteuse en Égypte et/ou en Éthiopie. Cela permettra d'obtenir des informations concrètes sur les chaînes de transmission de la fièvre aphteuse dans des contextes endémiques et de tester l'applicabilité de l'approche développée aux données de terrain.
Le profil recherché
Bac +5 Épidémiologie, Epirémiologie
* Compétences techniques recherchées
Expérience en modélisation épidémiologique et évolutive
Compétences en statistiques et maîtrise du langage de programmation R
Goût prononcé pour la biologie computationnelle
* Qualités personnelles
Être capable d'évoluer dans un environnement transdisciplinaire
Esprit d'équipe
Autonomie
Curiosité
Esprit de synthèse