Thèse Intégration des Données Multi-Omiques et des Avatars Tumoraux pour Prédire la Réponse aux Traitements des Dmg Pédiatriques H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Paris-Saclay GS Life Sciences and Health École doctorale : Cancérologie : Biologie - Médecine - Santé Laboratoire de recherche : Oncogénèse, résistance et cibles thérapeutiques des cancers pédiatriques Direction de la thèse : Marie-Anne DEBILY Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-03T23:59:59 Les tumeurs cérébrales sont les tumeurs solides les plus fréquentes chez les enfants. Les gliomes pédiatriques de haut grade, et en particulier les gliomes diffus de la ligne médiane (DMG), ont un pronostic sombre. Ces tumeurs trouvent leur origine dans des altérations affectant le destin cellulaire au cours du développement cérébral. En effet, la mutation somatique initiatrice, qui entraine une substitution K27M dans les gènes codant pour l'histone H3, perturbe la différenciation cellulaire en inhibant le complexe PRC2 et bloque les cellules dans un état souche rappelant les OPC (oligodendrocyte progenitor cell)(1,2). En effet, il a été montré que la majorité des cellules de DMG présentent des caractéristiques souches.
Nos travaux menés ces dernières années ont permis d'affiner la classification des tumeurs cérébrales de l'OMS, grâce à la description moléculaire et clinique des principales entités basées sur les altérations du génome et du méthylome(3-5). Ils ont également conduit à la définition des gliomes diffus de la ligne médiane (DMG) K27 altérés, qui englobent à la fois des tumeurs localisées dans le tronc cérébral (60%) -sur lesquelles se sont concentrés nos travaux- mais aussi celles retrouvées dans le thalamus et la moelle épinière.
Ces données ont pu être générées grâce à nos relations étroites avec les cliniciens, qui nous ont donné un accès privilégié aux rares échantillons de patients disponibles, en raison de la rareté de ces tumeurs et de leur caractère inopérable.
En parallèle, nous avons développé au laboratoire des modèles cellulaires de DMG (6) qui nous ont permis de décrire les principales caractéristiques de cette maladie, comme l'hétérogénéité de leur radiorésistance(7) ou leurs capacités et modes d'invasion (8).
Dans le cadre de l'essai clinique BIOMEDE\_2.0, nous avons initié depuis 2 ans la collecte prospective de données cliniques et moléculaires (DNAseq, RNAseq) sur les tumeurs primaires, ainsi que les données in vitro sur les avatars de chaque patient, concernant la radiosensibilité, le risque de développement de métastases et la sensibilité à une quinzaine de drogues.
Malgré l'accélération des connaissances acquises sur les DMG au cours de la dernière décennie, peu d'augmentation de la survie globale a été observée chez les patients. Il est donc essentiel de poursuivre nos efforts, d'une part pour étendre nos connaissances sur chacune des entités moléculaires à des modalités jusqu'ici non explorées, telles que le protéome et le métabolome et d'autre part exploiter au mieux nos avatars afin d'améliorer la prise en charge des patients par le biais d'une médecine de précision.
De plus, cet ensemble de données multi-omiques et les modèles in vitro restent des ressources largement sous-exploitées. Nous proposons de les mobiliser dans une approche de jumeaux numériques (digital twins) combinant modélisation computationnelle et biologie expérimentale, qui sera réalisée en collaboration avec des personnes expertes de ces méthodes. Cette stratégie pourrait révolutionner l'identification de cibles thérapeutiques, en permettant une prédiction plus fine de l'efficacité des traitements ou des processus de résistances, et ainsi accélérer le développement de thérapies ciblées pour les enfants atteints de DMG.
Les tumeurs cérébrales sont les tumeurs solides les plus fréquentes chez les enfants. Les gliomes pédiatriques de haut grade, et en particulier les gliomes diffus de la ligne médiane (DMG), ont un pronostic sombre. Ces tumeurs trouvent leur origine dans des altérations affectant le destin cellulaire au cours du développement cérébral. En effet, la mutation somatique initiatrice, qui entraine une substitution K27M dans les gènes codant pour l'histone H3, perturbe la différenciation cellulaire en inhibant le complexe PRC2 et bloque les cellules dans un état souche rappelant les OPC (oligodendrocyte progenitor cell)(1,2). En effet, il a été montré que la majorité des cellules de DMG présentent des caractéristiques souches.
Nos travaux menés ces dernières années ont permis d'affiner la classification des tumeurs cérébrales de l'OMS, grâce à la description moléculaire et clinique des principales entités basées sur les altérations du génome et du méthylome(3-5). Ils ont également conduit à la définition des gliomes diffus de la ligne médiane (DMG) K27 altérés, qui englobent à la fois des tumeurs localisées dans le tronc cérébral (60%) -sur lesquelles se sont concentrés nos travaux- mais aussi celles retrouvées dans le thalamus et la moelle épinière.
Ces données ont pu être générées grâce à nos relations étroites avec les cliniciens, qui nous ont donné un accès privilégié aux rares échantillons de patients disponibles, en raison de la rareté de ces tumeurs et de leur caractère inopérable.
En parallèle, nous avons développé au laboratoire des modèles cellulaires de DMG (6) qui nous ont permis de décrire les principales caractéristiques de cette maladie, comme l'hétérogénéité de leur radiorésistance(7) ou leurs capacités et modes d'invasion (8).
Dans le cadre de l'essai clinique BIOMEDE\_2.0, nous avons initié depuis 2 ans la collecte prospective de données cliniques et moléculaires (DNAseq, RNAseq) sur les tumeurs primaires, ainsi que les données in vitro sur les avatars de chaque patient, concernant la radiosensibilité, le risque de développement de métastases et la sensibilité à une quinzaine de drogues
Malgré l'accélération des connaissances acquises sur les DMG au cours de la dernière décennie, peu d'augmentation de la survie globale a été observée chez les patients. Il est donc essentiel de poursuivre nos efforts, d'une part pour étendre nos connaissances sur chacune des entités moléculaires à des modalités jusqu'ici non explorées, telles que le protéome et le métabolome et d'autre part exploiter au mieux nos avatars afin d'améliorer la prise en charge des patients par le biais d'une médecine de précision.
De plus, cet ensemble de données multi-omiques et les modèles in vitro restent des ressources largement sous-exploitées. Nous proposons de les mobiliser dans une approche de jumeaux numériques (digital twins) combinant modélisation computationnelle et biologie expérimentale, qui sera réalisée en collaboration avec des personnes expertes de ces méthodes. Cette stratégie pourrait révolutionner l'identification de cibles thérapeutiques, en permettant une prédiction plus fine de l'efficacité des traitements ou des processus de résistances, et ainsi accélérer le développement de thérapies ciblées pour les enfants atteints de DMG.
Analyse individuelle :
Analyse d'expression différentielle des données de RNAseq (DESeq2) entre répondeurs et non-répondeurs (radiothérapie, everolimus), afin d'extraire des signatures moléculaires.
Établir une classification non supervisée basée sur les données de protéomique des DMG (clustering hiérarchique, k-means) et comparer à la classification existante obtenue par génomique, transcriptomique et analyse de la méthylation de l'ADN. Rechercher à l'échelle protéique de nouvelles cibles thérapeutiques pour chaque sous-groupe.
Corréler les profils moléculaires des tumeurs primaires aux données phénotypiques des avatars in vitro (sensibilité aux drogues, radiorésistance, invasion), par modèles de régression.
Intégration multi-omics :
Identifier les facteurs latents (capturant les axes de variation) partagés entre omiques via des méthodes d'analyse factorielle comme MOFA+ (Analyse factorielle multi-omique). Associer à chaque facteur des voies fonctionnelles, gène et/ou protéines y contribuant fortement.
Approche par graphe de connaissances (Knowledge Graph) : Structurer l'ensemble des données disponibles (génomique, protéomique, clinique etc.) sous forme d'un graphe de connaissances reliant ces entités par des relations typées.Construction de jumeau numérique :
Niveau 1 : Entraîner des modèles d'apprentissage supervisé (SVM, XGBoost...) sur les facteurs latents issus de l'intégration multi-omique pour prédire la réponse au traitement, évaluée à la fois par les données cliniques (BIOMEDE 1.0) et par les phénotypes des avatars (sensibilité aux drogues, radiorésistance, invasion).
Niveau 2 : En se basant sur le KG construit précédemment, appliquer des méthodes de plongement (embeddings) pour projeter chaque entité et relation dans un espace vectoriel commun de faible dimension (Knowledge Graph Embeddings). Exploiter ce plongement pour la prédiction de liens manquants (ex : association patient-drogue non testée). Ces drogues pourront être testées sur nos modèles vitro pour valider la prédiction.
Le profil recherché
Etudiant titulaire d'un M2 dans le domaine de la bioformatique avec des connaissances solides sur les approches de génomique.