Recherchez une offre d'emploi
Thèse Analyse Intégrative des Données Génomiques de la Cohorte Coblance de Cancers de Vessie Identification de Signatures Mutationnelles Associées aux Expositions Professionnelles et Environnement H/F - 75
Description du poste
- Université Paris-Saclay GS Life Sciences and Health
-
Paris - 75
-
CDD
-
Publié le 17 Mars 2026
Établissement : Université Paris-Saclay GS Life Sciences and Health
École doctorale : Cancérologie : Biologie - Médecine - Santé
Laboratoire de recherche : Biologie Cellulaire et Cancer
Direction de la thèse : Isabelle BERNARD-PIERROT ORCID 0000000289675092
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-03-31T23:59:59
Le cancer de la vessie est fréquent dans les pays occidentaux. Un des facteurs de risque majeur de ces cancers est le tabagisme et ce n'est que très récemment que nous avons identifié des caractéristiques moléculaires des tumeurs associées au tabagisme dont une signature mutationnelle de l'ADN, SBS4-like dans les cohortes TCGA et UROMOL . Nous avons en outre pu identifier des expositions professionnelles à des carcinogènes tels que les amines aromatiques, les hydrocarbures aromatiques polycycliques, l'arsenic, les pesticides ou le perchloroéthylène. Les liens entre processus mutagènes tumoraux et expositions individuelles restent insuffisamment explorés dans les cohortes TCGA et UROMOL caractérisée pour les profils mutationnels. En outre, nous avons mis en évidence une hétérogénéité intra-tumorale associées à un mauvais pronostic sous-chimiothérapie.
Ce projet s'appuie sur la cohorte prospective française COBLAnCE (1 800 patients), dont 1 240 disposent de données de Whole-Exome Sequencing (WES) et 96 de Whole-Genome Sequencing (WGS). Les variants somatiques (substitutions, indels), les profils d'altérations du nombre de copies ainsi que les données bulk RNA-seq et transcriptomiques spatiales sont déjà disponibles. Des données détaillées d'exposition professionnelle et environnementale sont renseignées pour chaque patient.
L'objectif principal est d'identifier et de caractériser les signatures mutationnelles associées aux expositions carcinogènes et d'analyser leur contribution à l'hétérogénéité intra-tumorale et au pronostic. Une première étape reposera sur une approche de mutation fitting supervisée afin de valider la présence d'une signature de type SBS4-like associée au tabagisme, récemment mise en évidence dans les cohortes TCGA et UROMOL, et d'évaluer son association avec le sous-type moléculaire Luminal Unstable (LumU) et avec des paramètres de pronostic (récidive, progression, décès).
Dans un second temps, des extractions de novo de signatures mutationnelles seront réalisées, incluant les signatures de substitutions nucléotidiques simples (SBS) et d'indels (ID), afin d'identifier sans a priori d'éventuelles signatures spécifiques aux expositions professionnelles ou environnementales. Les contributions relatives des signatures seront intégrées aux données épidémiologiques individuelles à l'aide de modèles statistiques multivariés.
Enfin, l'intégration des profils d'instabilité génomique (copy number, ploïdie) aux données de transcriptomique spatiale et de single-nucleus RNA-seq permettra d'explorer l'organisation clonale et sous-clonale, et de distinguer les mécanismes d'évolution clonale de ceux liés à la plasticité cellulaire.
Ce projet, à l'interface de la génomique du cancer, de la bioinformatique et de l'épidémiologie
moléculaire, ambitionne de relier expositions carcinogènes, processus mutagènes et hétérogénéité tumorale, avec des retombées potentielles en stratification pronostique et en compréhension des mécanismes de plasticité tumorale.
Le cancer de la vessie est l'un des cancers les plus fréquents dans le monde, avec plus de 500 000 nouveaux cas annuels et une forte prédominance masculine. On distingue deux entités très différentes: les tumeurs non infiltrantes le muscle vésical (TVNIM), représentant environ 75 % des cas, caractérisées par un fort taux de récidive, et les tumeurs infiltrant le muscle(TVIM), associées à un pronostic défavorable. Le tabagisme constitue le principal facteur de risque, impliqué dans près de la moitié des cas, aux côtés d'expositions professionnelles ou environnementales à divers carcinogènes vésicaux.
Les études génomiques de grandes cohortes telles que TCGA (TVIM) et UROMOL (TVNIM) ont permis de mieux caractériser les altérations moléculaires et les sous-types tumoraux. Si des signatures mutationnelles de substitutions nucléotidiques simples (SBS) et d'indels (ID) du référentiel COSMIC ont été décrites, leur exploitation en lien avec des données individuelles épidémiologiques d'exposition à des carcinogènes reste limitée. Les analyses ont principalement reposé sur des approches supervisées, sans réelle intégration épidémiologique. Notre étude précédente sur les données TCGA a été la première à appliquer une déconvolution de novo dans le cancer de la vessie, mettant en évidence une signature de type SBS4-like associée au tabagisme (Meng et al., Genes & Diseases 2026). Toutefois, cette analyse était limitée aux signatures SBS et n'intégrait pas les signatures d'indels ni des données détaillées d'exposition professionnelle. Nos travaux avaient également pu montrer l'importance de la signature APOBEC et son association à une sur-représentation de la mutation S249C de FGFR3 comparée aux autres mutations activatrices ainsi que l'existence de mutation fréquentes mais passagères induite par APOBEC ( Shi et al, Eur Uro 2019 et Shi et al, Genome med 2021). Concernant l'hétérogénéité intra-tumorale, nous avons montré par des analyses transcriptomiques dans plusieurs zones pour chaque tumeur (bulk) et confirmées en transcriptomique spatiale que les tumeurs comportant plusieurs types moléculaires associés (tumeurs mixtes) étaient de moins bon pronostic sous traitement par chimiothérapie (Groeneveld et al. Ann Oncol 2025). Ces résultats démontrent que l'hétérogénéité intra-tumorale est une caractéristique importante de la biologie des cancers de la vessie, impliquée dans les mécanismes de résistance aux traitements.
Le projet s'appuie sur la cohorte prospective française COBLAnCE (Lebret et al., BMJ Open 2023), comprenant 1 800 patients recrutés entre 2012 et 2018, dont 1 240 disposent de données de séquençage exomique apparié (ADN tumoral 200X, ADN constitutionnel 30X). Des informations précises sur les expositions professionnelles (amines aromatiques, PAHs, arsenic, pesticides, perchloroéthylène) ainsi que sur le tabagisme sont disponibles pour chaque patient. Cette cohorte constitue l'une des plus importantes ressources combinant données génomiques et données d'exposition dans le cancer de la vessie, offrant une opportunité unique d'analyser de manière intégrative les signatures mutationnelles (SBS et ID), l'instabilité génomique et leur lien avec les facteurs carcinogènes environnementaux et professionnels. Notre équipe est en charge des données pathologiques et moléculaires de COBLAnCE, et les données bulk transcriptomic et les sous-types moléculaires et histologiques sont déjà disponibles. Les données épidémiologiques et cliniques sous la responsabilité de Simone Benhamou, épidémiologiste coordonnant la cohorte, sont aussi disponibles dans l'équipe Inserm ONCOSTAT de Stéphane Michiels (U1018).
Ce projet vise à décrypter les empreintes mutationnelles associées aux expositions professionnelles et environnementales dans les cancers de la vessie et à comprendre leur contribution à l'hétérogénéité intra-tumorale et au pronostic. Dans un premier temps, une approche de mutation fitting supervisée sera mise en oeuvre afin de valider la présence et la contribution d'une signature de type SBS4-like que nous avons récemment mise en évidence dans les cohortes TCGA (MIBC) et UROMOL (NMIBC) (Meng et al., 2026), et d'évaluer son association avec le sous-type moléculaire Luminal Unstable (LumU) ainsi qu'avec des indicateurs de mauvais pronostic (récidive, progression, décès). Dans un second temps, des extractions de novo de signatures mutationnelles - incluant les signatures de substitutions nucléotidiques simples (SBS) et sur les signatures d'indels (ID), permettant une caractérisation plus complète des processus mutagènes impliqués- seront réalisées à partir des données WES/WGS afin d'identifier, sans a priori, d'éventuelles signatures spécifiques aux expositions professionnelles ou environnementales, puis comparées aux signatures de référence (COSMIC). Les contributions relatives des signatures seront intégrées aux données d'exposition détaillées pour établir des associations entre facteurs environnementaux et altérations génomiques. Enfin, l'analyse des profils d'instabilité génomique et leur intégration aux données de transcriptomique spatiale et de single-nucleus RNA seq permettront d'explorer l'organisation clonale et les dynamiques cellulaires associées à ces processus mutagènes, afin de proposer une compréhension intégrative reliant expositions, signatures mutationnelles et hétérogénéité intra-tumorale dans les cancers de la vessie.
1. Données disponibles et prétraitement
Les données de séquençage Whole-Exome Sequencing (WES) et Whole-Genome Sequencing (WGS) sont déjà disponibles au sein de la cohorte pour 1200 et 96 patients respectivement. Les étapes de prétraitement bioinformatique ont été réalisées, incluant l'alignement, l'appel de variants somatiques et les contrôles qualité. Les données ont été générées à partir des paires ADN tumoral (200X) / ADN constitutionnel (30X). Les profils d'altérations du nombre de copies (copy number alterations) ont également été dérivés, et une analyse de la ploïdie tumorale est actuellement en cours afin de compléter la caractérisation de l'instabilité génomique.
Les données détaillées d'exposition sont disponibles pour chaque patient, incluant l'exposition professionnelle à cinq classes majeures de carcinogènes vésicaux - amines aromatiques (AA), hydrocarbures aromatiques polycycliques (PAHs), arsenic (As), pesticides et perchloroéthylène - ainsi que d'autres facteurs de risque tels que l'âge et le tabagisme. Cette richesse de données permet une approche intégrative en épidémiologie moléculaire.
2. Analyse des signatures mutationnelles (SBS et ID)
Une approche de mutation fitting supervisée sera d'abord mise en oeuvre afin de quantifier la contribution des signatures connues du référentiel COSMIC dans chaque tumeur. Une attention particulière sera portée à la validation d'une signature de type SBS4-like associée au tabagisme, que nous avons récemment identifiée dans les cohortes TCGA (MIBC) et UROMOL (NMIBC) (Meng et al., 2025). Les signatures d'indels (ID) seront analysées conjointement afin de caractériser de manière exhaustive les processus mutagènes.
Dans un second temps, des extractions de novo seront réalisées par factorisation matricielle non négative (NMF) afin d'identifier, sans a priori, des signatures spécifiques à la cohorte. Différentes méthodes existantes seront comparées. La robustesse et la stabilité des signatures seront évaluées par rééchantillonnage (bootstrap) et comparées aux signatures de référence via des mesures de similarité (cosine similarity).
3. Analyses statistiques et intégration multi-omique
Les contributions relatives des signatures mutationnelles seront intégrées aux données d'exposition professionnelle et aux autres facteurs de risque à l'aide de modèles statistiques multivariés, ajustés sur les covariables cliniques pertinentes. Les associations avec les sous-types moléculaires et les paramètres pronostiques seront évaluées, notamment à l'aide de modèles de survie.
Enfin, les profils d'instabilité génomique (copy number, ploïdie) seront intégrés aux données de transcriptomique spatiale et de single-nucleus RNA seq afin d'explorer l'organisation clonale et sous-clonale et les dynamiques cellulaires tumorales. Nous chercherons à déterminer la part de l'hétérogénéité phénotypique qui relève de l'évolution clonale et la part liée à la plasticité cellulaire. Cette approche multi-omique permettra de relier expositions carcinogènes, processus mutagènes et hétérogénéité intra-tumorale dans une perspective mécanistique et translationnelle.
Offres similaires
Biologiste H/F
-
SYNLAB
-
Paris - 75
-
CDI
-
6 Mars 2026
Biologiste Laboratoire de Proximité Cddh - F 75 H/F
-
Candidats
-
Paris - 75
-
CDD
-
6 Mars 2026
Ingénieur en Biologie Animale Auprès du Professeur Sonia Garel H/F
-
Collège de France
-
Paris - 75
-
CDD
-
27 Février 2026
Déposez votre CV
Soyez visible par les entreprises qui recrutent à Paris.
Chiffres clés de l'emploi à Paris
- Taux de chomage : 9%
- Population : 2165423
- Médiane niveau de vie : 28570€/an
- Demandeurs d'emploi : 205650
- Actifs : 1177663
- Nombres d'entreprises : 490838
Sources :
Un site du réseaux :