Recherchez une offre d'emploi

Thèse Intégration de la Fragmentomique et Modélisation Prédictive pour la Découverte de Biomarqueurs et leur Application Clinique en Biopsie Liquide H/F - 75

Description du poste

Établissement : Université Paris-Saclay GS Life Sciences and Health
École doctorale : Cancérologie : Biologie - Médecine - Santé
Laboratoire de recherche : Prédicteurs moléculaires et nouvelles cibles en oncologie
Direction de la thèse : Yohann LORIOT ORCID 0000000283381739
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-03T23:59:59

La biopsie liquide est devenue un outil essentiel en oncologie clinique, notamment grâce au profilage de l'ADN libre circulant plasmatique (cell-free DNA, cfDNA). La détection de l'ADN tumoral circulant (ctDNA) permet d'affiner le diagnostic, de guider les décisions thérapeutiques personnalisées et d'assurer un suivi dynamique de la maladie. Au-delà du simple profilage mutationnel, la fragmentomique - l'analyse des profils de fragmentation du cfDNA - capture des signaux liés à l'organisation nucléosomique et à l'accessibilité de la chromatine, offrant de nouvelles opportunités pour distinguer les mutations d'origine tumorale de celles liées à l'hématopoïèse clonale (CH) et pour inférer le tissu d'origine tumoral de manière non invasive.

Ce projet de thèse vise à développer et valider des modèles prédictifs multimodaux intégrant les données génomiques et fragmentomiques du cfDNA ainsi que les données cliniques afin d'améliorer la discrimination entre mutations tumorales et mutations liées à la CH, l'inférence du tissu d'origine, et la prédiction des programmes d'expression génique en oncologie de précision.

Dans un premier temps, le projet caractérisera le paysage clinicogénomique et fragmentomique de plus de 12,000 échantillons de cfDNA issus de patients inclus dans l'essai STING (NCT04932525), analysés par le test FoundationOne Liquid CDx ciblant 324 gènes liés au cancer. Les caractéristiques fragmentomiques seront extraites à l'aide d'un cadre computationnel développé en interne et analysées à travers différents types tumoraux afin d'identifier des signatures diagnostiques et pronostiques.

Dans un second temps, des modèles d'apprentissage automatique seront développés pour améliorer la classification des mutations tumorales versus CH et inférer le site tumoral primitif à partir des données de séquençage du cfDNA. Des approches d'intelligence artificielle explicable permettront d'identifier les caractéristiques prédictives clés et de soutenir la découverte de biomarqueurs.

Enfin, en s'appuyant sur des cohortes appariées cfDNA et ARN tumoral (RNA-seq) de plus de 100 patients issus des études MATCHR et STING UNLOCK, des modèles prédictifs seront développés pour inférer directement à partir du plasma les programmes d'expression génique tumoraux. Ces modèles seront validés et appliqués à des questions cliniquement pertinentes, telles que la classification de sous-types tumoraux et la prédiction de biomarqueurs actionnables, notamment l'expression de ERBB2.

En élargissant l'analyse du cfDNA au-delà de la détection mutationnelle vers une caractérisation tumorale intégrative, ce projet ambitionne d'améliorer l'interprétation biologique et l'utilité clinique de la biopsie liquide en oncologie personnalisée. Il permettra la génération de jeux de données multimodaux de grande envergure et la mise à disposition d'outils computationnels et applicatifs destinés aux cliniciens afin de favoriser la reproductibilité et la mise en oeuvre translationnelle.

Background and Unmet Need:
Liquid biopsy has become an integral component of clinical oncology, particularly through the profiling of plasma cell-free DNA (cfDNA). The detection of circulating tumor DNA (ctDNA) within cfDNA supports diagnosis, guides personalized treatment decisions, and enables dynamic disease monitoring.

Beyond mutation profiling, fragmentomics (the study of cfDNA fragmentation patterns) captures biological information related to nucleosomal positioning, chromatin accessibility, and transcriptional activity. These fragmentation signatures reflect epigenomic organization and offer opportunities to distinguish tumor-derived mutations from alterations arising from other sources, such as clonal hematopoiesis (CH), as well as to infer tissue of origin and transcriptional programs in non-invasive cancer diagnostics.

Despite recent advances, key challenges remain. Accurate discrimination between tumor-derived and CH-associated alterations continues to complicate cfDNA interpretation. Tissue-of-origin inference remains imperfect, and current approaches do not fully leverage fragmentomic signals to reconstruct functional tumor states, including gene expression programs, directly from plasma DNA. Overcoming these limitations requires integrative computational strategies combining genomic and fragmentomic features to improve biological interpretation and clinical utility.

This project aims to develop and validate multi-modal predictive models integrating cfDNA genomics and fragmentomics to improve tumor/CH discrimination, tissue-of-origin inference, and gene expression prediction in precision oncology.

Positioning of the PhD Project and Teams Expertise:
This PhD project is embedded within a multidisciplinary environment combining computational oncology, clinical cancer genomics, and translational liquid biopsy research.

The hosting teams bring complementary expertise in large scale clinico-genomic cancer cohort analysis (Y Loriot, E Bernard); clinical expertise (Y Loriot,); fragmentomic signal processing and feature engineering (E Bernard), and predictive modeling (E Bernard).

The project builds on institutional and well-characterized clinical datasets, providing access to annotated plasma sequencing data and associated clinical outcomes. This environment offers a unique opportunity to develop and validate multi-modal computational frameworks bridging methodological innovation and clinical application.

This project aims to develop and validate multi-modal predictive models integrating cell-free DNA genomics, fragmentomics, and clinical data to improve tumor/CH discrimination, tissue-of-origin inference, and gene expression prediction in precision oncology. To achieve this goal, the project is structured around three main objectives:

Objective 1: Delineate the clinicogenomic and fragmentomic landscape in a large pan-cancer liquid biopsy cohort.

Objective 2: Develop and validate machine learning models for tissue-of-origin inference and tumor classification from cell-free DNA sequencing data.

Objective 3: Infer gene expression programs from cell-free DNA through integrative computational modeling.

Objective 1: Delineate the clinicogenomic and fragmentomic landscape in a large pan-cancer liquid biopsy cohort
Task 1.1. Integrate and process clinicogenomic data from plasma cfDNA sequencing of more than 12,000 cancer patients enrolled in the STING trial (NCT04932525). This tumor-agnostic study uses the FoundationOne® Liquid CDx (F1LCDx) NGS assay to profile genomic alterations across 324 cancer-related genes.
Task 1.2. Extract fragmentomic features and mutational profiles from sequencing data using our in-house developed fRagmentomics software.
Task 1.3. Assess how fragmentomic signatures vary according to tumor type, stage, and histology, and evaluate their association with clinical outcomes to determine their diagnostic and prognostic value.

Objective 2: Develop and validate machine learning models for tissue-of-origin inference and tumor classification from cell-free DNA sequencing data
Task 2.1. Perform literature-informed feature engineering to evaluate diverse genomic, fragmentomic, and clinical input configurations, and optimize the data architecture for multimodal data integration and predictive modeling.
Task 2.2. Develop and validate predictive models to improve tumor/CH discrimination across cancer types. Validation cohorts are currently being explored from collaborations and literature.
Task 2.3. Develop explainable machine learning models to infer primary tumor site from cfDNA sequencing data and identify key predictive features contributing to tissue-of-origin classification.

Objective 3: Infer gene expression programs from cell-free DNA through integrative computational modeling
Task 3.1. Consolidate paired cfDNA and tumor RNA-seq datasets from more than 100 patients enrolled in the MATCHR and STING UNLOCK studies, and perform systematic exploration of fragmentomic and genomic features to identify informative signals associated with gene expression.
Task 3.2. Train and validate machine learning models to predict tissue gene expression from cfDNA features using paired liquid biopsy and tumor RNA-seq datasets.
Task 3.3. Evaluate clinical relevance by applying inferred expression profiles to tissue-of-origin prediction, tumor subtype classification, and clinically actionable questions (e.g., ERBB2 expression for trastuzumab-deruxtecan response).

Je postule sur HelloWork

Offres similaires

Biologiste H/F

  • SYNLAB

  • Paris - 75

  • CDI

  • 6 Mars 2026

Biologiste Laboratoire de Proximité Cddh - F 75 H/F

  • Candidats

  • Paris - 75

  • CDD

  • 6 Mars 2026

Ingénieur en Biologie Animale Auprès du Professeur Sonia Garel H/F

  • Collège de France

  • Paris - 75

  • CDD

  • 27 Février 2026


Recherches similaires

Déposez votre CV

Soyez visible par les entreprises qui recrutent à Paris.

J'y vais !

Chiffres clés de l'emploi à Paris

  • Taux de chomage : 9%
  • Population : 2165423
  • Médiane niveau de vie : 28570€/an
  • Demandeurs d'emploi : 205650
  • Actifs : 1177663
  • Nombres d'entreprises : 490838

Sources :


Un site du réseaux :

Logo HelloWork