Recherchez une offre d'emploi

Thèse Criblage à Haut Débit et Apprentissage des Interactions Arn-Protéine H/F - 75

Description du poste

Établissement : Institut Polytechnique de Paris École polytechnique
École doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris
Laboratoire de recherche : BIOC - Laboratoire de Biologie Structurale de la Cellule
Direction de la thèse : Philippe NGHE ORCID 0000000336904610
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-15T23:59:59Aperçu du projet
Les interactions ARN-protéine sont au coeur de la biologie moderne, de la traduction et de la maturation des ARN à la réplication virale et aux condensats biomoléculaires. Pourtant, les modèles prédictifs de liaison ARN-protéine restent limités, et les approches actuelles d'IA sont encore peu performantes pour les complexes impliquant l'ARN, en raison du faible nombre de structures disponibles et de biais importants dans les bases de données. En s'appuyant sur notre cadre de design génératif d'ARN (Lambert et al., *Nature Communications*, 2025), cette thèse vise à mettre en place une plateforme expérimentale à haut débit pour apprendre les règles quantitatives d'interaction entre des bibliothèques d'ARN et des motifs protéiques ou peptidiques. La stratégie suivra un cycle itératif de type design-test-learn, dans lequel de grandes bibliothèques d'ARN seront synthétisées, testées pour leur capacité de liaison, séquencées, puis utilisées pour entraîner des modèles hybrides combinant physique et apprentissage automatique.

Objectifs de recherche
L'étudiant ou l'étudiante développera des essais fondés sur le séquençage afin de caractériser les interactions entre des bibliothèques diversifiées d'ARN, comprenant jusqu'à ~10^4-10^5 variants par lot, et des motifs protéiques ou peptidiques sélectionnés. Le projet visera à quantifier des paysages d'affinité, à identifier les déterminants structuraux de la liaison à l'aide de méthodes de sondage structural, et à explorer comment la diversité de séquence module les interactions fonctionnelles. Une attention particulière sera portée aux motifs minimaux de liaison et aux interactions multivalentes. Les jeux de données produits serviront à entraîner des modèles prédictifs et génératifs de reconnaissance ARN-protéine. Les règles d'interaction apprises seront ensuite exploitées pour concevoir des condensats ARN-protéine possédant des propriétés souhaitées.

Applications
Trois grands domaines d'application sont visés. D'abord, des interactions ARN-protéine programmables pourraient permettre d'organiser des nano-objets et des systèmes de délivrance, notamment des cargos d'ARN et des nanoparticules lipidiques, au moyen d'échafaudages d'ARN modulaires recrutant des composants protéiques définis. Ensuite, l'identification de règles minimales d'interaction ARN-peptide pourrait éclairer des scénarios liés à l'origine de la vie, dans lesquels de courts peptides et des ribozymes auraient pu coévoluer vers des systèmes primitifs de traduction. Enfin, des cartes quantitatives génotype-phénotype de la liaison ARN-protéine en environnement encombré pourraient améliorer notre compréhension des protéines cellulaires liant l'ARN et des condensats biomoléculaires, pour lesquels les prédicteurs actuels fondés sur la structure restent insuffisants.

RNA-protein interactions are central to many fundamental biological processes, from translation and post-transcriptional regulation to viral replication and the organization of biomolecular condensates. Despite their importance, the quantitative rules governing RNA-protein recognition remain poorly understood, especially for complexes involving structured RNAs, because of the limited amount of structural data available and the strong biases present in existing databases. In this context, the development of high-throughput experimental strategies coupled with machine-learning approaches is a key opportunity to map RNA-protein interaction landscapes, connect sequence, structure, and function, and build predictive models that can not only explain natural interactions but also guide the rational design of new RNA-protein systems with controlled properties.

Je postule sur HelloWork

Offres similaires

Chef Comptable H/F

  • Slash Intérim

  • Paris 16e - 75

  • CDI

  • 21 Mars 2026

Agent Commercial en Immobilier H/F

  • Efficity

  • Paris 15e - 75

  • Indépendant

  • 21 Mars 2026

Agent Commercial en Immobilier H/F

  • Efficity

  • Paris 17e - 75

  • Indépendant

  • 21 Mars 2026


Recherches similaires

Déposez votre CV

Soyez visible par les entreprises qui recrutent à Paris.

J'y vais !

Chiffres clés de l'emploi à Paris

  • Taux de chomage : 9%
  • Population : 2165423
  • Médiane niveau de vie : 28570€/an
  • Demandeurs d'emploi : 205650
  • Actifs : 1177663
  • Nombres d'entreprises : 490838

Sources :


Un site du réseaux :

Logo HelloWork