Recherchez une offre d'emploi

Thèse IA pour l'Exploration Interactive de Données au Service du Journalisme H/F - 75

Description du poste

Établissement : Institut Polytechnique de Paris École polytechnique
École doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris
Laboratoire de recherche : LIX - Laboratoire d'informatique
Direction de la thèse : Ioana MANOLESCU ORCID 0000000204252462
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-10T23:59:59Les sources de données numériques recèlent des informations inestimables. Pourtant, leur utilisation par les utilisateurs non techniques est entravée par le décalage
entre les modes d'expression et de consommation de l'information (langage naturel, texte, supports visuels) et les contraintes syntaxiques et techniques qui conditionnent l'accès à ces données dans le monde réel.
Cela est particulièrement vrai pour les journalistes et les chercheurs en sciences sociales, entre autres.

Le projet de thèse vise à exploiter et à proposer des méthodes d'IA permettant de révéler le potentiel des corpus de données structurées, semi-structurées et hétérogènes,
en fournissant des interfaces visuelles intuitives. Les données que nous considérons comprennent: des données tabulaires telles que des fichiers CSV; des données hiérarchiques telles que des documents JSON, des documents textuels ou PDF; et des ensembles de données statistiques multidimensionnels, comme ceux produits par les organismes statistiques nationaux et internationaux.

Notre objectif est de permettre aux utilisateurs non techniques d'interagir avec les données en langage naturel. Nous utiliserons des modèles de langage pour leur capacité inégalée à relier les questions des utilisateurs aux données les plus pertinentes, tout en ne renvoyant que les réponses provenant des sources de données attendues et fiables, accompagnées d'une traçabilité complète (d'où provient cette réponse ?) pour chaque résultat.
Nous visons à fournir un accès évolutif, précis et expressif aux statistiques issues d'une grande variété de sources, en nous appuyant sur un outil de vérification des faits actuellement utilisé par Radio France (qui cofinance ce projet). Notre projet fera progresser l'état de l'art en intelligence artificielle, mais aidera également les journalistes à analyser les données plus efficacement et plus rapidement. Ainsi, nous contribuons à maintenir une vision du monde partagée par les citoyens, et à préserver et renforcer la confiance dans la société.

Les humains communiquent par l'image, la parole et le texte. Parallèlement, des informations utiles et fiables se trouvent dans des bases de données de haute qualité, par exemple des données sur la santé, l'environnement, l'économie ou la société. L'inadéquation entre le format des données et les modes de consommation privilégiés des utilisateurs empêche les données d'atteindre leur plein potentiel.

L'objectif principal de ce projet est de rendre les données accessibles et intéressantes pour un public aussi large que possible, en leur donnant la parole :

- via des interfaces en langage naturel avec des résultats visuels ;

- grâce à des mécanismes d'exploration interactifs qui apprennent et s'adaptent aux intérêts et aux habitudes d'interaction des utilisateurs.

Pour maximiser l'impact sur la société, nous avons choisi de donner la parole aux journalistes, afin qu'ils puissent en tirer les informations dont ils ont besoin et les transmettre ensuite au public, une tâche pour laquelle ils sont spécialisés. Cela permet également de tirer parti de leur audience incomparable, notamment celle de notre partenaire Radio France, qui bénéficie d'une très forte audience.

L'évolution récente des plateformes de médias sociaux telles que
X, Facebook ou TikTok a démontré que la diffusion d'informations via les réseaux sociaux n'est pas sans risques, notamment lorsque les propriétaires des plateformes et leurs intérêts changent. Ces risques sont évités grâce à la collaboration avec un média comme Radio France (qui expérimente par ailleurs de nombreux formats, tels que les podcasts et les vidéos, et est présent sur la plupart des médias sociaux).

Je postule sur HelloWork

Offres similaires

Gestionnaire de Paie en Alternance H/F

  • Walter Learning

  • Paris 2e - 75

  • Alternance

  • 21 Mars 2026

Responsable de Magasin H/F

  • Promod

  • Paris 15e - 75

  • CDI

  • 21 Mars 2026

Analyste Financier H/F

  • Team.is

  • Paris 16e - 75

  • CDI

  • 21 Mars 2026

Déposez votre CV

Soyez visible par les entreprises qui recrutent à Paris.

J'y vais !

Chiffres clés de l'emploi à Paris

  • Taux de chomage : 9%
  • Population : 2165423
  • Médiane niveau de vie : 28570€/an
  • Demandeurs d'emploi : 205650
  • Actifs : 1177663
  • Nombres d'entreprises : 490838

Sources :


Un site du réseaux :

Logo HelloWork