Recherchez une offre d'emploi
Data Scientist H/F - 75
Description du poste
- Caisse des Dépôts et Consignations (CDC)
-
Paris - 75
-
Fonctionnaire
-
Publié le 10 Mars 2026
Créée en 2018, la Banque des Territoires est un des cinq métiers de la Caisse des Dépôts. Elle rassemble dans une même structure les expertises internes à destination des territoires. Porte d'entrée client unique, elle propose des solutions sur mesure de conseil et de financement en prêts et en investissement pour répondre aux besoins des collectivités locales, des organismes de logement social, entreprises publiques locales et des professions juridiques. Elle s'adresse à tous les territoires, depuis les zones rurales jusqu'aux métropoles, avec l'ambition de lutter contre les inégalités sociales et les fractures territoriales.
La Banque des Territoires est également une marque déployée dans les 16 directions régionales et les 35 implantations territoriales de la Caisse des Dépôts afin d'être mieux identifiée auprès de ses clients et au plus près d'eux.
Au sein de la Banque des Territoires, la Direction des Prêts gère entre 30 et 40 milliards de flux de financement par an. Elle est composée de trois départements : Développement (DPHD), Gestion et comptabilité (DPHG), Accompagnement du réseau (DPHA), et de programmes (transition écologique : eau, édurenov ; politique de la ville...).
Le département du Développement s'appuie sur 6 entités, 3 d'entre elles intervenant sur des segments de marchés (logement locatif social & réaménagements, habitat spécifique, et secteur public local et projets complexes), les 3 autres étant des fonctions transverses (data, études et pilotageAu sein de la Direction des prêts de la Banque des Territoires, vous rejoignez l'équipe DPHD80 Data Etudes et Pilotage en tant que Data Scientist. Votre mission principale consistera à concevoir et mettre en oeuvre des outils de traitement automatique du langage (NLP) pour analyser, classifier et extraire automatiquement des informations à partir des documents textuels liés aux dossiers de prêt.
Vous pourrez être amené(e), ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.
Les missions à réaliser seront notamment les suivantes :
1. Traitement automatique du langage et text mining
Mise en oeuvre d'algorithmes de text mining et de traitement automatique du langage sur les documents de la Direction des prêts (pièces justificatives, documents de dossier, etc.).
Développement de chaînes de traitement pour :
L'extraction automatique d'informations (ex. NER, extraction de champs structurés),
La classification de documents (typologie des pièces...),
L'amélioration de la qualité des données (normalisation...).
Utilisation de différentes approches statistiques et de modèles de machine learning, y compris modèles les plus récents de réseaux de neurones, afin de constituer automatiquement des bases de données à partir des documents textuels et d'en fiabiliser le contenu.
Vous participerez à la conception et au développement de services basés sur ces technologies, à destination des Clients et équipes de la Direction des Prêts.
2. Industrialisation et bonnes pratiques de développement
Vous participerez à l'industrialisation et à la bonne mise en oeuvre des outils de Data Science utilisés à DPHD80 :
Gestion et structuration du code, développement de packages internes, rédaction de documentation.
Contribution à la mise en place des bonnes pratiques (typage, qualité du code, versionnage Git/Bitbucket, etc...).
Utilisation de Docker pour emballer et déployer les applications de data science.
3. Analyse / collecte / enrichissement de données
Exploitation de bases de données, notamment en open data, afin d'enrichir les informations issues des documents (bases SQL, fichiers Parquet...).
Récupération d'informations complémentaires par web scraping, lorsque pertinent.
4. Utilisation de LLM et développement de ChatBot
Utilisation de différents LLM (Large Language Models) pour faciliter l'analyse des documents sous forme de textes ou autres (tableaux, graphiques, etc.) et constituer des bases d'entrainement de plus petits modèles.
Participation au développement d'un ChatBot pour répondre à des questions sur les documents, les procédures ou les données disponibles et produire de courts documents (notes thématiques, mails destinés aux clients, etc.)
Contribution à la veille sur les nouvelles méthodes et outils en NLP et IA générative.
Compétences requises
- Python
Offres similaires
Data Scientist H/F
-
Visa
-
Paris - 75
-
CDI
-
10 Mars 2026
Data Scientist H/F
-
Unedic
-
Paris 12e - 75
-
CDI
-
5 Mars 2026
Data Scientist Junior H/F
-
Clostera
-
Paris 9e - 75
-
CDI
-
10 Mars 2026
Déposez votre CV
Soyez visible par les entreprises qui recrutent à Paris.
Chiffres clés de l'emploi à Paris
- Taux de chomage : 9%
- Population : 2165423
- Médiane niveau de vie : 28570€/an
- Demandeurs d'emploi : 205650
- Actifs : 1177663
- Nombres d'entreprises : 490838
Sources :
Un site du réseaux :