Data Engineer Databricks - Gcp - Mission Longue Durée - Meudon 92 H/F - collectivite
- Indépendant
- collectivite
Les missions du poste
Information importante
Type de contrat: Freelance
Taux journalier : 600
Localisation : Paris, France
Date de démarrage :
2 à 4 semaines
Mode de travail : Hybride
Publié le : 30 juin 2026
Le besoin
Dans le cadre du renforcement d'une équipe Data au sein d'un grand groupe français, nous recherchons un Data Engineer expérimenté maîtrisant Databricks et Google Cloud Platform.
Le contexte
Vous intégrez une équipe Data pluridisciplinaire (Data Engineers, Architectes, DevOps, Chefs de projet) pour concevoir, développer et maintenir des solutions de traitement de données à fort volume. Vous intervenez sur l'ensemble du cycle de vie de la donnée : collecte, ingestion, transformation, stockage, mise en production et supervision des flux.
Vos missions
- Concevoir et développer des pipelines de données (batch et streaming) en Python, PySpark et Spark.
- Mettre en oeuvre et maintenir des architectures Data sur Databricks et GCP.
- Industrialiser les traitements via les bonnes pratiques CI/CD (Git, Databricks Bundles).
- Assurer l'orchestration et la gestion des workflows de données.
- Optimiser les performances des jobs et la consommation des ressources cloud (approche FinOps).
- Participer aux sujets de gouvernance, sécurité et Data Management.
- Assurer la supervision, le support et le maintien en conditions opérationnelles des applications Data.
- Produire et maintenir la documentation technique, contribuer à la montée en compétences de l'équipe.
Environnement technique
- Plateforme Data : Databricks, Delta Lake, Spark
- Langages : Python, PySpark, SQL
- Cloud : Google Cloud Platform (GCS, Pub/Sub, GKE, Alerting)
- DevOps : Git, CI/CD, Databricks Bundles
Profil recherché
Profil recherché
Vous justifiez d'une expérience significative en Data Engineering sur des environnements cloud et maîtrisez :
- Databricks à un niveau expert : administration, gestion des catalogues, Delta Lake, optimisation des traitements.
- PySpark / Spark / Python à un niveau confirmé pour le développement de pipelines.
- GCP à un niveau confirmé, notamment ses services orientés données.
- Les pratiques d'industrialisation et de déploiement continu.
Vous êtes autonome, rigoureux(se), à l'aise dans un environnement collaboratif et capable de transmettre vos connaissances.
Modalités
- Localisation : Meudon (92) - 3 jours sur site / 2 jours de télétravail
- Durée : mission de 9 mois renouvelables
- Démarrage : dès que possible
Compétences requises
- Gestion des données
- Python
- Batching
- Rigueur et méthode
- Création d'une base documentaire
- Git
- Google cloud platform
- SQL