Sre Kubernetes - Plateforme IA Générative H/F - collectivite
- Indépendant
- collectivite
Les missions du poste
Information importante
Type de contrat: Freelance
Taux journalier : 560
Localisation : Paris, France
Date de démarrage :
Urgent
Mode de travail : Hybride
Publié le : 12 juin 2026
Le besoin
Contexte avec Theodo
Nous accompagnons un grand groupe bancaire français dans la construction et l'exploitation de plateformes mutualisées d'IA générative utilisées par plusieurs entités du groupe.
Ces plateformes fournissent des services de type LLM-as-a-Service (LLMaaS) et Retrieval-Augmented Generation (RAG) à destination des équipes internes. Elles constituent aujourd'hui un socle stratégique pour l'industrialisation des usages IA au sein du groupe.
Une trentaine de personnes interviennent sur ces sujets (plateforme, infrastructure, support, produit et opérations).
Dans ce contexte, nous recherchons un profil SRE / Platform Engineer afin de contribuer à la fiabilité, à l'exploitation et à l'amélioration continue de ces plateformes.
Rôle attendu
Vous rejoindrez une équipe technique en charge de garantir la disponibilité, la stabilité et la qualité de service des plateformes IA.
Vous interviendrez à la fois sur les problématiques d'exploitation, d'investigation, d'observabilité et d'amélioration de la plateforme.
Vos responsabilités principales :
- Investiguer et résoudre les incidents de production
- Réaliser les analyses de root cause et proposer des actions correctives
- Participer à l'amélioration de la fiabilité et de l'observabilité de la plateforme
- Accompagner les utilisateurs internes sur les sujets techniques complexes
- Contribuer à la documentation et au partage des bonnes pratiques
- Participer au roulement d'astreinte de l'équipe
Profil recherché
Profil recherché
Expérience
- 3 à 6 ans d'expérience sur des sujets SRE, DevOps ou Platform Engineering
- Expérience significative de Kubernetes en environnement de production
- Bonne compréhension des problématiques de disponibilité, supervision et gestion d'incidents
- Capacité à évoluer en autonomie dans un environnement exigeant
Stack & compétences clés
- Kubernetes / OpenShift
- ArgoCD
- Helm
- Prometheus / Grafana
- GitOps
- ServiceNow
MUST HAVE
- Solide maîtrise Kubernetes
- Expérience de l'exploitation de plateformes en production
- Capacité à conduire des analyses de root cause
- Bon relationnel et communication claire
- Autonomie et sens du service
Nice to have
- Connaissance des plateformes IA générative
- LiteLLM
- vLLM
- Expérience d'environnements bancaires ou fortement réglementés
Modalités pratiques
- Durée : 8 mois minimum
- Charge : Temps plein
- Démarrage : ASAP
- Localisation : Hybride (1 jour/semaine à Montreuil)
- TJM : 560€
- Processus :
- Préqualification Theodo
- Entretien technique Theodo
Compétences requises
- Intelligence artificielle
- Autonomie
- Kubernetes
- Grafana
- Actions correctives
- Prometheus