Les missions du poste

Redesign Group est un fournisseur mondial de solutions technologiques et de cybersécurité. Nous nous appuyons sur la pensée design, l'expertise interdépendante et les solutions technologiques émergentes pour aider les organisations à réussir leur transformation. La diversité de nos équipes internationales, nos partenariats avec des fabricants de technologies stratégiques et nos services de cybersécurité nous positionnent comme un partenaire d'affaires prêt à relever les défis de demain.Description du poste
Nous recrutons un ingénieur en science des données senior exceptionnel pour prendre en charge des fonctionnalités complètes basées sur LLM - et non un simple exécutant. Vous concevrez, déploierez et exploiterez des systèmes LLM robustes (RAG, agents, réglage fin, optimisation de l'inférence) qui respectent les SLA produit, réduisent les risques et génèrent un impact commercial mesurable. Nous recherchons des personnes possédant une solide expertise en apprentissage automatique et en ingénierie, une vision produit et un fort sens des responsabilités ; les outils ne sont qu'un moyen d'y parvenir.

Vos responsabilités :
Concevoir, implémenter et exploiter des systèmes LLM en production (pipelines de récupération, orchestration d'agents, flux de réglage fin) du prototype à la mise à l'échelle.
Traduire des problèmes produit complexes en objectifs d'apprentissage automatique mesurables et choisir des compromis pragmatiques (taille du modèle vs latence, stratégie de récupération vs précision, coût vs qualité).
Construire des pipelines d'évaluation (automatisés et humains), définir des KPI pour l'hallucination, la pertinence et l'équité, et surveiller la dérive et les performances en production.
Optimiser l'inférence et les déploiements (quantification, traitement par lots, mise à l'échelle automatique, stratégies de cache).

Exigences essentielles
Plus de 5 ans d'expérience en ingénierie ou recherche appliquée en apprentissage automatique/deep learning avec déploiements en production.
Maîtrise des modèles de type Transformer et des techniques d'entraînement/fin-tuning (notamment les méthodes économes en paramètres comme LoRa/adaptateurs).
Expérience pratique de la création de pipelines RAG et/ou de workflows d'agents, avec une attention particulière à la qualité de la recherche et à l'ingénierie du contexte.
Expérience en production de l'optimisation et du déploiement de l'inférence (compromis latence/coût, quantification, batching, autoscaling).
Solides compétences en ingénierie logicielle : code de production, tests, CI/CD, observabilité et documentation claire.
Capacité à communiquer efficacement et à expliquer les compromis aux équipes produit, infrastructure et métier.

Atouts
Expérience des bases de données vectorielles (Qdrant.) et des architectures d'embeddings.
Connaissance des moteurs d'inférence (vLLM, Triton, HF Inference) ou de la compression/distillation de modèles.
Expérience en matière de sécurité, de gouvernance ou d'audit de conformité en apprentissage automatique. Expérience en conception de frameworks d'évaluation humaine et en réalisation de tests A/B pour différentes versions de modèles.

Technologies utilisées : Python, écosystème PyTorch/Transformers, bases de données vectorielles (Qdrant ou autre), frameworks RAG (LangChain/LlamaIndex), outils d'inférence/de déploiement (vLLM, Triton, points de terminaison HF), conteneurisation (Docker), monitoring (Prometheus/Grafana, métriques de modèles personnalisées). Remarque : nous privilégions la maîtrise des concepts à la fidélité à une marque spécifique.

Le profil recherché

Experience: 5 An(s)

Compétences: Adapter les outils de traitement statistique de données,Définir et faire évoluer des procédés de traitement de l'information,Python Django

Langues: Anglais exigé,Français souhaité

Qualification: Cadre

Secteur d'activité: Conseil pour les affaires et autres conseils de gestion

Liste des qualités professionnelles:
Faire preuve de curiosité, d'ouverture d'esprit : Capacité à aller chercher au-delà de ce qui est donné à voir, à s'ouvrir sur la nouveauté et à investiguer pour comprendre et agir de façon appropriée.
Faire preuve de rigueur et de précision : Capacité à réaliser des tâches en suivant avec exactitude les règles, les procédures, les instructions qui ont été fournies, sans réaliser d'erreur et à transmettre clairement des informations. Se montrer ponctuel et respectueux des règles de savoir-vivre usuelles.
Faire preuve d'autonomie : Capacité à prendre en charge son activité sans devoir être encadré de façon continue (le cas échéant, à solliciter les autres acteurs de l'entreprise).

Compétences requises

  • Python
Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

L’emploi par métier dans le domaine Data et IA à Paris