Contexte
Nous recherchons un référent technique IA générative pour concevoir, industrialiser et fiabiliser des solutions en production (LLM, RAG, agents, chatbots) et le traitement de données non structurées (PDF, images). Le projet s’appuie sur des pratiques solides d’ingénierie logicielle et doit évoluer dans un environnement cloud / software engineering (GCP, Python).
Mission
En tant que Technical Lead IA / MLOps, vous aurez pour missions principales :
- Concevoir et déployer des architectures robustes pour LLM, RAG, agents et chatbots, en garantissant scalabilité, coût et latence.
- Développer et maintenir des pipelines de traitement documentaire et multimodal (parsing PDF, OCR, extraction de tables, prétraitement d’images, fusion texte+image).
- Industrialiser les modèles et services : CI/CD, conteneurisation (Docker/K8s), déploiement, suivi d’expériences, monitoring et observabilité (offline & online).
- Mettre en place des standards d’ingénierie : code propre, tests automatisés, revues d’architecture, templates projets et documentation vivante.
- Superviser la qualité des données et la conformité (GDPR), gérer secrets/IAM, et définir des mécanismes de mitigation des risques LLM (hallucinations, injection de prompts, fuite de données).
- Encadrer et former l’équipe : mentoring, diffusion des bonnes pratiques, participation aux revues de code et aux choix techniques.
- Mesurer et garantir les indicateurs opérationnels des chatbots/agents (latence, coût, taux de réponse, satisfaction utilisateur).
Profil candidat
- Profil & compétences requises
- Expérience : 6 ans en Data Science / MLOps / Machine Learning engineering, avec rôles de lead technique.
- Compétences techniques indispensables : IA générative (LLM, RAG, prompt engineering), Python avancé, MLOps/LLMOps (CI/CD, Docker, Kubernetes), conception d’APIs, data pipelines, SQL.
- Compétences fortes sur le traitement non structuré : parsing PDF, OCR, extraction de tables, vision (détection/segmentation), multimodalité.
- Expérience opérationnelle sur monitoring/observabilité, gestion du coût cloud (FinOps léger), et sécurité des modèles.
- Pratique des patterns d’orchestration (streaming, feature stores), intégration avec infra cloud (préférence GCP) et connaissances en outils d’expérimentation et suivi de modèles.
Soft skills et langues
- Soft skills : rigueur engineering, sens du delivery, capacité à documenter et à partager, leadership et pédagogie.
- Langues : anglais courant impératif.
Niveau
Expert – orienté production, gouvernance et industrialisation.