Nous recherchons un.e Ingénieur Prompt IA & Spécialiste RAG SENIOR pour une mission de plusieurs années chez l'un de nos clients.
Missions principales :
- Piloter la stratégie d'optimisation de nos pipelines RAG : ingestion de données (chunking, OCR), indexation, sélection des embeddings, stratégies de récupération (reranking, recherche hybride) et choix des LLM adaptés.
- Concevoir, tester et optimiser des prompts système pour garantir des réponses précises, fiables et conformes.
- Développer des prompts multimodaux pour extraire des informations structurées de documents complexes (PDFs intégrant images, tableaux, etc.).
- Appliquer des techniques avancées de prompt engineering (few-shot, chain-of-thought) pour automatiser des tâches métier au-delà des systèmes conversationnels.
- Construire un cadre d'évaluation métier et piloter la création de jeux de données de référence (« golden datasets ») avec les experts métiers.
- Collaborer avec les équipes MLOps pour déployer et monitorer les composants logiciels en production.
- Assurer la gouvernance, la sécurité et la conformité des solutions dans un environnement réglementaire exigeant.
- Réaliser une veille technologique active sur l'écosystème RAG, LLM et multimodal pour innover en continu.
Environnement technique :
- Langage principal : Python avec frameworks ML / DL
- Orchestration de pipelines RAG via LangChain (ou équivalents)
- Bases de données vectorielles comme PGVector pour l'indexation sémantique
- Plateforme Cloud, notamment Google Cloud Platform (GCP)
- Techniques avancées de prompt engineering : few-shot, chain-of-thought, prompts multimodaux
- Outils OCR et méthodes de chunking pour ingestion et préparation des données
- Collaboration avec les équipes MLOps pour déploiement et monitoring des modèles
Localisation & Conditions :
- Poste basé à Brest
- Télétravail partiel possible (2-3 jours / semaine) après phase d'intégration
- Démarrage : ASAP
Processus de recrutement MOSICA :
- Entretien téléphonique ou visioconférence pour comprendre votre parcours et les missions proposées
- Entretien technique approfondi évaluant vos compétences et votre méthodologie
- Recrutement sur mission ou sur profil
- Expertise confirmée en Python et frameworks ML / DL. (4 ans minimum)
- Maîtrise avancée des techniques de prompt engineering (few-shot, chain-of-thought) pour modèles textuels et multimodaux.
- Expérience avec les frameworks d'orchestration RAG (LangChain, etc.) et bases de données vectorielles (ex : PGVector).
- Pratique avérée des environnements Cloud, idéalement GCP.
- Excellente communication et capacité de vulgarisation technique.
- Forte compréhension des enjeux business et sens critique.
- Autonomie, curiosité et passion pour l'apprentissage continu.