Contexte
La squad RAD-LAD (Reconnaissance Automatique et Lecture Automatique de Documents) renforce ses équipes afin d'accompagner l'évolution de ses solutions de traitement documentaire.
Dans un contexte d'industrialisation et de modernisation, la squad vise à élargir le périmètre des documents reconnus, à faire évoluer son architecture, et à intégrer des solutions d'IA avancées, notamment des LLM multi-cloud (AWS, GCP, Azure), afin d'accélérer et fiabiliser l'extraction de données.
Objectifs du poste
- Étendre la capacité de reconnaissance à de nouveaux types de documents clients ;
- Moderniser l'architecture de traitement documentaire existante ;
- Intégrer, tester et benchmarker des modèles LLM dans un environnement multi-cloud ;
- Accélérer l'automatisation de l'extraction des données et améliorer la fiabilité des traitements ;
- Monter en compétence et contribuer au développement via Spring IA et Python.
Vos missions
Au sein de la squad RAD-LAD, vous interviendrez sur l'ensemble de la chaîne de traitement documentaire :
Traitement documentaire & IA
- Développer et améliorer les mécanismes de RAD / LAD pour différents types de documents (structurés, semi-structurés, non structurés) ;
- Intégrer des LLM pour la compréhension, la classification et l'extraction intelligente de données ;
- Réaliser des benchmarks de modèles et de services IA (AWS, GCP, Azure) selon des critères de performance, coûts et sécurité ;
- Améliorer la qualité, la fiabilité et la traçabilité des extractions de données.
Architecture & industrialisation
- Participer à la modernisation de l'architecture de traitement documentaire ;
- Concevoir des pipelines robustes, scalables et sécurisés ;
- Travailler sur l'industrialisation des traitements (automatisation, monitoring, performance).
Développement
- Développer des composants en Python et / ou Spring IA pour l'intégration des solutions IA ;
- Contribuer aux bonnes pratiques de développement (tests, documentation, CI / CD) ;
- Collaborer étroitement avec les autres membres de la squad (tech, produit, data).
Profil recherché (expérimenté)
Compétences techniques indispensables
- Expertise LLM multi-cloud (AWS / GCP / Azure).
- Forte maîtrise OCR / Vision documentaire / Document AI.
- Excellente pratique Python & Java (idéalement Spring Boot / Spring IA).
Compétences supplémentaires appréciées
- Expérience en pipelines ML, MLOps, architecture microservices.
- Connaissance des frameworks de benchmarking LLM.
- Maîtrise des environnements CI / CD (GitLab, Jenkins).
- Connaissance d'Azure, GCP ou AWS pour les services d'IA générative.
Soft skills
- Autonomie et capacité à proposer des solutions innovantes.
- Rigueur, sens de la qualité et de la performance.
- Aisance en travail d'équipe agile.
- Curiosité technologique et capacité à monter rapidement en compétence.