Votre rôle se décline en 4 missions principales
Déploiement et maintenance des infrastructures IA :
- Concevoir, industrialiser et maintenir des environnements cloud pour la production, le déploiement et la scalabilité des modèles IA (Machine Learning et LLMs) sur GCP et Azure,
- Automatiser le pipeline CI / CD pour les déploiements de modèles IA (TensorFlow, PyTorch, Keras),
- Mettre en place des conteneurs (Docker) et orchestrateurs (Kubernetes) optimisés pour héberger les modèles IA,
- Garantir la disponibilité, la performance et la résilience des infrastructures d'hébergement des use cases IA.
Optimisation et monitoring des solutions IA :
- Superviser et monitorer en temps réel les performances des modèles IA via des outils tels que Nagios ou Cloud Monitoring,
- Implémenter des solutions de logging et tracing pour les infrastructures IA afin d'assurer une traçabilité et une qualité optimale,
- Participer à l'optimisation des modèles IA en production (fine-tuning, gestion des versions).
- Intégrer des outils d'observabilité spécialisés pour les LLMs, tels que Langfuse, afin de suivre et d'optimiser leurs performances.
Industrialisation et automatisation des flux IA :
- Orchestrer les flux de données et d'IA de manière automatisée via des solutions comme Opcon .
- Utiliser des outils DevOps (Terraform, Ansible, GitLab CI) pour industrialiser les workflows intégrant l'exposition des modèles IA / LLMs via des API,
- Gérer les environnements multi-cloud (GCP, Azure) avec des services comme Kubernetes Engine, Functions, App Services et plus encore,
- Implémenter des solutions émergentes pour le monitoring et l'automatisation IA (Flowize, N8N, Langfuse, etc.),
- Collaborer avec les Data Engineers IA pour intégrer les pipelines de données en amont avec les solutions IA déployées.
Veille technologique et innovation IA :
- Participer activement à la veille technologique autour des outils DevOps, des infrastructures cloud et des avancées IA,
- Effectuer des POC sur des nouvelles approches dans la gestion et l'automatisation des modèles IA pour maximiser leur efficacité
Expérience et diplôme
Expérience requise : minimum 2 ans sur un poste équivalant DATA et IA.
Diplôme : BAC +5 en école d'ingénieur / université spécialisée en Informatique et Gestion de la donnée et de la Data Science
Compétences requises
- Expertise Cloud : GCP (BigQuery, Cloud Functions, Vertex AI, Cloud Run), Azure (ML Studio, App Services, Functions). Des certifications GCP et / ou Azure sont un plus.
- DevOps et Automatisation : Terraform, Ansible, GitLab CI / CD, Bash, Python, Kubernetes, Docker.
- Machine Learning & Intelligence Artificielle : Bonne connaissance des frameworks (TensorFlow, PyTorch, Hugging Face).
- Monitoring et Observabilité : Prometheus, Grafana, ELK, solutions AI-specific comme Langfuse.
- Gestion Multi Cloud : Expérience avec des environnements multi-cloud et intégration fluide des services IA.
- Agilité : Maîtrise des méthodologies agiles (Scrum, Kanban).
- Bonnes pratiques IA : Expérience dans le déploiement scalable de LLMs et dans l'intégration IA / Business via des outils comme Langchain, Flowise.
Soft Skills recherchées
- Esprit analytique et rigueur, capacité à résoudre des problématiques complexes avec créativité,
- Proactivité, autonomie et force de proposition,
- Aisance pour travailler avec des équipes pluridisciplinaires (Data Engineers, Data Scientists, métiers),
- Excellentes capacités de communication et pédagogie pour vulgariser des concepts techniques.
Technologies maîtrisées souhaitables : Terraform, Kubernetes, Docker, Jenkins, Azure DevOps, GCP Vertex AI, Python, Ansible, Cloud Monitoring, PostgreSQL, SQL, Kafka, Langfuse, MLflow.