Intégré à l'équipe du Data & IA Hub, vous rejoindrez une jeune équipe composée de Data Scientists, Data Engineers et ML Engineers.
Vous travaillerez sur trois missions principales :
- En interne, vous participerez à la définition de la stratégie optimale de données pour Socotec (structuration, processus, open data, achats de données externes)
- En mode projet, vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement. Vous contribuerez aux 4 axes principaux du groupe :
- Inspection 4.0 : développements d'algorithmes de computer vision et NLP en soutien aux experts métiers sur le terrain
- Assistants SOCOTEC : développement d'agents personnalisés pour les services du groupe (RAG, text-to-SQL,)
- IA+X pour des nouveaux services : développement de techniques d'hybridation entre physique et IA (jumeau numérique, PINN)
- Extraction d'information à partir de documents et de plans
- Mentoring des équipes juniors et animation de la communauté d'experts Data & IA du groupe
Le travail sera fait en collaboration avec une équipe de développeurs pour développer les modèles et héberger les livrables sur une plateforme web AWS.
Chez SOCOTEC, les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique, management d'une équipe (lead data), etc.
Vous aurez la possibilité d'interagir à l'international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles.
Compétences requises
- Master en Data Science / Machine Learning ou Ingénieur Généraliste avec appétence en data
- Minimum 5 ans d'expérience en Data Science appliquée, idéalement dans un environnement industriel, technique ou à forte composante data
- Maîtrise du langage Python et de son écosystème data (pandas, NumPy, scikit-learn, matplotlib, seaborn, etc.).
- Solide expérience avec les algorithmes de machine learning et deep learning, ainsi qu'avec au moins un framework de référence (TensorFlow, Keras ou PyTorch).
- Maîtrise des outils collaboratifs de développement : Git, GitLab, Jupyter Notebooks, VS Code, etc.
- Connaissance des environnements AWS (Lambda, Timescale, S3) et des bonnes pratiques de déploiement de modèles en production (MLOps) appréciée.
- Connaissance des statistiques, de la modélisation et des analyses multivariées (analyse factorielle, ACP, clustering, régressions, etc.).
- Polyvalence et autonomie sur l'ensemble du cycle de vie d'un projet data (exploration, modélisation, validation, déploiement).
- Esprit d'équipe, rigueur scientifique et sens de la collaboration
- Capacité à accompagner les équipes métiers et techniques, à vulgariser des sujets complexes et à contribuer à la structuration des bonnes pratiques data.
- Anglais courant et technique