Dans le cadre des projets développés au sein de l'équipe Assets et projets Data, nous recherchons un développeur Python dans l'écosystème GCP (Google Cloud Platform).
Le candidat sera responsable de la mise en place de la collecte et de la mise à disposition des données au sein de l'entreprise, ainsi que de l'industrialisation et de la mise en production des traitements sur les données, tels que la création de tableaux de bord ou l'intégration de modèles statistiques. Il travaillera en lien avec les équipes métiers et d'analyse.
Responsabilités principales :
- Maîtriser l'utilisation avancée des données, réaliser des projets décisionnels, datamining, et data management.
- Assurer le développement et l'industrialisation d'applications manipulant de gros volumes de données.
- Analyser les besoins clients et concevoir des solutions analytiques, statistiques ou de Machine Learning.
- Concevoir et réaliser des solutions Big Data : collecte, transformation, analyse et visualisation de données volumineuses avec un haut niveau de performance.
- Mettre à disposition la donnée aux équipes utilisatrices et déployer des modèles statistiques en production.
- Suivre les projets de développement, développer des jobs Spark, traiter et ingérer différents formats de données.
- Développer des scripts, des collectes de données, des jobs de traitement et des mappings.
- Créer des moyens de restitution via fichiers, API ou dashboards.
- Collecter et fournir les données sous forme d'API ou fichiers, en développant des pipelines d'ingestion (streaming et batch) et des jobs Spark pour le prétraitement et le calcul des KPI.
- Développer des API d'ingestion et de traitement dans un environnement HDP.
- Participer à la conception, à la mise en place et à l'administration de solutions Big Data, y compris l'installation et la configuration de clusters Hadoop.
- Mettre en place des services d'extraction de données du système legacy avec Spring Boot, puis transférer les données vers un data lake via Kafka.
- Normaliser et agréger les données pour produire des rapports sous forme de Business Views.
Profil recherché :
- Maîtrise de Python (Dask, Flask, Polars).
- Expérience avec GCP : Cloud Run, Cloud Functions, BigQuery, Composer / Airflow. La connaissance de GKE serait un plus.
- Bonne connaissance des bonnes pratiques de développement, d'intégration et de déploiement continu.
- Capacité à travailler sur des sujets variés en transverse.