
Activez les alertes d’offres d’emploi par e-mail !
Générez un CV personnalisé en quelques minutes
Décrochez un entretien et gagnez plus. En savoir plus
Une entreprise technologique à Paris recherche un Lead Technique Data pour concevoir et optimiser une plateforme de données. En collaboration avec des data engineers et data scientists, vous serez en charge de développer des pipelines ETL et d'assurer un accès efficace aux données pour les équipes. Ce poste nécessite un minimum de 7 ans d'expérience en ingénierie data, avec des compétences en Python, AWS, et une compréhension des normes de cybersécurité.
Lead Technique Data
En tant que Lead Technique Data, vous collaborez étroitement avec des data engineers, data scientists et des équipes transverses (DevOps, IoT, logiciel).
Votre mission principale consiste à concevoir, maintenir et optimiser une plateforme de données au cœur des projets d’IA.
Normaliser et structurer les données : homogénéisation des formats, conception d’ontologies, mise en place de bonnes pratiques garantissant qualité et cohérence.
Améliorer continuellement la plateforme : sécurité, scalabilité, optimisation des coûts, supervision et traçabilité.
Mettre en œuvre la gestion de versions des données afin d’assurer une traçabilité complète, indispensable dans un contexte de dispositifs médicaux.
Concevoir et maintenir des pipelines ETL automatisés pour l’ingestion, le nettoyage et la transformation de données de santé.
Garantir le respect des exigences RGPD : anonymisation, pseudonymisation et documentation complète des processus.
Collaborer avec les équipes métiers pour intégrer de nouvelles sources de données et faire évoluer les pipelines.
Créer et gérer des datasets versionnés permettant des expérimentations reproductibles.
Assurer des transferts de données volumineuses rapides, sécurisés et fiables.
Adapter la plateforme aux besoins des data scientists : formats, structuration, enrichissement des métadonnées et support technique.
Maintenir et améliorer les pipelines CI/CD pour des déploiements robustes et sécurisés.
Déployer des outils de supervision (tableaux de bord, alertes) pour assurer la stabilité des pipelines.
Industrialiser les déploiements des infrastructures data.
Apporter un leadership technique : cohérence architecturale, accompagnement des profils plus juniors, revues de code et diffusion des bonnes pratiques.
L’équipe Data intervient de manière end-to-end : recueil des besoins, architecture, développement, QA, sécurité, déploiement et opérations, avec une réelle liberté technologique.
Programmation : Python (avancé), Git / GitLab CI.
Cloud & Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
Orchestration & Infra : Airflow, Terraform.
Bases de données : MongoDB et solutions de stockage à grande échelle.
Standards web : API REST, protocoles HTTP/HTTPS.
Rigueur scientifique et forte capacité d’analyse.
Aptitude à faire le lien entre data science, ingénierie logicielle et opérations.
Capacité à produire une documentation technique claire et conforme aux exigences réglementaires.
Minimum 7 ans d’expérience en ingénierie data, dont 2 ans ou plus sur un rôle senior ou de responsabilité technique.
Bonne compréhension des enjeux de cybersécurité et de conformité réglementaire, en particulier pour les données de santé.
Maîtrise de l’anglais technique dans un environnement international.
MLOps : orchestration, déploiement et supervision de pipelines ML.
Connaissance des processus de certification CE / FDA pour logiciels ou algorithmes.
Expérience avec des données de santé : signaux électrophysiologiques (EEG, ECG, EMG) ou données cliniques.
Infrastructure : Linux, conteneurisation (Docker, registres d’images).
Lieu de la mission: Paris
TT: 3 jours