Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Lead Technique Data

Collective

Paris

Sur place

Confidentiel

Plein temps

Il y a 2 jours
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise technologique à Paris recherche un Lead Technique Data pour concevoir et optimiser une plateforme de données. En collaboration avec des data engineers et data scientists, vous serez en charge de développer des pipelines ETL et d'assurer un accès efficace aux données pour les équipes. Ce poste nécessite un minimum de 7 ans d'expérience en ingénierie data, avec des compétences en Python, AWS, et une compréhension des normes de cybersécurité.

Qualifications

  • Minimum 7 ans d'expérience en ingénierie data, dont 2 ans ou plus sur un rôle senior.
  • Bonne compréhension des enjeux de cybersécurité et de conformité réglementaire.
  • Maîtrise de l'anglais technique dans un environnement international.

Responsabilités

  • Concevoir, maintenir et optimiser une plateforme de données.
  • Développer des pipelines ETL automatisés pour les données de santé.
  • Créez et gérez des datasets versionnés pour les data scientists.
  • Apporter un leadership technique et accompagner les profils juniors.

Connaissances

Programmation Python
Git / GitLab CI
AWS
Airflow
Terraform
MongoDB
API REST
Description du poste

Lead Technique Data

En tant que Lead Technique Data, vous collaborez étroitement avec des data engineers, data scientists et des équipes transverses (DevOps, IoT, logiciel).

Votre mission principale consiste à concevoir, maintenir et optimiser une plateforme de données au cœur des projets d’IA.

1. Gestion et optimisation de la plateforme de données

Normaliser et structurer les données : homogénéisation des formats, conception d’ontologies, mise en place de bonnes pratiques garantissant qualité et cohérence.

Améliorer continuellement la plateforme : sécurité, scalabilité, optimisation des coûts, supervision et traçabilité.

Mettre en œuvre la gestion de versions des données afin d’assurer une traçabilité complète, indispensable dans un contexte de dispositifs médicaux.

2. Développement de pipelines de transfert de données

Concevoir et maintenir des pipelines ETL automatisés pour l’ingestion, le nettoyage et la transformation de données de santé.

Garantir le respect des exigences RGPD : anonymisation, pseudonymisation et documentation complète des processus.

Collaborer avec les équipes métiers pour intégrer de nouvelles sources de données et faire évoluer les pipelines.

3. Facilitation de l’accès aux données pour les data scientists

Créer et gérer des datasets versionnés permettant des expérimentations reproductibles.

Assurer des transferts de données volumineuses rapides, sécurisés et fiables.

Adapter la plateforme aux besoins des data scientists : formats, structuration, enrichissement des métadonnées et support technique.

4. Automatisation et leadership technique

Maintenir et améliorer les pipelines CI/CD pour des déploiements robustes et sécurisés.

Déployer des outils de supervision (tableaux de bord, alertes) pour assurer la stabilité des pipelines.

Industrialiser les déploiements des infrastructures data.

Apporter un leadership technique : cohérence architecturale, accompagnement des profils plus juniors, revues de code et diffusion des bonnes pratiques.

L’équipe Data intervient de manière end-to-end : recueil des besoins, architecture, développement, QA, sécurité, déploiement et opérations, avec une réelle liberté technologique.

Compétences et expérience
Compétences techniques

Programmation : Python (avancé), Git / GitLab CI.

Cloud & Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.

Orchestration & Infra : Airflow, Terraform.

Bases de données : MongoDB et solutions de stockage à grande échelle.

Standards web : API REST, protocoles HTTP/HTTPS.

Compétences relationnelles

Rigueur scientifique et forte capacité d’analyse.

Aptitude à faire le lien entre data science, ingénierie logicielle et opérations.

Capacité à produire une documentation technique claire et conforme aux exigences réglementaires.

Expérience

Minimum 7 ans d’expérience en ingénierie data, dont 2 ans ou plus sur un rôle senior ou de responsabilité technique.

Bonne compréhension des enjeux de cybersécurité et de conformité réglementaire, en particulier pour les données de santé.

Maîtrise de l’anglais technique dans un environnement international.

Atouts appréciés (optionnel)

MLOps : orchestration, déploiement et supervision de pipelines ML.

Connaissance des processus de certification CE / FDA pour logiciels ou algorithmes.

Expérience avec des données de santé : signaux électrophysiologiques (EEG, ECG, EMG) ou données cliniques.

Infrastructure : Linux, conteneurisation (Docker, registres d’images).

Lieu de la mission: Paris

TT: 3 jours

Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.