Job Search and Career Advice Platform

Activez les alertes d’offres d’emploi par e-mail !

Lead Data Engineer (H/F)

BIOSerenity

Paris

Sur place

EUR 70 000 - 90 000

Plein temps

Aujourd’hui
Soyez parmi les premiers à postuler

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une start-up innovante recherche un Lead Technique pour développer et optimiser une plateforme de stockage de données et des pipelines ETL dans le domaine de la e-santé. Le candidat idéal a plus de 7 ans d'expérience en ingénierie des données, maîtrise Python et AWS, et a un bon esprit de collaboration au sein d'équipes interfonctionnelles. Rejoindre cette entreprise, c'est contribuer à des projets à fort impact dans le secteur de la santé.

Prestations

Impact sur la santé des patients
Culture d'innovation
Environnement de travail stimulant

Qualifications

  • Connaissance des normes RGPD et des enjeux de cybersécurité.
  • Capacité à gérer des projets de données end-to-end.
  • Compétence en documentation technique conforme.

Responsabilités

  • Créer et maintenir une plateforme de stockage de données.
  • Concevoir des pipelines ETL pour l'ingestion de données.
  • Assurer un transfert sécurisé des jeux de données.

Connaissances

Programmation Python
Git/GitLab CI
AWS
Data engineering
CI/CD pipelines

Formation

Plus de 7 ans d'expérience en ingénierie des données

Outils

MongoDB
Databricks
Terraform
Description du poste

Reconnue comme l’une des start-ups les plus innovantes dans l’écosystème de la e-santé, Bioserenity développe des dispositifs médicaux connectés, des solutions de coordination des soins et des algorithmes d'IA de pointe. Rejoindre Bioserenity, c'est contribuer à des projets à fort impact, à l’intersection des défis médicaux et des technologies innovantes.

Notre équipe Data Science (plus de 15 membres) développe des algorithmes IA de diagnostic pour la neurologie et la médecine du sommeil. Au sein de cette équipe, vous travaillerez sur un pipeline de dispositifs médicaux marqués CE, faisant le lien entre la recherche et les applications cliniques concrètes.

Mission

En tant que Lead Technique vous collaborerez quotidiennement avec un data ingénieur, des data scientists et des équipes interfonctionnelles (Dev/Ops, IoT…). Votre mission principale : créer, maintenir et optimiser une plateforme de stockage de données qui alimente nos initiatives en matière d'IA.

Gestion et optimisation de la plateforme de données
  • Normaliser et structurer les données : homogénéiser les formats, concevoir des ontologies et appliquer les meilleures pratiques afin de garantir la qualité et la cohérence des données.
  • Amélioration continue de la plateforme : mettre l'accent sur la sécurité, l'évolutivité, l'optimisation des coûts et les tableaux de bord (surveillance, traçabilité).
  • Gestion des versions des données : mettre en place des systèmes permettant de suivre l'évolution des ensembles de données et d'assurer une traçabilité complète (essentiel pour la conformité des dispositifs médicaux).
Développement de pipeline de transfert de données
  • Conception et maintenance de pipelines ETL automatisés pour l’ingestion, le nettoyage et la transformation des données de santé.
  • Respect strict des normes RGPD, anonymisation et pseudonymisation des données sensibles, documentation exhaustive des processus.
  • Collaboration avec les équipes métiers pour intégrer de nouvelles sources de données et répondre aux besoins évolutifs.
Facilitation de l’accès aux données pour les data scientists
  • Création et gestion de datasets versionnés pour permettre des expérimentations reproductibles.
  • Assurer un transfert rapide et sécurisé des jeux de données massifs, avec un focus sur la performance et la fiabilité.
  • Adaptation de la plateforme aux besoins des data scientists : formatage, structuration, enrichissement des métadonnées, et support technique pour faciliter leurs travaux d’analyse et de modélisation.
Automatisation et leadership technique
  • Maintenance et amélioration des pipelines CI/CD pour garantir des déploiements fluides et sécurisés.
  • Déployer des outils de surveillance (tableaux de bord, alertes) pour garantir la stabilité de l'ETL.
  • Industrialiser les déploiements des infrastructures data et des outils associés
  • Conseil technique : assurer la cohérence entre les différents modules du projet et fournir un accompagnement technique aux collaborateurs plus juniors (révision du code, meilleures pratiques, conseils en matière d'architecture).

L’équipe Data gère les projets de manière end-to-end (besoins utilisateur, architecture, développement, QA, sécurité, déploiement, ops) avec une liberté technologique pour adapter les solutions.

Compétences et expérience
Expertise technique
  • Programmation : Python (niveau avancé), Git/GitLab CI.
  • Cloud et Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
  • Orchestration : Airflow, Terraform.
  • Bases de données : MongoDB ; expérience avec des solutions de stockage à grande échelle.
  • Standards du web : API REST, protocoles HTTP/ HTTPS.
Compétences relationnelles
  • Rigueur scientifique et esprit orienté vers la résolution de problèmes.
  • Capacité à combler les écarts entre la science des données, le développement/les opérations et les ingénieurs logiciels.
  • Capacité à créer une documentation technique claire et conforme aux normes.
Expérience
  • Plus de 7 ans d'expérience en tant qu'ingénieur de données, dont plus de 2 ans en tant que responsable technique/senior.
  • Connaissance des enjeux de cybersécurité et de conformité (essentielle pour les données médicales).
  • Maîtrise de l'anglais technique (l'équipe et les parties prenantes sont internationales).
Optionnel
  1. MLOps: Expérience pratique de la gestion du cycle de vie complet du ML, y compris l'orchestration, le déploiement et la surveillance des pipelines.
  2. Connaissance des certifications CE/FDA pour les logiciels/algorithmes.
  3. Données de santé: expérience pratique des signaux électrophysiologiques (EEG, ECG, EMG) ou des données cliniques.
  4. Infrastructure : Linux, conteneurisation (Docker, ECR).
Pourquoi nous rejoindre
  • Impact : Travaillez sur des technologies médicales qui changent la vie et ont des résultats directs sur les patients.
  • Innovation : façonner l'avenir de la neurologie et du diagnostic du sommeil grâce à l'IA.
  • Croissance : Prendre des décisions techniques clés au sein d’une entreprise de 200+ collaborateurs, alliant agilité startup et expertise sectorielle.
  • Stack technique : Outils modernes (voir ci-dessus) avec une flexibilité pour proposer de nouvelles solutions.

Bioserenity is recognized as one of the most innovative startups in the digital health ecosystem, developing connected medical devices, care coordination solutions, and cutting-edge AI algorithms. Joining Bioserenity means contributing to high-impact projects at the intersection of medical challenges and advanced technology.

Our Data Science team (15+ members) drives product development by designing diagnostic algorithms (signal processing, deep learning) for neurology and sleep medicine. As part of this team, you’ll work on a CE-marked medical device pipeline, bridging research and real-world clinical applications.

Key responsabilities

As Lead Data Engineer, you’ll collaborate daily with a Data Engineer, Data Scientists, and cross-functional teams (Dev/Ops, IoT, Hardware). Your core mission: build, maintain, and optimize a data lake platform that powers our AI initiatives.

Data platform management & optimization
  • Standardize and structure data: homogenize formats, design ontologies, and enforce best practices to ensure data quality and consistency.
  • Continuous platform improvement: Focus on security, scalability, cost optimization, and metadata/dashboarding (monitoring, traceability).
  • Data versioning: Implement systems to track dataset evolution and ensure full traceability (critical for medical device compliance).
Data pipeline development
  • Design and maintain automated ETL pipelines for ingestion, cleaning, and transformation of healthcare data (EEG, clinical records, etc.).
  • Ensure strict GDPR compliance: anonymize/pseudonymize sensitive data and document all processes.
  • Partner with business teams to integrate new data sources and adapt to evolving needs.
Enabling Data Science Workflows
  • Create and manage versioned datasets to support reproducible experiments.
  • Optimize large-scale data transfers (performance, reliability) for ML modeling.
  • Adapt the platform to Data Scientists’ needs: formatting, metadata enrichment, and technical support.
Automation & Technical Leadership
  • Maintain and enhance CI/CD pipelines for seamless, secure deployments.
  • Deploy monitoring tools (dashboards, alerts) to ensure ETL stability.
  • Industrialize data platform deployments and associated tools.
  • Technical guidance: ensure coherence across project modules and provide technical mentorship to junior engineers (code reviews, best practices, architectural guidance).

Our projects are end-to-end owned (user needs → architecture → deployment → ops), with open technological choices to fit evolving challenges.

Skills & Experience
Technical Expertise:
  • Programming: Python (advanced), Git/GitLab CI.
  • Cloud & Big Data: AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
  • Orchestration: Airflow, Terraform.
  • Databases: MongoDB; experience with large-scale storage solutions.
  • Web Standards: REST APIs, HTTP.
Soft Skills:
  • Scientific rigor and problem-solving mindset.
  • Bridge gaps between Data Science, Dev/Ops, and software engineers.
  • Ability to create clear, compliance-ready technical documentation.
Experience:
  • 7+ years as a Data Engineer, including 2+ years as a Senior/Tech Lead.
  • Cybersecurity awareness (critical for medical data).
  • Fluent technical English (team and stakeholders are international).
Preferred
  • MLOps: Hands-on experience with end-to-end ML lifecycle management, including pipeline orchestration, deployment, monitoring.
  • Regulatory Knowledge: Familiarity with CE/FDA certification for software/algorithms.
  • Healthcare Data: Hands-on experience with electrophysiological signals (EEG, ECG, EMG) or clinical data.
  • Infrastructure: Linux, containerization (Docker, ECR).
Why Join Us?
  • Impact: Work on life‑changing medical technologies with direct patient outcomes.
  • Innovation: Shape the future of neurology and sleep diagnostics with AI.
  • Growth: Lead technical decisions in a multidisciplinary, 200+ person company with a startup mindset.
  • Tech Stack: Modern tools (see above) with flexibility to propose new solutions.
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.