Activez les alertes d’offres d’emploi par e-mail !

Stagiaire Ingénieur.e Data - Transformation vers un référentiel

ADLIN Science

Île-de-France

Sur place

EUR 20 000 - 40 000

Plein temps

Il y a 12 jours

Générez un CV personnalisé en quelques minutes

Décrochez un entretien et gagnez plus. En savoir plus

Résumé du poste

Une entreprise spécialisée en Data & Analytics propose un stage de 6 mois à Grenoble ou Paris. En tant que stagiaire Data, vous participerez au développement d'un pipeline ETL, analysant des modèles de données et proposant des solutions de mapping. Le candidat idéal a une bonne maîtrise de Python et un intérêt pour les données biomédicales.

Qualifications

  • En dernière année d’une formation d’ingénieure généraliste ou master en data management.
  • Bonne connaissance de Python.
  • Compréhension des modèles de données (ERD, schémas SQL).
  • Connaissance des standards médicaux (FHIR, CDISC, OMOP).
  • Rigueur et esprit analytique.
  • Intérêt pour les données biomédicales.

Responsabilités

  • Réaliser une veille technologique sur les ETL existants.
  • Analyser des modèles de données et identification des champs d’intérêt.
  • Mettre en place des tests unitaires et fonctionnels.
  • Proposer des solutions automatiques pour détecter et mapper des données.

Connaissances

Python
Connaissance des standards médicaux / terminologies
Git
Esprit analytique
Rigueur
Organisation
Curiosité technique
Esprit d’équipe

Formation

Dernière année d’une formation d’ingénieure généraliste
Master en data management

Outils

Gitlab
Description du poste
Description

Localisation : Grenoble ou Paris

Type de contrat : Stage de 6 mois

Date de démarrage : Février - Mars

L'offre complète est disponible ici :

En tant que stagiaire Data, vous participerez au développement de l’étape Transform du pipeline ETL visant à migrer des référentiels bien établis (OSIRIS, GDC, CDISC) vers le modèle de données standard OMOP CDM. Selon l’avancement et les intérêts du / de la stagiaire, une ouverture du stage pourra consister à développer une détection automatique des données d’entrée (lorsqu’elles ne suivent aucun référentiel connu), pour réussir leur mapping automatique vers OMOP.

Responsabilités
  • Réaliser une veille technologique sur les ETL existants permettant de faire le mapping de référentiels vers OMOP
  • Analyser des modèles de données connus et identification des champs d’intérêt
  • Mettre en place des tests unitaires et fonctionnels
  • Ouverture possible : proposer des solutions automatiques pour détecter et mapper des données inconnues vers OMOP
Quelle sera votre place dans l’équipe ?

Au sein de notre équipe Data & Analytics, qui fonctionne en petit comité, vous bénéficierez d'une grande autonomie. Vous collaborerez toutefois avec les autres membres de l'équipe qui continueront à faire évoluer le pipeline.

Profile
  • En dernière année d’une formation d’ingénieure généraliste, informatique ou biotechnologique avec une specialization en data, ou d’un master en data management avec une specialization en biologie
  • Bonne connaissance de Python
  • Compréhension des modèles de données (ERD, schémas SQL, etc)
  • Connaissance des standards médicaux / terminologies (FHIR, CDISC, OMOP)
  • Connaissance en Git, Gitlab
  • Rigueur, esprit analytique
  • Intérêt prononcé pour les données biomédicales et la recherche
  • Autonomie, organisation et curiosité technique
  • Esprit d’équipe et capacité à documenter et partager ses travaux
Starting date
  • 02-02
Obtenez votre examen gratuit et confidentiel de votre CV.
ou faites glisser et déposez un fichier PDF, DOC, DOCX, ODT ou PAGES jusqu’à 5 Mo.