Description
Ingénieur Data
Dans le cadre de l'appel à projet national pour la constitution d'entrepôots de données de santé (EDS), les 4 CHUs de la région AURA se sont associés pour co-construire la solution partagée interopérable EDS-D2H.
Missions
Pour participer au développement et à la mise en éuvre d'EDS-D2H, nous recherchons un ingénieur data passionné par les données et la santé pour rejoindre l'équipe EDS du CHUGA. En tant qu'Ingénieur Data, vous serez responsable de la conception, du développement et de la maintenance de nos pipelines de données. Votre rôle consistera à collecter, nettoyer, transformer et stocker les données provenant de diverses sources, en veillant à leur qualité et leur intégrité.
Vos missions seront les suivantes :
- Analyser les sources de données métier (séréum d'information d'imagerie, d'anesthésie, de réanimation et autres applicatifs du domaine de la santé) pour comprendre leurs spécificités et caractériser les contrainte d'inégration à l'EDS (utilisation de la donnée, format, volume, fréquence).
- Collaborer avec les équipes d'accompagnement de projets de recherche pour comprendre les besoins métiers en jeux de données et apporter une expertise technique sur les sources de données et la chaîne de traitement.
- Concevoir, développer et documenter les chaîns de traitement de la donnée (collecte, modélisation, traitement, stockage) adaptées aux contrainte avec des outils de type ELT.
- Maintenir les chaîns de traitement des données et optimiser leurs performances (optimisation des requêtes SQL, stratégie et orchestration des traitements).
- Assurer la sécurité et la confidentialité des données conformément aux règlementations en véhicule pour les données de santé.
Profil recherçu
- Diplômé d'une formation bac + 3/5 en informatique.
- Expérience de minimum 2 ans sur un poste d'ingénieur data.
Savoir-faire requis
- Bonne connaissance d'une solution de manipulation des données ELT (idéalement dbt) et d'orchestration (idéalement Dagster).
- Bonne connaissance des bases de données SQL (SQLServer, PostgreSQL, Oracle), colonne (ClickHouse) et des index de recherche textuelle (ElasticSearch, OpenSearch).
- Maîtrise de Python et Shell.
- Maîtrise des systèmes d'exploitation (Unix, Windows).
- Maîtrise des méthodes de développement agile et de l'utilisation de solutions de gestion de version (gitlab, github).
- Connaissancé de la réglementation concernant les données personnelles et des principes de cybersécurité.
- Maîtrise de l'anglais technique.
Savoir-faire apprécié
- Expérience en software engineering.
- Connaissancé en administration de bases de données.
- Connaissancé du DevOps et de l'intégration continue et de livraison continue (CI/CD).
- Connaissancé sur les clusters Kubernetes.
- Autres langages de programmation (R, Java, Scala).
Savoir-être
- Qualités relationnelles et travail en équipe, au sein de la structure et en lien avec le partenaire industriel et les data engineers des autres CHUs.
- Rigueur et organisation.
- Capacité d'anticipation et prise d'initiative.
- Adaptabilité.