¡Activa las notificaciones laborales por email!

Data Engineer

CompuGroup Medical SE

Madrid

Híbrido

EUR 40.000 - 60.000

Jornada completa

Hace 16 días

Mejora tus posibilidades de llegar a la entrevista

Elabora un currículum adaptado a la vacante para tener más posibilidades de triunfar.

Descripción de la vacante

CompuGroup Medical SE busca Ingenieros de Datos Mid-Level para unirse a su equipo en Madrid. Esta oportunidad te permitirá diseñar y mantener pipelines de datos en un sector con gran potencial de desarrollo, como la salud digital. Se buscan profesionales con sólida experiencia en Big Data y herramientas como Cloudera, Apache Kafka y Python. Además, se ofrecen beneficios sociales y un ambiente de trabajo flexible con opción de teletrabajo.

Servicios

Seguro médico
Cheque comida
Formación continua
Flexibilidad laboral

Formación

  • Al menos 3 años de experiencia en ETL en entornos Big Data.
  • Experiencia con Cloudera y herramientas asociadas.
  • Conocimiento de metodologías ágiles y gestión de tareas en Jira.

Responsabilidades

  • Diseñar, desarrollar y desplegar pipelines de datos con Spark y otros.
  • Colaborar con Data Scientists para disponibilizar datos.
  • Definir y mantener modelos de datos para analítica e IA.

Conocimientos

Python
SQL
Scala
ETL
Big Data
Apache Kafka
Apache NiFi
Shell Scripting

Educación

Ingeniería en Informática
Ingeniería Biomédica
Matemáticas
Físicas
Ingeniería en Telecomunicaciones

Herramientas

Cloudera
HDFS
GitLab
Kafka
Maven
IntelliJ IDEA
Jupyter Notebooks

Descripción del empleo

CGM Clinical es la compañía con más instalaciones en España de sistemas de información hospitalarios, de historia clínica electrónica y de ayuda a la decisión.

En todo el mundo, CGM implanta sistemas de información a más de 400.000 clientes de 40 países, incluidos 68 hospitales públicos en España.

Todos los días, 10.000 empleados de CGM en todo el mundo crean soluciones de Salud Digital innovadoras que ayudan a curar y cuidar a las personas.

Actualmente, estamos buscando 2 Ingenieros de Datos Mid-Level con experiencia en entornos Big Data sobre Cloudera para diseñar, desarrollar y mantener pipelines de datos escalables en el sector sanitario.

Funciones:

•Diseñar, desarrollar y desplegar pipelines de datos y su orquestación con Spark, PySpark, Python, Scala, Hive/Impala, Kudu, NiFi, Kafka, Oozie/Airflow. •Definir y mantener modelos de datos óptimos para analítica, reporting e IA con Parquet, Iceberg, Hive y Kudu. •Diseñar queries de extracción de datos con SQL en Hive / Impala. •Automatizar pruebas unitarias, de integración y CI/CD con Git, GitLab. •Preparar Datos con calidad para casos de uso de IA.

Colaborar estrechamente con Data Scientists y el equipo de Gobierno del Dato para disponibilizar datos para casos de uso.

Requisitos:

Titulación: Ingeniería en Informática, biomédica, Telecomunicaciones, Matemáticas, Físicas o similar

Competencias generales:

  • Al menos 3 años de experiencia construyendo ETL en entornos Big Data productivos.

  • Experiencia con Cloudera Data Platform y herramientas asociadas ( Spark , HDFS, Nifi, Kafka , yarn, Hive, Impala) .

  • Dominio de Python y/o Scala, SQL y Shell Scripting.

  • Conocimientos de herramientas de desarrollo como Maven, IntelliJ IDEA, Jupyter Notebooks, Git y GitLab.

  • Gestión de flujos de streaming con Kafka y de ingestión con NiFi.

  • Uso habitual de metodologías ágiles como Kanban y gestión de tareas en Jira.

  • Conocimiento de Confluence para documentación.

Competencias especificas:

  • Conocimiento de Datos de Salud

  • Familiaridad con estándares HL7/FHIR. Codificaciones Medicas CIE-10 y antología SNOMED-CT

  • Certificación de Cloudera (Generalist, Data Operator ) o similar.

¿Qué te ofrecemos?


-Empleo estable en un sector con un gran potencial de desarrollo.
-Beneficios sociales (seguro médico y cheque comida).
-Formación continua para tu desarrollo profesional.
-Flexibilidad laboral.
-Modelo híbrido de trabajo (con gran % de jornada en formato teletrabajo).

Consigue la evaluación confidencial y gratuita de tu currículum.
o arrastra un archivo en formato PDF, DOC, DOCX, ODT o PAGES de hasta 5 MB.