¿Qué harás?
- Diseñar, implementar y operar pipelines de ingestión, transformación y ML basados en Databricks sobre plataformas cloud.
- Optimizar el rendimiento de Apache Spark y gestionar flujos de datos a gran escala con foco en fiabilidad y coste.
- Construir y mantener pipelines de CI/CD para artefactos de Databricks (ebooks, jobs, Repos, integración con Git) en entornos dev / UAT / prod.
- Aplicar buenas prácticas de ETL/ELT, garantizando calidad de datos, seguridad y cumplimiento.
- Colaborar con equipos de negocio para mejorar estrategias de recolección, integración y retención de datos.
- Monitorear y mejorar la fiabilidad de los datos y la eficiencia de los sistemas.
Lo que buscamos
- Minimo 5 años de experiencia en ingeniería de datos o roles afines.
- Formación en Ciencias de la Computación, Ingeniería o áreas relacionadas (licenciatura o maestría).
- Dominio sólido de Python, SQL y Apache Spark.
- Experiencia práctica con Databricks en la nube.
- Experiencia con Unity Catalog (requisito indispensable).
- Historial comprobado desplegando pipelines de Databricks en producción.
- Experiencia construyendo flujos de CI/CD para Databricks (Git integration, Repos, promoción entre entornos).
- Excelente nivel de inglés (C1).
Será un plus si tienes
- Experiencia con frameworks de orquestación como Apache Airflow, Dagster o Prefect.
- Conocimientos de Machine Learning y MLflow.
- Certificaciones en plataformas cloud.
- Experiencia previa en firmas globales de servicios profesionales.
Ofrecemos:
- Sueldo competitivo
- Prestaciones superiores
- Esquema 100% nominal
Requerimientos
Educación mínima: Educación superior - Licenciatura.
5 años de experiencia.
Idiomas: Inglés.
Palabras clave: senior, sr, datos, data, ingeniero, engineers, ingeniera, ing, engineer.