Seleccionamos para nuestro cliente Multinacional Farmacéutica con sede en su hub tecnológico y de investigación en Barcelona Machine Learning Engineer.
Descripción
- Colaborar estrechamente con químicos, biólogos y otros científicos para diseñar e implementar estrategias computacionales destinadas al análisis de conjuntos de datos biológicos complejos, incluyendo datos de genómica, proteómica y otras disciplinas “ómicas”.
- Desarrollar y aplicar algoritmos y modelos de aprendizaje automático para extraer información significativa de grandes volúmenes de datos biológicos, identificar patrones y predecir resultados.
- Implementar técnicas de preprocesamiento de datos, extracción de características y reducción de dimensionalidad para mejorar la calidad de los datos de entrada en los modelos de machine learning.
- Contribuir al diseño y optimización de experimentos, asegurando la recolección de datos de alta calidad para su posterior análisis.
- Crear y mantener pipelines para el procesamiento, análisis y visualización de datos, garantizando su reproducibilidad y escalabilidad.
- Mantenerse actualizado con los últimos avances en biología computacional, aprendizaje automático y campos relacionados, integrando métodos innovadores en los proyectos de investigación.
- Colaborar con equipos multidisciplinares para presentar hallazgos, compartir metodologías y participar activamente en discusiones de proyectos.
- Contribuir a publicaciones científicas, presentaciones en congresos y propuestas de financiación.
- Retribución: 68–102K€ + 20% bonus.
Requisitos
- Doctorado o máster en biología computacional, bioinformática, informática o un campo relacionado.
- Sólida formación en biología computacional, genómica y conceptos de biología molecular, con especial atención a bases de datos biológicas y ontologías como Uniprot, Ensembl, Gene Ontology y similares.
- Experiencia demostrada en técnicas de aprendizaje automático, incluyendo (pero no limitado a) aprendizaje profundo, métodos basados en árboles, aprendizaje no supervisado y selección de características.
- Dominio de lenguajes de programación (preferiblemente Python) y experiencia con librerías y frameworks relevantes (por ejemplo: pandas, TensorFlow, PyTorch, scikit-learn, networkx).
- Experiencia en el procesamiento y análisis de grandes conjuntos de datos biológicos, como datos de secuenciación de nueva generación (Next-Generation Sequencing), incluyendo datos de célula única (single-cell), y datos de proteómica.
- Familiaridad con herramientas y técnicas de visualización de datos, para comunicar eficazmente resultados tanto a públicos técnicos como no técnicos.
- Excelentes habilidades para la resolución de problemas y capacidad de pensamiento crítico en el diseño experimental y la interpretación de datos.
- Sólidas habilidades de comunicación y capacidad para trabajar de forma colaborativa en equipos multidisciplinares.