Enable job alerts via email!

Página da Vaga | Cientista de Dados Sênior

Leega Consultoria

United States

Remote

USD 80,000 - 110,000

Full time

5 days ago
Be an early applicant

Boost your interview chances

Create a job specific, tailored resume for higher success rate.

Job summary

An innovative firm is seeking a seasoned Data Engineer to lead the development of efficient data pipelines and ML models. This role involves ensuring data quality and integrity, implementing CI/CD processes, and collaborating with cross-functional teams to deliver impactful machine learning solutions. The ideal candidate will have extensive experience in data engineering, MLOps, and a passion for leveraging data to drive results. Join a dynamic environment that values continuous learning and growth while making a significant impact in the field of data science and machine learning.

Benefits

Continuous training and development
Flexible working hours
Health insurance
Remote work options
Team-building activities

Qualifications

  • 7+ years in IT with 5+ years in data engineering or MLOps.
  • Experience with statistical modeling and machine learning algorithms.

Responsibilities

  • Design and maintain scalable data pipelines for ML models.
  • Collaborate with data scientists and software engineers for project requirements.

Skills

Python
R
MLOps
Data Engineering
Machine Learning
Statistical Modeling

Education

Bachelor's in Computer Science
Postgraduate in relevant areas

Tools

Docker
Kubernetes
AWS SageMaker
Jenkins
GitLab CI
Hadoop
Spark
Kafka
Redshift

Job description

Job description

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: éticae transparência, excelência dequalidade, trabalho em equipe, responsabilidadeeconômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.

Cadastre-se agora mesmo em nossas vagas!



Main responsibilities
  • Projetar, desenvolver e manter pipelines de dados eficientes e escaláveis para coletar, processar e transformar dados brutos em formatos prontos para uso em modelos de aprendizado de máquina;
  • Garantir a qualidade, integridade e consistência dos dados ao longo de todo o ciclo de vida do ML;
  • Implementar pipelines de CI/CD (Integração Contínua/Entrega Contínua) para automação de testes, validação e implantação de modelos de ML;
  • Automatizar processos de treinamento, validação, deployment e monitoramento de modelos;
  • Configurar e gerenciar a infraestrutura necessária para suportar o ciclo de vida do ML, incluindo ambientes de desenvolvimento, teste e produção;
  • Utilizar ferramentas de gerenciamento de contêineres como Docker e Kubernetes para escalar e orquestrar modelos de ML;
  • Monitorar o desempenho dos modelos em produção e implementar alertas e métricas para identificar e resolver problemas;
  • Realizar manutenção regular dos modelos para garantir que permaneçam atualizados e eficazes;
  • Trabalhar em estreita colaboração com cientistas de dados, engenheiros de software e outros stakeholders para entender os requisitos do projeto e garantir a entrega eficaz de soluções de ML;
  • Facilitar a comunicação e a colaboração entre as equipes de desenvolvimento e operações para garantir uma integração perfeita;
  • Implementar práticas de gerenciamento de dados, incluindo governança de dados, segurança e conformidade com regulamentações (como GDPR e LGPD);
  • Garantir a proteção dos dados sensíveis e confidenciais ao longo do ciclo de vida do ML;
  • Identificar gargalos e otimizar o desempenho dos pipelines de dados e dos modelos de ML;
  • Utilizar técnicas avançadas de otimização para melhorar a eficiência e reduzir custos operacionais;
  • Implementar novas ferramentas que possam melhorar os processos e a eficiência operacional;
  • Documentar todos os processos, procedimentos e configurações de infraestrutura relacionados aos pipelines de MLops;
  • Estabelecer e promover as melhores práticas para desenvolvimento, implantação e operação de modelos de ML em escala;
  • Manter-se atualizado com as últimas tendências e tecnologias em MLops e engenharia de dados;
  • Fornecer orientação e suporte técnico para membros juniores da equipe;
  • Assumir um papel de liderança em projetos críticos e ajudar a definir a direção estratégica para a equipe de MLops


Requirements and skills

Formação:

  • Graduação em Ciência da Computação, Engenharia de Software, Engenharia de Dados ou áreas correlatas. Pós-graduação ou certificações em áreas relevantes são desejáveis.

Experiência técnica com:

  • A partir de 7 anos de experiência profissional na área de tecnologia da informação, com pelo menos 5 anos dedicados especificamente à engenharia de dados, MLOps ou Ciência de dados.
  • Python, R e desejável Redshift;
  • Experiência atuando com modelagem estatística, validação de tendências, scores, relevância, fraude, riscos, performance e resultado, manipulação de bancos de dados e otimização de algoritmos. Desenvolvimento de algoritmos de machine learning.


Additional information

Conhecimentos:

  • Conhecimento em design e arquitetura de bancos de dados;
  • Experiência em processos de extração, transformação e carga de dados;
  • Familiaridade com Hadoop, Spark, Kafka;
  • Habilidade em construir e gerenciar pipelines de ML;
  • Experiência com ferramentas de CI/CD para ML como Jenkins, GitLab CI, etc;
  • Conhecimento em deploy de modelos de ML em produção utilizando frameworks como TensorFlow Serving, Docker, Kubernetes;
  • Habilidades em monitorar e manter modelos de ML em produção;
  • Proficiência com serviços de nuvem específicos para dados e ML, como AWS SageMaker, Azure Machine Learning, Google AI Platform;
  • Experiência com S3, Redshift, e ferramentas da nuvem AWS.

Desejável:

  • Certificação AWS.
  • Experiência em Logística é um grande diferencial, caso tenha atuado no ramo de ferrovia é um GRANDE diferencial.


Get your free, confidential resume review.
or drag and drop a PDF, DOC, DOCX, ODT, or PAGES file up to 5MB.

Similar jobs

Página da Vaga | Pessoa Cientista de Dados Sênior (IA Generativa)

A3Data

Remote

USD 80,000 - 120,000

28 days ago