Job Search and Career Advice Platform

Ativa os alertas de emprego por e-mail!

Engenheiro De Dados

Beesby

Itatiba

Híbrido

BRL 20.000 - 80.000

Tempo integral

Há 7 dias
Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em São Paulo está à procura de um profissional para desenvolver e operar pipelines de dados escaláveis. O foco está em tecnologias como Python, Spark e Deltalake, visando melhorar a governança e a performance dos dados. O candidato ideal deve ter experiência em modelagem de dados e conhecimento em ferramentas como Airflow e GitHub. Esta posição oferece autonomia e a chance de impactar diretamente os negócios, sendo desejável inglês técnico e familiaridade com práticas de Data Visualization.

Qualificações

  • Experiência avançada em SQL e modelagem de dados.
  • Domínio de Python, Spark, Deltalake e Arquitetura Medalhão.
  • Experiência no desenvolvimento de pipelines em Python e Airflow.
  • Conhecimento em versionamento com GitHub e CI / CD.
  • Capacidade de trabalhar com metodologias ágeis.

Responsabilidades

  • Desenvolver e operar pipelines escaláveis baseados em Python.
  • Modelar dados utilizando arquitetura medalhão.
  • Otimizar consultas, partições, índices e storage.
  • Monitorar saúde e custos dos pipelines.
  • Documentar arquitetura, fluxos e dicionário de dados.

Conhecimentos

SQL avançado
Python
Spark
Comunicação clara
Métodos ágeis

Ferramentas

Airflow
GitHub
Superset
Descrição da oferta de emprego

segue certinha a vaga : Procuramos um profissional para ajudar a evolução do nosso ecossistema de dados baseado DeltaLake / Spark / Superset, governança, qualidade e performance. Papel hands-on, autonomia e impacto direto no negócio.

Responsabilidades
  • Desenvolver e operar pipelines escaláveis baseados em Python.
  • Modelar dados, usando um arquitetura medalhão, otimizando custo e performance.
  • Otimizar consultas, partições, índices e storage (Parquet / Delta).
  • Monitorar saúde / custos dos pipelines e documentar arquitetura, fluxos e dicionário de dados.
Requisitos obrigatórios
  • SQL avançado e modelagem.
  • Python, Spark, Deltalake e Arquitetura Medalhão.
  • Desenvolvimento de pipelines em python e Airflow;
  • Versionamento com GitHub e CI / CD.
  • Métodos ágeis e comunicação clara com públicos técnicos e de negócio.
Diferenciais
  • Conhecimentos de Superset (implantação / uso).
  • Conhecimento de Lakehouse.
  • Boas práticas de Data Viz.
  • Inglês técnico.

Importante é menos foco microsoft e mais foco opensource, python, spark, airdlow, etc

Obtém a tua avaliação gratuita e confidencial do currículo.
ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.