Ativa os alertas de emprego por e-mail!

Engenheiro De Dados

Beesby

Itatiba

Híbrido

BRL 20.000 - 80.000

Tempo integral

Há 7 dias

Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em São Paulo está à procura de um profissional para desenvolver e operar pipelines de dados escaláveis. O foco está em tecnologias como Python, Spark e Deltalake, visando melhorar a governança e a performance dos dados. O candidato ideal deve ter experiência em modelagem de dados e conhecimento em ferramentas como Airflow e GitHub. Esta posição oferece autonomia e a chance de impactar diretamente os negócios, sendo desejável inglês técnico e familiaridade com práticas de Data Visualization.

Qualificações

Experiência avançada em SQL e modelagem de dados.
Domínio de Python, Spark, Deltalake e Arquitetura Medalhão.
Experiência no desenvolvimento de pipelines em Python e Airflow.
Conhecimento em versionamento com GitHub e CI / CD.
Capacidade de trabalhar com metodologias ágeis.

Responsabilidades

Desenvolver e operar pipelines escaláveis baseados em Python.
Modelar dados utilizando arquitetura medalhão.
Otimizar consultas, partições, índices e storage.
Monitorar saúde e custos dos pipelines.
Documentar arquitetura, fluxos e dicionário de dados.

Conhecimentos

SQL avançado

Python

Spark

Comunicação clara

Métodos ágeis

Ferramentas

Airflow

GitHub

Superset

segue certinha a vaga : Procuramos um profissional para ajudar a evolução do nosso ecossistema de dados baseado DeltaLake / Spark / Superset, governança, qualidade e performance. Papel hands-on, autonomia e impacto direto no negócio.

Responsabilidades

Desenvolver e operar pipelines escaláveis baseados em Python.
Modelar dados, usando um arquitetura medalhão, otimizando custo e performance.
Otimizar consultas, partições, índices e storage (Parquet / Delta).
Monitorar saúde / custos dos pipelines e documentar arquitetura, fluxos e dicionário de dados.

Requisitos obrigatórios

SQL avançado e modelagem.
Python, Spark, Deltalake e Arquitetura Medalhão.
Desenvolvimento de pipelines em python e Airflow;
Versionamento com GitHub e CI / CD.
Métodos ágeis e comunicação clara com públicos técnicos e de negócio.

Diferenciais

Conhecimentos de Superset (implantação / uso).
Conhecimento de Lakehouse.
Boas práticas de Data Viz.
Inglês técnico.

Importante é menos foco microsoft e mais foco opensource, python, spark, airdlow, etc

Obtém a tua avaliação gratuita e confidencial do currículo.

ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.

Melhores cidades

Melhores empresas

Ofertas populares