Ativa os alertas de emprego por e-mail!

Engenheiro De Dados

Beesby

Manaus

Presencial

BRL 20.000 - 80.000

Tempo integral

Há 6 dias

Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em dados está buscando um profissional para ajudar na evolução do ecossistema de dados, focando em DeltaLake, Spark e Superset. O candidato ideal será responsável por desenvolver e operar pipelines escaláveis em Python, modelar dados e otimizar consultas. É fundamental ter experiência em SQL avançado, Python e métodos ágeis. Conhecimentos em Superset e boas práticas de Data Viz são diferenciais. O ambiente busca uma abordagem mais open-source do que Microsoft.

Qualificações

Experiência com modelagem de dados e SQL avançado.
Sólidos conhecimentos em Python e Spark.
Experiência em desenvolvimento de pipelines em Python e Airflow.
Familiaridade com versionamento em GitHub e CI/CD.
Experiência com métodos ágeis e comunicação com públicos técnicos e de negócio.

Responsabilidades

Desenvolver e operar pipelines escaláveis baseados em Python.
Modelar dados usando arquitetura medalhão.
Otimizar consultas e monitorar a saúde dos pipelines.
Monitorar saúde e custos dos pipelines e documentar arquitetura, fluxos e dicionário de dados.

Conhecimentos

SQL avançado

Python

Spark

Deltalake

CI / CD

Métodos ágeis

Comunicação clara

Métodos ágeis

Comunicação clara

Ferramentas

Airflow

GitHub

Superset

segue certinha a vaga : Procuramos um profissional para ajudar a evolução do nosso ecossistema de dados baseado DeltaLake / Spark / Superset, governança, qualidade e performance. Papel hands-on, autonomia e impacto direto no negócio.

Responsabilidades

Desenvolver e operar pipelines escaláveis baseados em Python.
Modelar dados, usando um arquitetura medalhão, otimizando custo e performance.
Otimizar consultas, partições, índices e storage (Parquet / Delta).
Monitorar saúde / custos dos pipelines e documentar arquitetura, fluxos e dicionário de dados.

Requisitos obrigatórios

SQL avançado e modelagem.
Python, Spark, Deltalake e Arquitetura Medalhão.
Desenvolvimento de pipelines em python e Airflow;
Versionamento com GitHub e CI / CD.
Métodos ágeis e comunicação clara com públicos técnicos e de negócio.

Diferenciais

Conhecimentos de Superset (implantação / uso).
Conhecimento de Lakehouse.
Boas práticas de Data Viz.
Inglês técnico.

Importante é menos foco microsoft e mais foco opensource, python, spark, airdlow, etc

Obtém a tua avaliação gratuita e confidencial do currículo.

ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.

Melhores cidades

Melhores empresas

Ofertas populares