Job Search and Career Advice Platform

Ativa os alertas de emprego por e-mail!

Engenheiro De Dados

Beesby

Manaus

Presencial

BRL 20.000 - 80.000

Tempo integral

Há 6 dias
Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em dados está buscando um profissional para ajudar na evolução do ecossistema de dados, focando em DeltaLake, Spark e Superset. O candidato ideal será responsável por desenvolver e operar pipelines escaláveis em Python, modelar dados e otimizar consultas. É fundamental ter experiência em SQL avançado, Python e métodos ágeis. Conhecimentos em Superset e boas práticas de Data Viz são diferenciais. O ambiente busca uma abordagem mais open-source do que Microsoft.

Qualificações

  • Experiência com modelagem de dados e SQL avançado.
  • Sólidos conhecimentos em Python e Spark.
  • Experiência em desenvolvimento de pipelines em Python e Airflow.
  • Familiaridade com versionamento em GitHub e CI/CD.
  • Experiência com métodos ágeis e comunicação com públicos técnicos e de negócio.

Responsabilidades

  • Desenvolver e operar pipelines escaláveis baseados em Python.
  • Modelar dados usando arquitetura medalhão.
  • Otimizar consultas e monitorar a saúde dos pipelines.
  • Monitorar saúde e custos dos pipelines e documentar arquitetura, fluxos e dicionário de dados.

Conhecimentos

SQL avançado
Python
Spark
Deltalake
CI / CD
Métodos ágeis
Comunicação clara
Métodos ágeis
Comunicação clara

Ferramentas

Airflow
GitHub
Superset
Descrição da oferta de emprego

segue certinha a vaga : Procuramos um profissional para ajudar a evolução do nosso ecossistema de dados baseado DeltaLake / Spark / Superset, governança, qualidade e performance. Papel hands-on, autonomia e impacto direto no negócio.

Responsabilidades
  • Desenvolver e operar pipelines escaláveis baseados em Python.
  • Modelar dados, usando um arquitetura medalhão, otimizando custo e performance.
  • Otimizar consultas, partições, índices e storage (Parquet / Delta).
  • Monitorar saúde / custos dos pipelines e documentar arquitetura, fluxos e dicionário de dados.
Requisitos obrigatórios
  • SQL avançado e modelagem.
  • Python, Spark, Deltalake e Arquitetura Medalhão.
  • Desenvolvimento de pipelines em python e Airflow;
  • Versionamento com GitHub e CI / CD.
  • Métodos ágeis e comunicação clara com públicos técnicos e de negócio.
Diferenciais
  • Conhecimentos de Superset (implantação / uso).
  • Conhecimento de Lakehouse.
  • Boas práticas de Data Viz.
  • Inglês técnico.

Importante é menos foco microsoft e mais foco opensource, python, spark, airdlow, etc

Obtém a tua avaliação gratuita e confidencial do currículo.
ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.