Cientista de Dados (Foco em Engenharia de Dados)
Workplace: São José dos Campos - SP
Job type: Full-time employee
Sobre a área:
- Transformação Digital – Desenvolvimento de Soluções: Apoiar projetos de dados em diversas áreas do negócio da Embraer, promover a cultura Data-Oriented, e implementar boas práticas de uso de dados, garantindo segurança, qualidade e resolução de problemas.
Você fará parte de uma equipe que constrói, mantém e evolui pipelines de dados para suportar decisões estratégicas e operacionais. Trabalhará próximo a analistas, cientistas de dados, desenvolvedores, arquitetos e stakeholders para garantir fluxo de dados de qualidade, segurança e eficiência.
Principais desafios:
- Projetar e implementar pipelines robustos para ingestão, processamento e disponibilização de dados em grande escala;
- Garantir a qualidade e confiabilidade dos dados, lidando com dados faltantes, inconsistentes ou duplicados;
- Otimizar desempenho de processos ETL/ELT, identificando gargalos e propondo melhorias ou automações;
- Trabalhar com arquiteturas distribuídas e cloud (AWS, Azure ou GCP), aproveitando serviços gerenciados e boas práticas de segurança;
- Colaborar com outras áreas para entender requisitos de dados, modelar soluções e entregar valor incremental.
Responsabilidades principais:
- Desenvolver e manter pipelines de dados (ETL/ELT) escaláveis e resilientes;
- Implementar boas práticas de governança, versionamento e monitoramento de dados;
- Participar de discussões de arquitetura e propor soluções técnicas alinhadas às necessidades do negócio;
- Documentar processos e pipelines desenvolvidos;
- Contribuir para a evolução contínua do ambiente de dados, propondo automações e melhorias.
Requisitos:
- Inglês fluente/avançado/intermediário para leitura e escrita técnica;
- Experiência em design de pipelines robustos (ETL/ELT - dbt, Apache NiFi, Talend, Fivetran);
- Experiência em otimização e automação de queries, bancos e processos;
- Experiência com pipelines e integração de APIs;
- Conhecimento em Hadoop, Spark, Parquet, Delta Lake;
- Modelagem de dados eficiente (OLTP, OLAP, data lakes, data warehouses);
- Ambientes Cloud (AWS, GCP, Azure);
- Orquestração e automação (Airflow, etc);
- Bancos relacionais (PostgreSQL, MySQL, Oracle) e não relacionais (MongoDB, Cassandra, Redis).
Desejável:
- Ferramentas de streaming: Kafka, Kinesis, Flink;
- Infraestrutura como código: Terraform, CloudFormation;
- Versionamento e CI/CD: Git, GitLab CI, Jenkins, AzureDevOps;
- Containers: Docker, Kubernetes;
- Conceitos de governança de dados;
- Noções de Machine Learning;
- Monitoramento.
Modelo de trabalho presencial (3 dias presenciais e 2 remotos) em São José dos Campos/SP.
Benefícios:
- Convênio Médico e Odontológico
- Cartão Multibenefícios
- Refeitório na empresa
- Auxílio Home Office
- PLR
- Previdência Privada
- Plataforma de treinamento e desenvolvimento
O modelo de trabalho será presencial a partir de 01/01/2026, com possibilidade de até 2 dias de home office por semana, conforme necessidade. O contrato atual será no modelo híbrido até 31/12/2025.
Suporte para candidatura:
- Etapas do processo: análise de documentação, entrevista com o time.
Somos uma das maiores empresas aeroespaciais do mundo, valorizamos diversidade e inclusão, e oferecemos oportunidades iguais para todos, independentemente de orientação sexual, identidade de gênero, raça, etnia, idade ou deficiência. Aqui, todos podem crescer, aprender e fazer a diferença.