Data Scientist Sênior
Descrição da Vaga: Estamos em busca de um Data Scientist Sênior para integrar nossa equipe de inteligência de dados. Essa posição exige experiência sólida em modelagem preditiva, machine learning e análise estatística, além da capacidade de estruturar e operacionalizar pipelines de dados para alimentar e escalar modelos analíticos.
Responsabilidades
- Desenvolver e validar modelos supervisionados e não supervisionados (regressão, classificação, clusterização, redes neurais) para resolver problemas de negócios.
- Desenvolver pipelines para transformação, armazenamento e deploy automatizado de dados e features, garantindo reprodutibilidade e escalabilidade.
- Realizar análise exploratória de dados para identificar padrões, tendências e variáveis relevantes.
- Realizar testes de hipóteses estatísticas para validar suposições e guiar decisões analíticas.
- Comparar performances de diferentes modelos, utilizando métricas apropriadas para garantir a melhor solução.
- Entender as necessidades do negócio e convertê-las em insights de dados e soluções analíticas que agreguem valor.
- Aplicar métodos de planejamento e otimização de recursos, como Programação Linear e Não Linear, Algoritmos de Busca e Modelagem de Restrições, para suportar a tomada de decisão estratégica.
- Trabalhar em colaboração com equipes de produto e engenharia para integrar soluções de dados nos sistemas operacionais e garantir a adoção de melhores práticas em Data Science.
Requisitos
- Graduação em Estatística, Matemática, Ciência da Computação, Engenharias ou área relacionada.
- Experiência comprovada em Data Science, incluindo modelagem preditiva, machine learning e construção de pipelines de dados para modelos analíticos.
- Proficiência em Python e bibliotecas como Pandas, Scikit-learn, TensorFlow e PySpark, além de ferramentas para monitoramento e versionamento de modelo.
- Experiência com SQL, bancos de dados relacionais e Data Lakes.
- Desejável experiência em visualização de dados para apresentação de insights de modelos analíticos.
- Vivência com PySpark ou Spark SQL.
- Experiência prévia com consumo de dados em ambientes de nuvem (AWS, GCP ou Azure).
- Conhecimento em versionamento (Git) e boas práticas de desenvolvimento.
Desejável
- Sólida base em estatística aplicada, incluindo interpretação de intervalos de confiança, testes de hipóteses, métricas de performance e estimativas de efeito, garantindo insights confiáveis e suporte à tomada de decisão baseada em dados.
- Habilidade em comunicar resultados complexos de forma clara e acessível, adaptando a linguagem para diferentes públicos, incluindo stakeholders técnicos e não técnicos.
- Capacidade de colaborar com equipes multidisciplinares, trabalhando em conjunto com engenheiros de dados, cientistas de dados e times de produto para integrar soluções analíticas no fluxo operacional da empresa.
- Mentalidade de aprendizado contínuo, com atualização sobre novas tecnologias em machine learning, engenharia de dados e MLOps, visando melhores práticas e inovação.
Diferenciais
- Experiência em desenvolvimento de soluções analíticas com o framework "Kedro".
- Repositório público com projetos, notebooks, análises ou pipelines publicados (GitHub, Kaggle ou similares).
- Residir na região de Campinas / Indaiatuba ou disponibilidade para estar presencial duas vezes na semana.
Competências Gerais
- Capacidade de comunicar insights e soluções técnicas de forma clara e objetiva, adaptando a linguagem para diferentes públicos, incluindo times técnicos e stakeholders de negócio.
- Habilidade de colaboração em equipes multidisciplinares.
- Perfil proativo e orientado a soluções.
- Mentalidade de aprendizado contínuo.
- Compromisso com boas práticas de desenvolvimento, escalabilidade e governança de dados, garantindo a confiabilidade e segurança das soluções implementadas.
Modelo de Trabalho: Híbrido