Buscamos um (a) Cientista de Dados Pleno.
Responsabilidades:
- Explorar os dados de forma analítica para compreender sua qualidade e relevância para as modelagens;
- Propor a criação de novas variáveis preditivas relevantes para os modelos de aprendizado de máquina;
- Estudar, propor e criar modelos para a detecção de padrões nos dados (ex. CF, Clusterização, Classificação etc.), com o objetivo de fazer previsões automatizadas;
- Criar e testar modelos para detecção de padrões, classificação, clusterização e recomendações. Em NLP, aplicar tanto abordagens clássicas quanto modelos pré-treinados (BERT, GPT, etc.), com atenção a problemas fuzzy, como ambiguidades, incertezas na interpretação e ausência de dados (missing data) nos textos;
- Analisar as métricas de aprendizado e generalização dos modelos e fazer sua correlação com métricas de negócio, adaptando estratégias conforme desafios como inconsistências linguísticas e de imagens;
- Propor novas variáveis, como contagens, embeddings e indicadores de modelos, que ajudem a captar nuances e aspectos fuzzy dos dados textuais;
- Integrar dados de fontes diversas para complementar informações e gerar variáveis mais robustas e contextuais;
- Monitorar os modelos em produção (Drift de dados, métrica, tempo de execução, etc);
- Quando oportuno, publicar os achados científicos em periódicos ou para a comunidade em geral.
Requisitos:
- Habilidades em programação com Python.
- Fortes habilidades analíticas quantitativas para interpretar dados, desenvolver features e propor soluções de Ciência de Dados.
- Sólido conhecimento teórico e prático de técnicas de modelagem de Machine Learning (aprendizado de máquina supervisionado, semi-supervisionado e não supervisionado).
- Conhecimento prático de bibliotecas e plataformas de DS / ML / IA do mercado (scikit-learn, tensorflow, pytorch, pandas, PySpark, mllib)
- Habilidade de se comunicar com pessoas do time de negócios e das demais áreas de engenharia;
- Experiência com modelos de NLP, incluindo abordagens clássicas e modelos pré-treinados (BERT, GPT, etc.), com atenção a problemas fuzzy, ambiguidades, incertezas na interpretação e ausência de dados nos textos.
Benefícios:
- VR / VA, Vale Transporte, Assistência Médica e Odontológica e Auxílio Creche.
- Gympass para bem-estar e saúde.
- Bolsa de estudo com até 50% de desconto.
- Descontos especiais nas empresas do Grupo Magalu (Magalu, Netshoes, Época Cosméticos, Estante Virtual, Kabum, entre outras).
- Auxílio Creche
Modelo de Trabalho:
Adotamos o modelo 100% remoto, proporcionando flexibilidade, enquanto mantém a interação virtual com a equipe para garantir uma colaboração eficaz e um ambiente de crescimento contínuo.
Nosso ambiente e cultura:
Valorizamos autonomia, responsabilidade, diversidade e inclusão. Buscamos romper barreiras, entregamos rapidamente, agimos com agilidade e qualidade, promovendo um ambiente de trabalho que potencializa o crescimento profissional e pessoal.
Como é o ambiente de trabalho?
No Luizalabs, temos grande autonomia e responsabilidade, somos multidisciplinares, auto gerenciáveis e com pouca burocracia. Nosso ritmo é acelerado, mas equilibrado, com foco em entregas de valor e inovação.
Alerta de vaga:
Cientista de Dados Pleno • Petrolina, Pernambuco, BR