Especialista em Ciência de Dados – Afya – Home Office
Responsibilities
- Liderar tecnicamente e arquitetar soluções de ponta-a-ponta em Machine Learning para os produtos digitais da Afya.
- Definir e conduzir a estratégia de experimentação e análise estatística avançada para otimizar o engajamento, retenção e o impacto das alterações nos produtos.
- Atuar como referência (SME) em GenAI, com foco exclusivo no fluxo de avaliações (evaluation), construção de Small Language Models (SLMs) e Fine-Tuning, garantindo respostas seguras e alinhadas aos objetivos de negócio.
- Influenciar o roadmap de produto e de outras squads (AIOps, AI Engineer) através da identificação de oportunidades baseadas em dados e da prototipação de novas soluções de IA.
- Estabelecer e disseminar boas práticas de código (Python) garantindo a qualidade e a performance dos modelos em produção.
- Mentorar outros cientistas de dados (Jr, Pleno, Sênior) em desafios técnicos complexos.
- Comunicar e defender arquiteturas, decisões técnicas e resultados de modelos complexos para stakeholders técnicos e executivos.
Qualifications
- Pós-graduação em Ciência da Computação, Engenharia, Estatística, Matemática ou áreas correlatas.
- Experiência avançada e comprovada em Python e suas principais bibliotecas (ex: Scikit-learn, TensorFlow, PyTorch).
- Conhecimento profundo em estatística, design de experimentos (Testes A/B) e inferência causal.
- Vasta experiência com técnicas tradicionais de Machine Learning (Classificação, Regressão, Clusterização, Séries Temporais) e conhecimento de Deep Learning.
- Experiência sólida no desenvolvimento, fine-tuning e produção de soluções com IA Generativa (foco em LLMs/SLMs).
- Domínio do ciclo de vida completo de Data Science (MLOps/LLMOps), incluindo arquitetura, evaluation, monitoramento e observabilidade de modelos.
- Experiência na definição e implementação de Feature Stores, incluindo melhores práticas de governança, versionamento e disponibilização de features.
- Experiência prática com MLFlow para orquestração e versionamento de modelos.
- Domínio de ferramentas de versionamento (Git) e familiaridade com práticas de CI/CD.
- Inglês avançado (necessário para leitura de artigos científicos e comunicação técnica).
- Desejável
- Experiência prática com a plataforma Databricks.
- Experiência com processamento distribuído (Spark).