
Ativa os alertas de emprego por e-mail!
Cria um currículo personalizado em poucos minutos
Consegue uma entrevista e ganha mais. Sabe mais
Uma empresa de tecnologia está buscando um Cientista de Dados Sênior especializado em IA Generativa. O profissional será responsável por definir e evoluir a arquitetura do produto, liderar iniciativas com LLMs e RAG, e garantir compliance com a LGPD. É imprescindível ter experiência prática em algoritmos de Machine Learning e em frameworks de GenAI. A empresa valoriza comunicação eficaz e a habilidade de traduzir insights técnicos para públicos diversos. Localizada em Lucas do Rio Verde, Brasil.
Estamos buscando um Cientista de Dados Sênior com forte atuação em Arquitetura de IA Generativa para contribuir na evolução de soluções avançadas utilizando LLMs, RAG, VectorDBs e frameworks modernos de GenAI.
Como Cientista de Dados com foco em IA Generativa, você será responsável por :
Definir e evoluir a arquitetura de IA do produto, garantindo escalabilidade, rastreabilidade e explicabilidade.
Liderar iniciativas com LLMs, embeddings e RAG (Retrieval-Augmented Generation) para geração de soluções seguras e contextualizadas.
Aplicar fundamentos de estatística, probabilidade e algoritmos de Machine Learning (regressão, classificação, clusterização etc.) em análises e avaliações de performance.
Orquestrar integrações entre sistemas judiciais, serviços em nuvem e provedores de IA.
Projetar, implementar e monitorar pipelines envolvendo vector DBs e frameworks de GenAI (LangChain, LlamaIndex, Semantic Kernel, entre outros).
Criar e refinar engenharia de prompts em cenários complexos e diversos.
Traduzir resultados técnicos em insights claros e acionáveis, comunicando descobertas e limitações a públicos diversos (técnicos e executivos).
Documentar experimentos, resultados e boas práticas, promovendo transparência e reprodutibilidade.
Evangelizar o uso responsável e eficiente da IA, representando a empresa em talks, artigos e comunidades técnicas.
Garantir compliance e anonimização de dados sensíveis, em linha com LGPD e regulamentações do setor público.
Contribuir com o desenho e evolução da arquitetura distribuída (multi-workers / processors) conectada a sistemas judiciais e múltiplos LLMs.
Conhecimento em estatística, probabilidade e algoritmos de Machine Learning (regressão, classificação, clusterização etc.).
Experiência prática com Grandes Modelos de Linguagem (LLMs) e técnicas de prompting, embeddings e RAG.
Familiaridade com o ecossistema de GenAI, incluindo frameworks e bibliotecas que aceleram o desenvolvimento com LLMs e vector databases.
Vivência em vector DBs (pgvector, OpenSearch, Pinecone, Milvus ou equivalentes).
Sólida base em Python e Node / TypeScript para automações e integrações.
Conhecimento em segurança e privacidade de dados (LGPD, PII), em especial questões de anonimização.
Capacidade de comunicar e apresentar insights complexos de forma clara para públicos técnicos e de negócio.
Experiência anterior como arquiteto de soluções ou líder técnico em projetos complexos de IA.
Experiência com evals automatizados e guardrails (Rebuff, NeMo Guardrails, Truera).
Experiência com IA aplicada ao setor público ou jurídico.
Publicações, talks ou contribuições em comunidades técnicas de IA.
Histórico de contribuição em projetos InnerSource ou open source.