Job Search and Career Advice Platform

Ativa os alertas de emprego por e-mail!

Sr Data Scientist

Topaz Brasil

Indaiatuba

Híbrido

BRL 160.000 - 200.000

Tempo integral

Hoje
Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia inovadora em São Paulo busca um profissional para liderar o desenvolvimento de modelos de detecção de fraudes utilizando Machine Learning. O candidato ideal terá forte experiência em ciência de dados, engenharia de dados e desenvolvimento em Python. Além de ótimas oportunidades de carreira, a empresa oferece um ambiente híbrido de trabalho e benefícios como planos de saúde e desenvolvimento profissional.

Serviços

Planos de saúde
Desenvolvimento profissional
Modalidade de trabalho híbrido

Qualificações

  • Experiência em manipulação de dados não-estruturados e estruturados.
  • Sólido conhecimento em algoritmos de Machine Learning.
  • Capacidade de desenvolver e manter pipelines de ML automatizados.

Responsabilidades

  • Liderar o desenvolvimento de modelos para prevenção de fraudes.
  • Trabalhar com engenheiros MLOps para implementar soluções escaláveis.
  • Monitorar e otimizar a performance de modelos em produção.

Conhecimentos

Ciência de Dados
Machine Learning
Engenharia de Dados
Python
Análise Estatística

Formação académica

Matemática e Estatística
Ciência da Computação

Ferramentas

Docker
Kubernetes
AWS
Pandas
ScikitLearn
Descrição da oferta de emprego
Job description

Na Topaz, a tecnologia nos une e a evolução nos conecta! 🚀

Em nossa organização, estamos totalmente comprometidos em contribuir para soluções financeiras que tornem a indústria um lugar seguro, acessível e dinâmico. Queremos alcançar diferentes partes do mundo com nosso amplo ecossistema de soluções tecnológicas. Por isso, convidamos você a fazer parte dessa equipe! 😎

Além disso, temos ótimos benefícios para você! Sabemos que, juntos, alcançaremos o sucesso, então se candidate e faça parte desse grande time.

Main responsibilities

Seu Dia a Dia na Topaz:

Na Topaz, você será responsável por liderar o desenvolvimento e a implantação de modelos avançados que impulsionam a prevenção de fraudes em larga escala. Seu dia-a-dia será desafiador e repleto de oportunidades para aplicar suas habilidades técnicas e estratégicas. Entre as principais atividades estão:

  • Desenvolvimento e Experimentação de Modelos: Projetar, treinar e validar modelos de aprendizado de máquina utilizando algoritmos avançados. Realizar experimentos para testar novas abordagens, ajustando hiper parâmetros e avaliando métricas como FPR e recall.
  • Implantação e Monitoramento em Produção: Trabalhar em conjunto com engenheiros MLOps para criar pipelines robustos que garantam a escalabilidade dos modelos em ambientes produtivos. Monitorar o desempenho dos modelos em produção, identificando possíveis degradações ou oportunidades para melhorias contínuas.
  • Otimização e Manutenção Contínua: Atualizar os modelos com novos dados para garantir que permaneçam relevantes frente a mudanças no comportamento fraudulento. Implementar técnicas de explicabilidade para tornar os modelos transparentes e alinhados às regulamentações aplicáveis.
  • Pesquisa e Inovação: Explorar novas tecnologias, frameworks e algoritmos para manter a solução na vanguarda da detecção de fraudes. Contribuir para a criação de boas práticas e padrões técnicos dentro da equipe.
Requirements and skills

O que você precisa conhecer para fazer parte da Topaz?

Ciência de Dados e Modelagem

Analisar dados estruturados e não-estruturados para identificar padrões de fraude e lavagem de dinheiro

  • Desenvolver modelos de Machine Learning (classificação, clusterização, detecção de anomalias) para problemas de segurança financeira
  • Aplicar feature engineering, tratar missing values, normalizar dados e balancear datasets
  • Evitar data leakage na separação e validação de datasets
  • Criar visualizações para comunicar resultados a diferentes públicos
  • Experimentar algoritmos diversos (ScikitLearn, LightGBM, CatBoost, Keras, TensorFlow, PyTorch)

Engenharia de Dados

Trabalhar com bancos de dados distribuídos (Athena, Hive, Spark) processando grandes volumes

  • Otimizar queries SQL reduzindo custos e tempo de execução
  • Manipular dados estruturados (CSV, Parquet) e não-estruturados (JSON, imagens)
  • Desenvolver pipelines de transformação e preparação de dados

Machine Learning Engineering

Criar e manter pipelines automatizados de ML (treinamento, validação, deploy)

  • Containerizar aplicações com Docker
  • Gerenciar PODs e deployments com Kubernetes
  • Garantir escalabilidade e disponibilidade das soluções

Monitoramento e Manutenção

Monitorar performance dos modelos em produção

  • Detectar e corrigir data drift e concept drift
  • Configurar alertas e dashboards de métricas
  • Implementar retreinamento automático e versionamento de modelos
  • Aplicar técnicas de explicabilidade (XAI) para conformidade regulatória

Inovação

Pesquisar novas tecnologias e algoritmos de ML

  • Contribuir com boas práticas e documentação técnica
  • Manter-se atualizado em Data Science e Machine Learning

Requisitos Obrigatórios

Fundamentos

Matemática e Estatística:

  • Sólido conhecimento em matemática, estatística e probabilidade

Machine Learning:

  • Experiência com algoritmos de classificação, clusterização e detecção de anomalias
  • Domínio do ciclo completo de ML: transformação, feature engineering, treinamento, validação
  • Frameworks: ScikitLearn, LightGBM, CatBoost, Keras, TensorFlow, PyTorch

Dados:

  • Manipulação com Numpy e Pandas
  • Dados não-estruturados (JSON, imagens)
  • Visualização (Matplotlib, Seaborn, Plotly, ApexCharts)

Bancos de Dados:

  • Experiência com SQL e bancos relacionais
  • NoSQL (MongoDB, DocumentDB, DynamoDB)
  • Bancos distribuídos (Athena, Hive, Spark)
  • Otimização de queries
  • ORM em Python

Python:

  • Desenvolvimento robusto em Python
  • Git para versionamento
  • Estruturas de dados, algoritmos e design patterns
  • Testes: pytest (unitários), Locust (carga)

Cloud e Infraestrutura (AWS):

  • S3, Athena, DynamoDB, EC2, Lambda, ECR, ECS/EKS
  • Docker para containerização
  • Kubernetes para orquestração
  • Terraform (conceitos básicos)
  • GitLab CI/CD (conceitos básicos)

Diferenciais

  • Ferramentas MLOps (Dagster, MLflow, Kubeflow, Airflow)
  • Feature Stores e Model Registry
  • Experiência em detecção de fraudes, anomalias ou segurança financeira
  • NLP ou processamento de imagens (OpenCV, PIL)
  • Certificações AWS (Solutions Architect, ML Specialty)
  • Contribuições open source ou publicações técnica

Se você tem esse perfil e quer fazer parte de um time inovador e dinâmico, venha para a Topaz! 🚀

Additional information

Tenha em mente esses benefícios que irão melhorar sua experiência na Topaz!

  • Saúde e Bem-estar: Porque pensamos em nossas equipes, oferecemos diferentes planos de saúde, focados em promover o bem-estar na organização.
  • Desenvolvimento pessoal e profissional: Estamos em constante evolução. Por isso, oferecemos ambientes, programas e políticas que garantem o espaço e as oportunidades necessárias para você🎓Rota de carreira.
  • Flexibilidade e tempo livre: Aqui você encontrará o tempo necessário para recarregar as energias, além de poder desfrutar de um dia de folga no seu aniversário 🥳 Modalidade de trabalho híbrido.
  • Convênios: Oferecemos diferentes convênios e descontos.
Obtém a tua avaliação gratuita e confidencial do currículo.
ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.