Job description
Será responsável por apoiar no desenvolvimento e operacionalização de sistemas de ML para monitoramento de ativos solares e eólicos, implementando pipelines de dados e modelos em produção sob orientação, contribuindo para arquiteturas escaláveis de MLOps e colaborando na construção de soluções robustas que garantam a performance e confiabilidade dos sistemas de ML da Rio Energy.
Main responsibilities
PRINCIPAIS RESPONSABILIDADES
- Desenvolver modelos e ferramentas que permitam o monitoramento da performance dos ativos da Rio Energy;
- Desenvolver e operacionalizar relatórios automáticos com os principais KPIs monitorados pela área de O&M;
- Interface Técnica: Atuar como ponte entre ciência e engenharia de dados, traduzindo requisitos de modelos ML em especificações técnicas de infraestrutura e pipelines;
- Projetar e implementar arquiteturas de dados end-to-end, desde ingestão até modelagem, incluindo data warehouses e data lakes;
- Colaborar no desenvolvimento de pipelines de dados robustas utilizando Airflow, Kedro;
- Participar da implementação de sistemas de controle de versão utilizando Liquibase;
- Apoiar no desenvolvimento de pipelines de CI/CD para modelos de ML;
- Contribuir com sistemas de monitoramento de performance e qualidade de dados;
- Auxiliar no gerenciamento de infraestrutura de ML utilizando ferramentas cloud-native;
- Manter documentação técnica e participar de sessões de conhecimento.
Requirements and skills
Formação e Experiência
- Graduação em Ciência da Computação, Engenharia de Computação, Engenharias, Matemática, Física ou áreas correlatas.
- Inglês Avançado (leitura de documentação técnica e comunicação).
- Domínio de Linguagens de Programação: Python (intermediário a avançado), SQL (intermediário a avançado).
- Conhecimento em Data Warehouse, Data Lake, Bancos de Dados (Microsoft SQL Server, PostgreSQL).
- Conhecimento em Pipeline de Dados (Airflow, Kedro).
- MLOps e Orquestração: Docker, Gitlab CI/CD, ou similares.
- Versionamento: Git, controle de versão de esquemas de banco.
- Vivência prévia como Machine Learning Engineer, Data Engineer ou Software Engineer é desejável.
- Experiência em Deployment de modelos de ML em ambiente produtivo com suporte de profissionais sêniores.
- Experiência em trabalho colaborativo com times multidisciplinares.
- Especialização ou Mestrado é um diferencial.
- Desejável experiência no setor de energias renováveis ou IoT industrial.
Competências Técnicas Desejáveis
- Controle de Versão de Schema: Liquibase.
- Large Language Models: OpenAI API, Hugging Face, LangChain, prompt engineering.
- Experiência com SCADA e dados de séries temporais industriais.
- Frameworks de ML: Scikit-learn, TensorFlow/PyTorch, XGBoost.
- Testes: Pytest, testes unitários e de integração.
- Cloud Platforms: AWS/GCP/Azure com foco em serviços de dados.
Diferenciais
- Interesse em implementação de soluções baseadas em LLMs.
- Experimentação de modelos.
- Conhecimento básico em segurança e Compliance para sistemas de dados e ML.
- Experiência prévia atuando como interface entre times técnicos.
Additional information
- Local de Atuação : Rio de Janeiro - Bairro Jardim Botânico - Brasil
- Formato Híbrido