Estamos em busca de um(a) Analista de Dados Sênior com forte capacidade técnica e domínio em todo o ciclo de dados - desde a extração e limpeza, até a análise estatística, modelagem preditiva e geração de insights. Essa pessoa será fundamental para apoiar decisões estratégicas e alavancar a maturidade do time, que hoje conta com profissionais mais juniores na área de análise de dados.
Responsabilidades:
Atuar de ponta a ponta no processo analítico: extração, tratamento, modelagem e análise de dados estruturados e não estruturados.
Conduzir análises estatísticas e aplicar técnicas de modelagem preditiva conforme a necessidade dos projetos.
Realizar limpeza de dados com domínio de conceitos como imputação (mediana, moda, etc.), encoding (para dados categóricos), e boas práticas em preparação de dados.
Trabalhar em ambiente distribuído com Big Data, utilizando principalmente Python (com PySpark) no Databricks.
Contribuir com a evolução da arquitetura de dados atual, que envolve Datalake e Data Lakehouse.
Colaborar com áreas de negócio para entendimento dos requisitos e tradução das necessidades em soluções técnicas efetivas.
Apoiar e elevar o nível técnico do time de análise, contribuindo para entregas mais estratégicas e ágeis.
Requisitos:
Sólida experiência com análise de dados, modelagem e geração de insights em ambientes de Big Data e distribuídos;
Domínio em Python, especialmente com a biblioteca PySpark;
Conhecimento avançado em técnicas de limpeza e preparação de dados (tratamento de dados faltantes, categóricos, normalização, etc.);
Experiência na construção de dashboards no Power BI ou ferramentas similares;
Experiência com ferramentas de nuvem (preferencialmente Azure);
Conhecimentos em estatística e modelagem preditiva;
Familiaridade com conceitos de Datalake e Data Lakehouse;
Boa comunicação com áreas de negócio e capacidade de traduzir necessidades técnicas e não técnicas;