Job Search and Career Advice Platform

Ativa os alertas de emprego por e-mail!

Arquitetura de Dados Sênior

Plataforma de Dados do Cidacs

Salvador

Presencial

BRL 80.000 - 120.000

Tempo integral

Hoje
Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Um centro de pesquisa em saúde em Salvador busca um Arquiteto de Dados e Engenharia de Big Data para desenvolver infraestruturas de dados essenciais para pesquisas em saúde. O candidato ideal terá pelo menos 5 anos de experiência na área, com forte conhecimento em arquitetura de dados e Big Data. Você colaborará com equipes multidisciplinares e será responsável por otimizar o processamento de dados, contribuindo para a evolução das pesquisas em saúde pública no Brasil.

Serviços

Incentivo à continuidade da trajetória acadêmica
Acesso a infraestrutura computacional avançada
Ambiente multidisciplinar e oportunidades de colaboração
Flexibilidade no regime de trabalho

Qualificações

  • Mínimo de 5 anos de experiência em arquitetura de dados e gestão de bancos de dados em grande escala.
  • Conhecimento avançado em modelagem de dados e bancos de dados relacionais (SQL) e não relacionais (NoSQL).
  • Experiência em arquiteturas de dados distribuídas e escaláveis.

Responsabilidades

  • Apoiar iniciativas de modernização da arquitetura de dados.
  • Auxiliar na avaliação, implementação e otimização de data lakes.
  • Colaborar com equipes multidisciplinares, traduzindo desafios científicos em soluções tecnológicas.

Conhecimentos

Arquitetura de dados
Engenharia de Big Data
Modelagem de dados
SQL
NoSQL
Apache Airflow
Apache Spark
Colaboração multidisciplinar

Formação académica

Formação superior em Ciência da Computação, Engenharia de Computação ou Sistemas de Informação

Ferramentas

MinIO
Delta Lake
Git
Bash
Python
Descrição da oferta de emprego
Job description

O Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs/Fiocruz Bahia) está em busca de um Arquitetura de Dados e Engenharia de Big Data para Saúde para integrar a equipe da Plataforma de Dados. Esta posição é fundamental para o desenvolvimento e aprimoramento das infraestruturas de dados utilizadas para realização das pesquisas em saúde do Centro na área da Ciência de Dados.

O candidato será responsável por projetar, otimizar e manter arquiteturas escaláveis para o processamento e integração de grandes volumes de dados. Atuará na construção de datalakes, data lakehouses e pipelines de dados, dentre outras estratégias de organização de dados, garantindo eficiência, segurança e governança em ambientes distribuídos de Big Data. O pesquisador trabalhará em colaboração com engenheiro e cientistas de dados, e especialistas em saúde para desenvolver soluções inovadoras e impulsionar avanços técnico-científicos, realizando pesquisas em Ciência de Dados aplicadas aos necessidades no Cidacs.

Embora a vaga esteja vinculada a determinados projetos, você como Arquiteto de Soluções atuará de forma transversal nas demandas estratégicas do CIDACS relacionadas à arquitetura de dados, plataformas analíticas e evolução da infraestrutura tecnológica, contribuindo para o amadurecimento arquitetural da instituição como um todo e para outros projetos científicos e institucionais de grande relevância.

Os projetos desenvolvidos, em parceria com o MS, são estruturantes, com forte articulação institucional e alinhamento a padrões e frameworks internacionais. Assim, buscamos profissionais com visão sistêmica, profundidade técnica e senso de responsabilidade científica, que desejem deixar um legado concreto na infraestrutura nacional de dados genômicos, atuando de forma ética, segura e alinhada à ciência aberta.

Dentre os principais desafios estão as atividades de aprimoramento das estruturas longitudinais da Coortes do Cidacs, realizando o desenvolvimento metodológico em arquitetura de dados e ambientes computacionais, que permitam uma operação das estruturas longitudinais da Coortes dos Cidacs de forma eficaz e eficiente, trabalhando em ambiente seguro e controlado, desconectado disponível no Cidacs. Também, caberá ao pesquisador desenvolver pesquisas aplicadas e desenvolvimentos em temas de Ciência de Dados Populacional do Centro e a produção cientifica nesta área.

Nossa cultura valoriza a colaboração interdisciplinar, o uso de tecnologias de ponta e o compromisso com a ética e a segurança dos dados. Buscamos profissionais motivados por desafios, inovação e impacto social. Se você deseja aplicar sua experiência em arquitetura de dados e engenharia de Big Data para transformar a pesquisa em saúde no Brasil, essa vaga é para você!

Main responsibilities

ESSAS SÃO AS PRINCIPAIS RESPONSABILIDADES E ATRIBUIÇÕES:

  • Apoiar iniciativas de modernização da arquitetura de dados, incorporando novas tecnologias e boas práticas para ambientes de Big Data;
  • Auxiliar na avaliação, implementação e otimização de data lakes e data lakehouses voltados para pesquisa em saúde;
  • Auxiliar nas atividades de pré-processamento, vinculação de dados e construção de datasets para estudos epidemiológicos e análises avançadas;
  • Colaborar com equipes multidisciplinares, internas e externas, incluindo cientistas de dados, epidemiologistas e analistas, traduzindo desafios científicos em soluções tecnológicas inovadoras;
  • Desenvolver e gerenciar pipelines de dados utilizando ferramentas de processamento distribuído;
  • Desenvolver pesquisas em Ciência de Dados Populacional considerando prioridades da agenda estratégica do Cidacs;
  • Documentar arquiteturas, fluxos e estratégias de dados, assegurando a facilidade de manutenção e escalabilidade das soluções;
  • Elaborar e apresentar relatórios técnicos periódicos sobre a infraestrutura e processos de dados do Cidacs;
  • Implementar estratégias de governança e segurança de dados, garantindo conformidade com diretrizes regulatórias;
  • Monitorar o desempenho e a escalabilidade da arquitetura de dados, identificando e solucionando gargalos de performance em ambientes distribuídos;
  • Participar de reuniões e sessões técnicas para disseminar conhecimento e garantir a eficiência nas operações de dados;
  • Projetar e otimizar bancos de dados estruturados (SQL) e não estruturados (NoSQL) para atender às demandas das pesquisas do Cidacs;
Requirements and skills

O QUE VOCÊ PRECISA CONHECER PARA SE CANDIDATAR:

  • Formação superior em Ciência da Computação, Engenharia de Computação, Sistemas de Informação ou áreas correlatas;
  • Mínimo de 5 anos de experiência em arquitetura de dados e gestão de bancos de dados em grande escala;
  • Conhecimento avançado em modelagem de dados e bancos de dados relacionais (SQL) e não relacionais (NoSQL);
  • Conhecimento em automação de pipelines de dados usando orquestradores como Apache Airflow;
  • Conhecimento de otimização de grandes volumes de dados em arquiteturas distribuídas, utilizando motores de consulta (ex.: Trino, Presto);
  • Experiência em arquiteturas de dados distribuídas e escaláveis, especialmente em ambientes de Big Data (ex.: Apache Spark, ElasticSearch);
  • Experiência em projetar e otimizar data lakes e data lakehouse (ex.: MinIO, Delta Lake);
  • Experiência em integração e transformação de dados em larga escala, incluindo processos ETL/ELT;
  • Experiência com controle de versão (Git) e práticas de CI/CD para desenvolvimento e implementação de pipelines de dados;
  • Experiência avançada em ambientes Linux e scripting (ex.: Bash, Python);
  • Capacidade de colaborar com times multidisciplinares, incluindo cientistas de dados e analistas de dados;
  • Desejável proficiência em inglês para interação com grupos de pesquisa internacionais, leitura e escrita de documentação e artigos.

CONSIDERAMOS ESTES REQUISITOS COMO DIFERENCIAIS *:

  • Certificações em Big Data, bancos de dados ou arquitetura de dados;
  • Conhecimento avançado em containers e orquestração de containers (ex.: Docker, Kubernetes);
  • Conhecimento em otimização de queries e design de esquemas para bancos de dados voltados para alta performance;
  • Experiência com bancos de dados orientados a colunas (ex.: Cassandra, HBase) e motores de consulta distribuídos (ex.: Trino, Presto);
  • Experiência com dados de saúde pública e estudos epidemiológicos com o de coortes;
  • Familiaridade com governança de dados e frameworks de boas práticas (ex.: DMBOK);
  • Possuir título de mestre e/ou doutor nas áereas de formação superior indicadas acima;
  • Inglês avançado, especialmente para manter conversações com grupos internacionais.
  • Publicações nas áreas de computação aplicadas à saúde;

*Os requisitos diferenciais não impedem a candidatura, porém serão utilizados como critério de desempate.

Additional information

O Cidacs/Fiocruz Bahia oferece um ambiente dinâmico e colaborativo, onde profissionais da ciência de dados, epidemiologia e tecnologia trabalham juntos para gerar conhecimento e impacto na saúde. Como parte da equipe, o pesquisador terá acesso a infraestrutura computacional avançada, oportunidades de colaboração com instituições nacionais e internacionais e um ambiente que valoriza a inovação e o desenvolvimento contínuo.

Embora a vaga esteja vinculada a determinados projetos, você como Arquiteto de Soluções atuará de forma transversal nas demandas estratégicas do CIDACS relacionadas à arquitetura de dados, plataformas analíticas e evolução da infraestrutura tecnológica, contribuindo para o amadurecimento arquitetural da instituição como um todo e para outros projetos científicos e institucionais de grande relevância.

Os projetos desenvolvidos, em parceria com o MS, são estruturantes, com forte articulação institucional e alinhamento a padrões e frameworks internacionais. Assim, buscamos profissionais com visão sistêmica, profundidade técnica e senso de responsabilidade científica, que desejem deixar um legado concreto na infraestrutura nacional de dados genômicos, atuando de forma ética, segura e alinhada à ciência aberta.

Benefícios oferecidos:

  • Incentivo à continuidade da trajetória acadêmica, apoiando o pesquisador na realização de um doutorado/pós-doutorado em temas alinhados à agenda estratégica do CIDACS;
  • Acesso a uma infraestrutura computacional robusta, incluindo clusters de processamento de Big Data e ambientes seguros para análise de dados;
  • Ambiente multidisciplinar e oportunidades de colaboração com pesquisadores de diversas áreas, incluindo epidemiologia, saúde pública e computação;
  • Possibilidade de participação em projetos internacionais, eventos científicos e redes de pesquisa;
  • Oportunidade de capacitação por meio de cursos, treinamentos e participação em conferências científicas;
  • Flexibilidade no regime de trabalho, incluindo possibilidade de atuação híbrida (presencial e remoto);
  • Auxílio para publicação científica e incentivo à produção acadêmica na área de Ciência de Dados aplicada à Saúde;
  • Integração em um centro de referência nacional e internacional no uso de dados para a pesquisa em saúde pública;

Áreas prioritárias para pesquisa no doutorado / pós-doutorado:

  • Arquitetura e Engenharia de Dados para Saúde – Desenvolvimento e otimização de infraestruturas para armazenamento, processamento e análise de grandes volumes de dados populacionais e epidemiológicos.
  • Ciência de Dados Populacional e Saúde Pública – Modelagem, integração e análise de bases de dados de saúde em larga escala, com foco na produção de conhecimento para políticas públicas.
  • Privacidade, Segurança e Governança de Dados – Estratégias de proteção e governança de dados sensíveis, especialmente em ambientes distribuídos e de pesquisa confiável (TREs).
  • Inteligência Artificial e Machine Learning em Saúde – Aplicação de técnicas avançadas de IA para exação de conhecimento a partir de dados epidemiológicos e clínicos.
  • Infraestrutura Computacional para Pesquisa em Saúde – Desenvolvimento de soluções escaláveis e seguras para apoiar estudos longitudionais e análise de coortes populacionais.

Se você deseja aplicar seu conhecimento para desafios reais de Big Data e ciência de dados populacional, contribuindo para o avanço da pesquisa em saúde no Brasil e no mundo, venha fazer parte do Cidacs/Fiocruz Bahia!

Obtém a tua avaliação gratuita e confidencial do currículo.
ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.