📍O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população. 📍
QUALIFICAÇÕES E REQUISITOS OBRIGATÓRIOS :
FORMAÇÃO :
- Mestrado em Bioinformática ou áreas correlatas envolvendo ciências da saúde, biologia computacional, genética, ciência de dados biomédicos ou informática aplicada à genômica humana.
EXPERIÊNCIA :
- Mínimo de 3 anos em bioinformática (acadêmica ou profissional), com atuação comprovada em genômica.
- Experiência sólida no desenho, implementação, operação e otimização de pipelines reprodutíveis (pré-processamento, mapeamento, chamadas de variantes, joint-genotyping etc.).
- Participação prévia como bioinformata em projetos de genômica.
HABILIDADE TÉCNICAS :
- Experiência prática com Nextflow e / ou WDL / Cromwell, incluindo execução em ambientes HPC.
- Domínio de ferramentas essenciais : GATK, BWA, samtools / bcftools, Picard.
- Uso de ontologias biomédicas (HPO, SNOMED, OMOP) ou experiência em mapeamento de metadados clínicos.
- Experiência com containers (Docker, Singularity / Apptainer).
- Vivência em QC e curadoria de dados genômicos.
- Conhecimento de ambientes HPC (SLURM, filas, quotas, logs, storage distribuído).
- Sólida experiência em Linux e Shell Script.
- Experiência com Git, versionamento, CI / CD e boas práticas de engenharia de software.
HABILIDADE INTERPESSOAIS :
- Abordagem analítica e orientada à solução de problemas.
- Capacidade de trabalhar em ambiente colaborativo e de alta responsabilidade científica.
DESEJÁVEIS, MAS NÃO OBRIGATÓRIOS :
OUTRAS QUALIFICAÇÕES :
- Experiência com padrões GA4GH (htsget, refget, DUO, Phenopackets).
- Experiência no uso de ferramentas e estrutura de dados para registro de dados fenotípicos como RedCAP.
- Familiaridade com modelos de dados clínicos, especialmente OMOP-CDM.
- Inglês intermediário
DIFERENCIAIS :
- Doutorado em Bioinformática ou áreas correlatas.
- Publicações científicas relevantes em genômica ou bioinformática.
- Experiência prévia em projetos nacionais ou multicêntricos de grande escala.
- Experiência com pipelines nf-core, HAIL ou Spark genômico.
- Conhecimento de processamento em GPU e Nvidia Parabricks em genômica.
TAREFAS PRINCIPAIS :
- Desenho e implementação de pipelines de bioinformática : Projetar pipelines reprodutíveis (pré-processamento, alinhamento, chamadas de variantes, gVCF, joint-calling) utilizando containers e seguindo melhores práticas internacionais (GATK Best Practices, nf-core).
- Definir painéis / métricas de QC : Estabelecer métricas de qualidade para sequências (FASTQ / BAM / VCF) e metadados clínico-fenotípicos, definindo thresholds, alertas e relatórios.
- Automatização : Desenvolver rotinas automatizadas para ingestão, auditoria e curadoria, garantindo eficiência, padronização e rastreabilidade.
- Consolidar catálogos e metadados : Apoiar a construção de catálogos agregados de variantes (frequências populacionais), indexação e versionamento de metadados conforme ontologias reconhecidas (HPO, SNOMED-CT, OMOP, GA4GH).
- Procedimentos Operacionais Padrão (SOPs) : Elaborar documentos técnicos, guias e templates para garantir governança, auditoria e reprodutibilidade dos processos.
- Documentação robusta : Criar e manter documentação completa e clara, garantindo que pipelines e procedimentos possam ser mantidos, auditados e evoluídos pela equipe no futuro.