Arquiteto de Soluções Sênior – Foco em HPC (High Performance Computing)
Detalhes do Emprego
Localização: Porto Alegre, Rio Grande do Sul, Brasil
Observação: Desculpe, este trabalho não está disponível em sua região.
Estamos buscando um Arquiteto de Soluções Sênior com sólida experiência em projetos de infraestrutura de TI e profundo conhecimento em ambientes de Computação de Alto Desempenho (HPC). Este profissional será responsável por desenhar arquiteturas de HPC para ambientes acadêmicos, centros de pesquisa, setor público e grandes corporações.
Responsabilidades:
- Projetar e validar arquiteturas de HPC (clusters, redes de interconexão, armazenamento paralelo, GPU computing);
- Apoiar o time comercial em propostas técnicas para clientes com demandas de alto processamento e análise massiva de dados;
- Especificar soluções com base em workload científicos, modelagem computacional, inteligência artificial e treinamento de modelos;
- Coordenar PoCs com fabricantes e acompanhar benchmarks;
- Atuar como referência técnica em licitações e projetos B2G e B2B;
- Manter relacionamento técnico com parceiros estratégicos (como Dell, Nvidia, AMD, SUSE, Canonical, entre outros);
- Desenvolver escopo de serviços técnicos para fornecimento de soluções de HPC;
- Atuação em outros projetos e arquiteturas convencionais com Storage, servidores, virtualização, backup, etc.
Requisitos obrigatórios:
- Experiência comprovada em projetos de HPC, incluindo desenho de clusters, tuning de desempenho e escalabilidade;
- Conhecimento em Linux (preferencialmente SUSE, RHEL ou Ubuntu Server), SLURM, BCM, Lustre, BeeGFS ou Ceph, e outras soluções de código aberto para HPC;
- Conhecimentos sobre containers para ambientes HPC/IA;
- Familiaridade com interconexão de baixa latência (InfiniBand, RoCE);
- Experiência com ambientes que utilizam GPUs para IA/ML/DL;
- Capacidade de traduzir requisitos de negócio em especificações técnicas de HPC;
- Conhecimento em ferramentas como Zabbix, Grafana, Prometheus para gerenciamento e monitoramento.
Diferenciais:
- Certificações técnicas (NVIDIA DLI, SUSE HPC, RHEL HPC, Dell Technologies, etc.);
- Experiência com editais públicos, especialmente relacionados a universidades, institutos federais ou centros de pesquisa;
- Participação em projetos de computação científica ou IA em larga escala;
- Vivência com software stack de AI (PyTorch, TensorFlow) em ambientes de produção;
- Conhecimento de arquiteturas para Generative AI, visual computing e outros ambientes de IA baseados em treinamento e inferência multi-GPU;
- Arquiteturas de Storage NFS de alto desempenho com GPUDirect Storage para IA;
- Conhecimento dos diferenciais e ferramentas do NVIDIA AI Enterprise;
- Conhecimento em ambientes de virtualização como Proxmox, SUSE Rancher, Ubuntu KVM, entre outros.