
Ativa os alertas de emprego por e-mail!
Cria um currículo personalizado em poucos minutos
Consegue uma entrevista e ganha mais. Sabe mais
Uma empresa de tecnologia em São Paulo busca um Site Reliability Engineer (SRE) para elevar a confiabilidade e a observabilidade dos sistemas em produção. O profissional será responsável por resolver incidentes, otimizar operações e garantir segurança na nuvem. É necessário conhecimento em AWS, Kubernetes, PostgreSQL e CI/CD. Além disso, a empresa oferece um ambiente híbrido, com benefícios como assistência médica e vale-alimentação.
Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.
Ao se juntar à Stefanini, você se torna parte de uma jornada global de transformação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!
Junte-se a nós e seja parte da mudança!
Modelo de trabalho - Atuação em modelo híbrido, na região do Butantã
O que esperamos que você realize:
Visão Geral da Posição
Foco em elevar o nível de confiabilidade, observabilidade e resiliência dos sistemas já operados pela equipe atual de DevOps.
Hoje, a equipe já executa todas as rotinas essenciais de operação, infraestrutura e suporte a produção, porém de forma reativa ou distribuída e com foco em manter e suportar os times.
O papel de SRE surge para estruturar, padronizar, medir risco e transformar operação em engenharia.
Objetivo do Cargo
Garantir que sistemas em produção sejam:
Tudo isso usando engenharia, automação e métricas claras, a partir das atividades que a equipe já executa hoje.
Responsabilidades (Baseadas no que a equipe já faz hoje)
Observabilidade e Produção
Incidentes e Pós-Incidente
Confiabilidade de Bancos de Dados
Cloud, Segurança e Estabilidade
Capacidade, Custos e FinOps
Releases e Pipelines (Interface com DevOps)
O que precisamos que você tenha de conhecimento:
Plataformas, Tecnologias e Conhecimentos Esperados
Este papel de Site Reliability Engineer (SRE) exige domínio técnico profundo nas plataformas já utilizadas hoje pela equipe, garantindo confiabilidade, performance, segurança e observabilidade dos sistemas em produção.
Conhecimento Profundo / Avançado (Obrigatório)
O profissional precisa dominar, tomar decisões arquiteturais e atuar como referência técnica em:
Cloud Providers
Containers e Orquestração
Compute & Serverless
Bancos e Cache
Rede, Edge e Segurança
Segredos e Segurança
CI/CD
Armazenamento
Proxy e Web Server
Monitoramento e Observabilidade
Soluções
IA
Ótimo Conhecimento (Alta autonomia)
Capaz de operar, otimizar, debugar e apoiar decisões técnicas:
Mensageria e Eventos
Comunicação e Serviços AWS
Linguagens e Ecossistema
Noções consistentes de:
Observabilidade e Infraestrutura
Bom Conhecimento (Capaz de atuar com apoio de documentação e IA)
Conhecimento sólido para suporte, análise e evolução contínua:
Bancos e Dados
Linguagens
Infraestrutura e Automação
Observabilidade e Logs
Integrações e Automação
DNS
Conhecimento Desejável (Diferencial)
Não obrigatório, mas agrega valor ao time e à maturidade da plataforma:
🍛 Vale-alimentação ou vale-refeição;
👨🏼🎓 Desconto em cursos, universidades e instituições de idiomas;
📚 Academia Stefanini — plataforma com cursos on-line, gratuitos, atualizados e com certificado;
🗣 Mentoring;
💉 Clube de vantagens para consultas e exames;
🏥 Assistência médica;
🦷 Assistência odontológica;
💰 Clube de vantagens e descontos nos melhores estabelecimentos;
🛫 Clube de viagens;
🐶 Convênio para pets.