Ativa os alertas de emprego por e-mail!

Senior Site Reliability Engineer (SRE)

azion

São Paulo

Híbrido

BRL 120.000 - 160.000

Tempo integral

Há 5 dias

Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em segurança digital procura um(a) Site Reliability Engineer (SRE) Sênior em São Paulo. Você garantirá a confiabilidade e escalabilidade de sistemas críticos, atuando na automação e gerenciamento de incidentes. O(a) candidato(a) ideal terá experiência em arquiteturas UNIX/Linux, monitoramento com Prometheus e Grafana, e automação com Docker e Kubernetes. Sem dúvida, uma excelente oportunidade para profissionais que desejam impactar positivamente serviços utilizados por milhões.

Serviços

Modelo de contratação CLT

Plano de saúde e odontológico

Vale-refeição e vale-alimentação

Vale-transporte sem desconto

Hackathons anuais internos

Auxílio mobilidade

Stock options

Dia de folga no aniversário

Horário de trabalho flexível

Programa Nômade

Programa de Intercâmbio internacional anual

Qualificações

Experiência prática em ambientes complexos.
Dominio técnico para lidar com incidentes críticos.
Criar automações e projetar arquiteturas resilientes.

Responsabilidades

Garantir a eficiência e resiliência dos serviços.
Atuar no ciclo de incidentes críticos.
Definir e implementar SLIs e SLOs.
Desenvolver sistemas de observabilidade.
Projetar infraestruturas distribuídas.
Implementar estratégias de recuperação de desastres.
Criar ferramentas internas para aumentar a confiabilidade.
Conduzir capacity planning e forecasting.
Promover a cultura SRE.

Conhecimentos

Arquiteturas UNIX / Linux

Monitoramento e gestão de incidentes

Definição de SLIs / SLOs

Troubleshooting de sistemas Linux

Orquestração e automação

Linguagens como Python ou Golang

Inglês intermediário

Formação académica

Formação em Tecnologia da Informação

Ferramentas

Prometheus

Grafana

Docker

Kubernetes

Terraform

Ansible

Puppet

Git

CI / CD

Sobre a Azion

Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.

Na Azion, nosso propósito é simplificar a construção de aplicações e transformar o futuro com tecnologia de ponta. Aqui, você terá a chance de se desenvolver em um ambiente inovador, ao lado de um time de alta performance, atuando em desafios reais e criando soluções que fazem a diferença.

Sobre o Cargo

Na Azion, desenvolvemos toda a nossa tecnologia de ponta a ponta e sustentamos aplicações que exigem altíssima disponibilidade, baixa latência e segurança de nível global. Buscamos um(a) Site Reliability Engineer (SRE) Sênior para atuar em sistemas distribuídos de missão crítica, garantindo confiabilidade, escalabilidade e resiliência em escala massiva.

Essa posição exige experiência prática em ambientes complexos, com domínio técnico para lidar com incidentes críticos, criar automações, projetar arquiteturas resilientes e elevar continuamente o padrão de excelência operacional.

Seu Impacto

Garantir a eficiência e resiliência dos serviços que atendem milhões de usuários, monitorando disponibilidade, latência, desempenho e capacidade;
Atuar em todo o ciclo de incidentes críticos : detecção, resposta on-call, comunicação, RCA, postmortem blameless e acompanhamento de ações corretivas.
Definir, implementar e acompanhar SLIs e SLOs, conectando métricas técnicas com objetivos de negócio;
Desenvolver e manter sistemas de observabilidade, monitoramento e alertas (métricas, logs, traces);
Projetar e operar infraestruturas distribuídas (bare metal, cloud e híbridas), com foco em performance, escalabilidade e segurança;
Implementar redundância, fault isolation e estratégias de recuperação de desastres;
Criar e evoluir a automação e ferramentas internas para reduzir toil, acelerar operações e aumentar a confiabilidade;
Conduzir capacity planning e forecasting, antecipando gargalos e assegurando crescimento sustentável;
Promover a cultura SRE (error budget, boas práticas, readiness drills, chaos engineering).

O que Esperamos de Você

Experiência sólida em arquiteturas UNIX / Linux distribuídas de alta complexidade (microservices, sistemas em camadas);
Vivência em monitoramento, on-call e gestão de incidentes, com ferramentas como Prometheus, Grafana, gestores de logs, etc;
Experiência prática em definição e acompanhamento de SLIs / SLOs e error budgets;
Conhecimentos avançados em troubleshooting de sistemas Linux, redes e protocolos (HTTP, DNS, TCP / IP);
Prática em orquestração e automação (Docker, Kubernetes, Terraform, Ansible, Puppet, Git, CI / CD);
Conhecimento em linguagens como Python ou Golang;
Inglês intermediário.

Pontos a Mais

Formação completa ou em andamento em áreas de Tecnologia da Informação;
Experiência em ambientes de missão crítica (milhões de usuários, baixa latência, alta disponibilidade);
Vivência em cloud computing (AWS, GCP, Azure) e infraestrutura como código;
Experiência com chaos engineering, DDoS mitigation ou capacity planning em larga escala;
Contribuições open source e / ou participação em comunidades técnicas de SRE;
Inglês avançado.

Benefícios & Azion Way of Life

Modelo de contratação CLT;
Plano de saúde e odontológico;
VR e VA flexível (Cartão Flash), inclusive em período de férias;
Vale-transporte sem desconto em folha;
Hackathons anuais internos;
Auxílio mobilidade (valor adicional para deslocamento);
Freestyle (incentivo para customização da estação de trabalho);
Stock options (conforme política);
Birthday day off;
TotalPass;
Horário de trabalho flexível (flexível mesmo);
Programa Nômade para trabalhar de onde quiser por até 30 dias no ano (conforme política);
Programa de Intercâmbio internacional anual.

Modelo FlexWork

Oferecemos um modelo de FlexWork que prioriza o aculturamento e a colaboração. Nos primeiros três meses, você trabalhará on-site no escritório local, uma etapa essencial para construir relacionamentos sólidos e uma conexão genuína com nossos valores e objetivos. Acreditamos que essa imersão inicial não só fortalece a equipe, mas também impulsiona a criatividade e a inovação.

Após esse período, você terá a possibilidade de aplicar para o modelo híbrido , trabalhando presencialmente pelo menos três vezes por semana. Essa abordagem equilibra a interação presencial e a autonomia, criando um ambiente de trabalho dinâmico e produtivo.

Na Azion, todas as candidaturas são bem-vindas, independentemente de gênero, orientação sexual, idade, gravidez, deficiência, etnia, cor, país de origem ou religião. Acreditamos que um ambiente inclusivo contribui para o nosso sucesso e que o respeito está presente em todas as nossas relações.

Venha fazer parte da nossa equipe! Estamos ansiosos para conhecê-lo e trilhar juntos um caminho de sucesso na tecnologia!

Obtém a tua avaliação gratuita e confidencial do currículo.

ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.