Job Search and Career Advice Platform

Ativa os alertas de emprego por e-mail!

Senior Site Reliability Engineer (SRE)

azion

São Paulo

Híbrido

BRL 120.000 - 160.000

Tempo integral

Há 5 dias
Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em segurança digital procura um(a) Site Reliability Engineer (SRE) Sênior em São Paulo. Você garantirá a confiabilidade e escalabilidade de sistemas críticos, atuando na automação e gerenciamento de incidentes. O(a) candidato(a) ideal terá experiência em arquiteturas UNIX/Linux, monitoramento com Prometheus e Grafana, e automação com Docker e Kubernetes. Sem dúvida, uma excelente oportunidade para profissionais que desejam impactar positivamente serviços utilizados por milhões.

Serviços

Modelo de contratação CLT
Plano de saúde e odontológico
Vale-refeição e vale-alimentação
Vale-transporte sem desconto
Hackathons anuais internos
Auxílio mobilidade
Stock options
Dia de folga no aniversário
Horário de trabalho flexível
Programa Nômade
Programa de Intercâmbio internacional anual

Qualificações

  • Experiência prática em ambientes complexos.
  • Dominio técnico para lidar com incidentes críticos.
  • Criar automações e projetar arquiteturas resilientes.

Responsabilidades

  • Garantir a eficiência e resiliência dos serviços.
  • Atuar no ciclo de incidentes críticos.
  • Definir e implementar SLIs e SLOs.
  • Desenvolver sistemas de observabilidade.
  • Projetar infraestruturas distribuídas.
  • Implementar estratégias de recuperação de desastres.
  • Criar ferramentas internas para aumentar a confiabilidade.
  • Conduzir capacity planning e forecasting.
  • Promover a cultura SRE.

Conhecimentos

Arquiteturas UNIX / Linux
Monitoramento e gestão de incidentes
Definição de SLIs / SLOs
Troubleshooting de sistemas Linux
Orquestração e automação
Linguagens como Python ou Golang
Inglês intermediário

Formação académica

Formação em Tecnologia da Informação

Ferramentas

Prometheus
Grafana
Docker
Kubernetes
Terraform
Ansible
Puppet
Git
CI / CD
Descrição da oferta de emprego
Sobre a Azion

Somos uma empresa global de tecnologia especializada em aplicações e segurança digital. Nossa plataforma ajuda empresas a operar com mais agilidade, reduzindo o tempo de resposta e aumentando a confiabilidade de seus sistemas.

Na Azion, nosso propósito é simplificar a construção de aplicações e transformar o futuro com tecnologia de ponta. Aqui, você terá a chance de se desenvolver em um ambiente inovador, ao lado de um time de alta performance, atuando em desafios reais e criando soluções que fazem a diferença.

Sobre o Cargo

Na Azion, desenvolvemos toda a nossa tecnologia de ponta a ponta e sustentamos aplicações que exigem altíssima disponibilidade, baixa latência e segurança de nível global. Buscamos um(a) Site Reliability Engineer (SRE) Sênior para atuar em sistemas distribuídos de missão crítica, garantindo confiabilidade, escalabilidade e resiliência em escala massiva.

Essa posição exige experiência prática em ambientes complexos, com domínio técnico para lidar com incidentes críticos, criar automações, projetar arquiteturas resilientes e elevar continuamente o padrão de excelência operacional.

Seu Impacto
  • Garantir a eficiência e resiliência dos serviços que atendem milhões de usuários, monitorando disponibilidade, latência, desempenho e capacidade;
  • Atuar em todo o ciclo de incidentes críticos : detecção, resposta on-call, comunicação, RCA, postmortem blameless e acompanhamento de ações corretivas.
  • Definir, implementar e acompanhar SLIs e SLOs, conectando métricas técnicas com objetivos de negócio;
  • Desenvolver e manter sistemas de observabilidade, monitoramento e alertas (métricas, logs, traces);
  • Projetar e operar infraestruturas distribuídas (bare metal, cloud e híbridas), com foco em performance, escalabilidade e segurança;
  • Implementar redundância, fault isolation e estratégias de recuperação de desastres;
  • Criar e evoluir a automação e ferramentas internas para reduzir toil, acelerar operações e aumentar a confiabilidade;
  • Conduzir capacity planning e forecasting, antecipando gargalos e assegurando crescimento sustentável;
  • Promover a cultura SRE (error budget, boas práticas, readiness drills, chaos engineering).
O que Esperamos de Você
  • Experiência sólida em arquiteturas UNIX / Linux distribuídas de alta complexidade (microservices, sistemas em camadas);
  • Vivência em monitoramento, on-call e gestão de incidentes, com ferramentas como Prometheus, Grafana, gestores de logs, etc;
  • Experiência prática em definição e acompanhamento de SLIs / SLOs e error budgets;
  • Conhecimentos avançados em troubleshooting de sistemas Linux, redes e protocolos (HTTP, DNS, TCP / IP);
  • Prática em orquestração e automação (Docker, Kubernetes, Terraform, Ansible, Puppet, Git, CI / CD);
  • Conhecimento em linguagens como Python ou Golang;
  • Inglês intermediário.
Pontos a Mais
  • Formação completa ou em andamento em áreas de Tecnologia da Informação;
  • Experiência em ambientes de missão crítica (milhões de usuários, baixa latência, alta disponibilidade);
  • Vivência em cloud computing (AWS, GCP, Azure) e infraestrutura como código;
  • Experiência com chaos engineering, DDoS mitigation ou capacity planning em larga escala;
  • Contribuições open source e / ou participação em comunidades técnicas de SRE;
  • Inglês avançado.
Benefícios & Azion Way of Life
  • Modelo de contratação CLT;
  • Plano de saúde e odontológico;
  • VR e VA flexível (Cartão Flash), inclusive em período de férias;
  • Vale-transporte sem desconto em folha;
  • Hackathons anuais internos;
  • Auxílio mobilidade (valor adicional para deslocamento);
  • Freestyle (incentivo para customização da estação de trabalho);
  • Stock options (conforme política);
  • Birthday day off;
  • TotalPass;
  • Horário de trabalho flexível (flexível mesmo);
  • Programa Nômade para trabalhar de onde quiser por até 30 dias no ano (conforme política);
  • Programa de Intercâmbio internacional anual.
Modelo FlexWork

Oferecemos um modelo de FlexWork que prioriza o aculturamento e a colaboração. Nos primeiros três meses, você trabalhará on-site no escritório local, uma etapa essencial para construir relacionamentos sólidos e uma conexão genuína com nossos valores e objetivos. Acreditamos que essa imersão inicial não só fortalece a equipe, mas também impulsiona a criatividade e a inovação.

Após esse período, você terá a possibilidade de aplicar para o modelo híbrido , trabalhando presencialmente pelo menos três vezes por semana. Essa abordagem equilibra a interação presencial e a autonomia, criando um ambiente de trabalho dinâmico e produtivo.

Na Azion, todas as candidaturas são bem-vindas, independentemente de gênero, orientação sexual, idade, gravidez, deficiência, etnia, cor, país de origem ou religião. Acreditamos que um ambiente inclusivo contribui para o nosso sucesso e que o respeito está presente em todas as nossas relações.

Venha fazer parte da nossa equipe! Estamos ansiosos para conhecê-lo e trilhar juntos um caminho de sucesso na tecnologia!

Obtém a tua avaliação gratuita e confidencial do currículo.
ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.