Ativa os alertas de emprego por e-mail!

SRE – Senior Site Reliability Engineer

K2 Solutions

São Paulo

Híbrido

BRL 160.000 - 200.000

Tempo integral

Ontem

Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em São Paulo está à procura de um(a) SRE – Senior Site Reliability Engineer para atuar em um ambiente híbrido. O profissional será responsável por definir e monitorar SLOs, implementar stacks de observabilidade e automatizar tarefas operacionais. É necessário ter mais de 5 anos de experiência e sólida compreensão de AWS, Kafka e ferramentas de observabilidade. A empresa oferece um ambiente colaborativo e dinâmico, com a possibilidade de trabalho remoto em meio turno de expediente.

Serviços

Contratação via cooperativa

Ambiente de trabalho dinâmico

Qualificações

5+ anos de experiência em funções de Site Reliability, DevOps ou Engenharia de Produção.
Disponibilidade para trabalhar em turnos noturnos e cobrir turnos durante períodos de alta demanda.
Fluência em inglês (falado e escrito) é um diferencial.

Responsabilidades

Definir, implementar e monitorar SLOs, SLIs e error budgets.
Construir e manter stacks de observabilidade.
Automatizar tarefas operacionais com IaC e pipelines de CI/CD.
Colaborar com infraestruturas para otimizar desempenho.
Gerir sistemas baseados em Kafka.

Conhecimentos

AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC)

Ferramentas de observabilidade (NewRelic, Grafana, Prometheus, ElasticSearch, Kibana)

Terraform

Docker

Kubernetes

Kafka

CI/CD

Sistemas distribuídos

Redes

Formação académica

Graduação em Ciência da Computação ou Engenharia

SRE – Senior Site Reliability Engineer K2 Solutions•São Paulo - SP

Descrição da vaga

Trabalho híbrido na região de Pinheiros/ SP – 3x por semana no escritório

Responsabilidades

Definir, implementar e monitorar Service Level Objectives (SLOs), SLIs e error budgets em serviços principais.
Construir e manter stacks de observabilidade usando NewRelic (ou outras ferramentas) para garantir visibilidade completa da saúde dos sistemas.
Automatizar tarefas operacionais por meio de infraestrutura como código (IaC) e pipelines de CI/CD.
Colaborar com os times de Infraestrutura e DBA para otimizar desempenho e melhorar a tolerância a falhas.
Desenvolver processos de resposta a incidentes, runbooks e postmortems para aprimorar a confiabilidade dos sistemas.
Gerenciar e ajustar sistemas baseados em Kafka, garantindo alta taxa de transferência e baixa latência.
Participar de planejamento de capacidade, testes de carga e estratégias de escalabilidade para cenários de alta demanda.
Melhorar continuamente os pipelines de deploy, monitoramento e procedimentos de recuperação.
Fornecer mentoria técnica e orientar os times de engenharia nas melhores práticas de confiabilidade.

Requisitos

Graduação em Ciência da Computação, Engenharia ou experiência equivalente.
5+ anos de experiência em funções de Site Reliability, DevOps ou Engenharia de Produção.
Conhecimento sólido em AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC).
Forte domínio de ferramentas de observabilidade NewRelic, Grafana, Prometheus, ElasticSearch, Kibana).
Experiência na manutenção de sistemas orientados a eventos com Kafka.
Familiaridade com Terraform, Docker e/ou Kubernetes para automação e deploy.
Experiência na construção e manutenção de pipelines de CI/CD.
Sólida compreensão de sistemas distribuídos, redes e otimização de desempenho.
Disponibilidade para trabalhar em turnos noturnos (escala de plantão).
Disponibilidade para cobrir turnos de trabalho durante períodos de alta demanda e suporte técnico (escalas de plantão).
Disponibilidade para trabalhar horas extras remuneradas, caso seja necessário resolver um problema técnico.

Diferenciais

Experiência com frameworks de gerenciamento de incidentes.
Conhecimento em práticas de confiabilidade de banco de dados e colaboração com times de DBA.
Familiaridade com segurança, compliance e auditoria em ambientes em nuvem.
Entendimento de otimização de custos e engenharia de performance na AWS.
Fluência em inglês (falado e escrito).

Empresa de Tecnologia

Contratação via cooperativa

Obtém a tua avaliação gratuita e confidencial do currículo.

ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.

Melhores cidades

Melhores empresas

Ofertas populares