Ativa os alertas de emprego por e-mail!

Especialista SRE com foco em Observabilidade

Ródio Tech Soluções

Teletrabalho

BRL 120.000 - 160.000

Tempo parcial

Hoje

Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia procura um(a) Especialista SRE com foco em Observabilidade. O(a) profissional será responsável por liderar a evolução da plataforma de observabilidade, gerenciar incidentes e promover boas práticas em ambientes distribuídos. O candidato ideal deve ter experiência em ferramentas como Zabbix e Dynatrace, além de habilidade em automação e monitoramento. O trabalho é 100% remoto e a contratação será no modelo PJ.

Serviços

Modelo 100% remoto

Desenvolvimento profissional

Qualificações

Experiência sólida como SRE ou engenheiro de observabilidade.
Domínio em ferramentas como Zabbix, Elastic Stack e Dynatrace.
Fluência em automação com Python, Shell Script ou Go.

Responsabilidades

Liderar a evolução da plataforma de observabilidade.
Definir e padronizar painéis e alertas para serviços críticos.
Apoiar squads na análise de performance e comportamento dos sistemas.

Conhecimentos

Observabilidade ponta a ponta

Criação de dashboards

Monitoramento de ambientes em nuvem

Automação com Python

Gestão de incidentes

Formação académica

Formação em Ciência da Computação

Engenharia ou Sistemas de Informação

Ferramentas

Zabbix

Elastic Stack

Dynatrace

AWS

Kubernetes

Estamos à procura de um(a) Especialista SRE com foco em Observabilidade, para se juntar ao nosso time de profissionais excepcionais na RÓDIO TECH. Buscamos um(a) Especialista SRE com foco em Observabilidade, com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a) profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com profundo conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas. Esperamos alguém que atue de forma estratégica, proponha padrões técnicos, eleve a maturidade dos nossos sistemas e dissemine boas práticas de visibilidade, performance e resiliência em toda a organização. O candidato ideal é colaborativo, analítico, orientado a resultados e com forte senso de dono, sempre alinhado aos valores e à visão da empresa.

Atividades a serem desenvolvidas :

Como Especialista SRE, essa pessoa será protagonista na evolução da plataforma de observabilidade da Empresa. Trará valor ao consolidar métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes. Sua atuação será decisiva para o aumento da confiabilidade dos serviços, redução de indisponibilidades, melhoria contínua da performance e apoio estratégico às áreas de tecnologia e produto. Com sua expertise, teremos uma operação mais preditiva, escalável e resiliente.

Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.
Definir, padronizar e manter painéis e alertas para serviços críticos da organização.
Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.
Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.
Atuar na gestão de incidentes : triagem, coordenação de resolução, documentação e melhoria contínua.
Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.
Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.
Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.
Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.
Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.

Principais conhecimentos :

Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace.
Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos.
Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio.
Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares.
Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).
Integração com ferramentas de alerta e resposta a incidentes : Opsgenie, PagerDuty, VictorOps.
Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell).
Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis).
Criação e manutenção de documentação operacional (runbooks, playbooks, checklists).
Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade.

Perfil acadêmico e habilidades :

Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.
Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento.
Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.
Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.
Vivência com rastreamento distribuído e integração de logs / métricas em pipelines CI / CD.
Capacidade de correlacionar dados de observabilidade com impacto no negócio.
Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).
Fluência em automação com linguagens como Python, Shell Script, Go ou similares.
Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas.
Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua.

Qualificações Desejáveis :

Certificações em observabilidade e confiabilidade : Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation.
Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry.
Experiência com Chaos Engineering e validação de resiliência.
Participação em incidentes críticos com liderança técnica na resposta.
Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.
Experiência com automação de runbooks e fluxos de resposta a incidentes.
Familiaridade com práticas de FinOps e eficiência operacional em observabilidade.
Participação em comunidades técnicas de SRE, DevOps e observabilidade.
Contribuições para ferramentas ou boas práticas open source.
Inglês técnico para leitura, escrita e participação em fóruns internacionais.

Modelo de contratação

Contrato: Pessoa Jurídica (PJ)

Modelo de atuação : Modelo : 100% Remoto

Na RÓDIO TECH, conectamos os melhores profissionais às melhores vagas. Se você se identifica com esse perfil e busca uma oportunidade desafiadora em uma empresa que valoriza o talento e a inovação, inscreva-se agora mesmo!

Obtém a tua avaliação gratuita e confidencial do currículo.

ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.