Job Search and Career Advice Platform

Ativa os alertas de emprego por e-mail!

Consultor Sre Com Foco Em Observabilidade

Ródio Tech Soluções

Teletrabalho

BRL 120.000 - 160.000

Tempo integral

Hoje
Torna-te num dos primeiros candidatos

Cria um currículo personalizado em poucos minutos

Consegue uma entrevista e ganha mais. Sabe mais

Resumo da oferta

Uma empresa de tecnologia em Minas Gerais procura um(a) Especialista SRE focado em Observabilidade. O(a) profissional ideal tem sólida experiência em engenharia de confiabilidade e automação de processos. Com domínio de ferramentas como Zabbix e Dynatrace, o(a) candidato(a) será responsável por liderar a implementação de soluções robustas para monitoramento e gestão de incidentes críticos. A posição oferece contrato PJ e modelo de trabalho 100% remoto.

Qualificações

  • Sólida experiência em engenharia de confiabilidade e gestão de incidentes críticos.
  • Domínio técnico em ferramentas de monitoramento de ambientes distribuídos.
  • Experiência em automação de processos operacionais.

Responsabilidades

  • Liderar a implementação da plataforma de observabilidade.
  • Definir e manter painéis e alertas para serviços críticos.
  • Gerenciar incidentes e coordenar a resolução de problemas.

Conhecimentos

Observabilidade ponta a ponta
Zabbix
Elastic Stack
Dynatrace
Automação com Python
Kubernetes

Formação académica

Formação em Ciência da Computação
Engenharia
Sistemas de Informação

Ferramentas

Zabbix
Elastic Stack
Dynatrace
OpenTelemetry
Docker
AWS
Azure
Descrição da oferta de emprego

Estamos à procura de um(a) Especialista SRE com foco em Observabilidade, para se juntar ao nosso time de profissionais excepcionais na RÓDIO TECH.

Buscamos um(a) Especialista SRE com foco em Observabilidade, com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a) profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com profundo conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas. Esperamos alguém que atue de forma estratégica, proponha padrões técnicos, eleve a maturidade dos nossos sistemas e dissemine boas práticas de visibilidade, performance e resiliência em toda a organização. O candidato ideal é colaborativo, analítico, orientado a resultados e com forte senso de dono, sempre alinhado aos valores e à visão da empresa.

Atividades a serem desenvolvidas :

Como Especialista SRE, essa pessoa será protagonista na evolução da plataforma de observabilidade da Empresa. Trará valor ao consolidar métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes. Sua atuação será decisiva para o aumento da confiabilidade dos serviços, redução de indisponibilidades, melhoria contínua da performance e apoio estratégico às áreas de tecnologia e produto. Com sua expertise, teremos uma operação mais preditiva, escalável e resiliente.

  • Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.
  • Definir, padronizar e manter painéis e alertas para serviços críticos da organização.
  • Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.
  • Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.
  • Atuar na gestão de incidentes : triagem, coordenação de resolução, documentação e melhoria contínua.
  • Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.
  • Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.
  • Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.
  • Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.
  • Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.
Principais conhecimentos :
  • Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace.
  • Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos.
  • Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio.
  • Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares.
  • Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).
  • Integração com ferramentas de alerta e resposta a incidentes : Opsgenie, PagerDuty, VictorOps.
  • Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell).
  • Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis).
  • Criação e manutenção de documentação operacional (runbooks, playbooks, checklists).
  • Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade.
Perfil acadêmico e habilidades :
  • Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.
  • Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento.
  • Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.
  • Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.
  • Vivência com rastreamento distribuído e integração de logs / métricas em pipelines CI / CD.
  • Capacidade de correlacionar dados de observabilidade com impacto no negócio.
  • Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).
  • Fluência em automação com linguagens como Python, Shell Script, Go ou similares.
  • Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas.
  • Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua.
Qualificações Desejáveis :
  • Certificações em observabilidade e confiabilidade : Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation.
  • Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry.
  • Experiência com Chaos Engineering e validação de resiliência.
  • Participação em incidentes críticos com liderança técnica na resposta.
  • Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.
  • Experiência com automação de runbooks e fluxos de resposta a incidentes.
  • Familiaridade com práticas de FinOps e eficiência operacional em observabilidade.
  • Participação em comunidades técnicas de SRE, DevOps e observabilidade.
  • Contribuições para ferramentas ou boas práticas open source.
  • Inglês técnico para leitura, escrita e participação em fóruns internacionais.
Modelo de contratação :
  • Contrato : Pessoa Jurídica (PJ)
Modelo de atuação :
  • Modelo : 100% Remoto

Na RÓDIO TECH, conectamos os melhores profissionais às melhores vagas. Se você se identifica com esse perfil e busca uma oportunidade desafiadora em uma empresa que valoriza o talento e a inovação, inscreva-se agora mesmo!

Obtém a tua avaliação gratuita e confidencial do currículo.
ou arrasta um ficheiro em formato PDF, DOC, DOCX, ODT ou PAGES até 5 MB.