
Ativa os alertas de emprego por e-mail!
Cria um currículo personalizado em poucos minutos
Consegue uma entrevista e ganha mais. Sabe mais
Uma empresa de jogos de entretenimento em Recife está em busca de um Site Reliability Engineer (SRE) Pleno/Senior para garantir a confiabilidade de suas plataformas. Serão suas responsabilidades garantir alta disponibilidade, trabalhar com equipes de desenvolvimento e implementar práticas ágeis em ambientes de nuvem. Oferecemos um ambiente que valoriza aprendizado e inovação, com oportunidades de crescimento em projetos de impacto global.
A BSAtech é uma empresa especializada no desenvolvimento de jogos de entretenimento com alcance global.
Nosso compromisso é entregar experiências digitais de alta qualidade, combinando inovação, criatividade e tecnologia.
Estamos em um momento de expansão e buscamos profissionais excepcionais para nos ajudar a ampliar nossas áreas de negócio e continuar revolucionando o mercado de entretenimento digital.
Vaga 100% presencial para Recife / PE.
SRE Estamos em busca de um Site Reliability Engineer (SRE) Pleno / Senior para garantir a confiabilidade, escalabilidade e performance das nossas plataformas e sistemas.
Esse profissional será responsável por criar soluções para melhorar a disponibilidade e a resiliência da nossa infraestrutura e sistemas em produção, além de colaborar com as equipes de desenvolvimento e operações para garantir a entrega contínua de alta qualidade.
Trabalhamos com tecnologias modernas como Azure Cloud, containers Docker, monitoramento com Grafana / Prometheus e desenvolvimento em Python.
Nossa infraestrutura é híbrida, operando em ambientes Linux e Windows.
Garantir a alta disponibilidade, confiabilidade e escalabilidade dos sistemas em produção.
Trabalhar com a equipe de desenvolvimento para projetar, implementar e monitorar soluções resilientes e escaláveis.
Implementar e manter práticas de SLIs (Service Level Indicators), SLOs (Service Level Objectives) e SLAs (Service Level Agreements) para medir e melhorar a confiabilidade dos sistemas.
Automatizar processos de monitoramento, alertas e escalabilidade para garantir respostas rápidas a incidentes.
Gerenciar incidentes e trabalhar para minimizar o tempo de inatividade e mitigar riscos em ambientes de produção.
Implementar práticas de Chaos Engineering para testar a resiliência dos sistemas e promover a melhoria contínua.
Trabalhar com ferramentas de automação e infraestrutura como código (Terraform, Ansible, etc.) para provisionamento e gerenciamento de ambientes.
Otimizar e melhorar o desempenho das aplicações e da infraestrutura de maneira contínua.
Realizar revisão post-mortem após incidentes, analisando falhas e implementando soluções para evitar recorrências.
Colaborar com as equipes de segurança para garantir a proteção dos sistemas e dados em todas as fases do ciclo de vida.
Participar de revisões de arquitetura e infraestrutura, sugerindo melhorias para a escalabilidade e segurança.
Trabalhar em ambientes de nuvem (AWS, GCP, Azure) e com plataformas de containers como Docker e Kubernetes.
Domínio avançado de sistemas operacionais : Linux (tuning e otimização) Windows Server (administração avançada) Expertise em monitoramento e observabilidade : Grafana (desenvolvimento de dashboards complexos) Prometheus (configuração avançada e otimização) Definição e implementação de SLOs / SLIs Error budgets Experiência avançada com containers : Docker e Kubernetes Otimização de imagens e segurança Troubleshooting avançado Proficiência em desenvolvimento : Python para automação e ferramentas APIs e integrações Experiencia com gerenciamento de banco de dados Experiência sólida com Git, Github e estratégias de branching Conhecimento avançado de arquitetura de sistemas Experiência com análise de performance Expertise em práticas de reliability Conhecimento de arquiteturas distribuídas Experiência com gestão de incidentes críticos Diferenciais : Excelente capacidade de comunicação, sabendo transmitir informações técnicas complexas de forma clara Habilidade para trabalhar em equipe e colaborar com diferentes áreas Capacidade analítica e pensamento estruturado para resolução de problemas Organização e documentação clara das soluções implementadas Proatividade para identificar e propor melhorias nos processos Resiliência para lidar com situações de pressão e incidentes Autonomia na busca por soluções e novos conhecimentos Mentalidade de melhoria contínua Capacidade de priorização e gestão do tempo Adaptabilidade para lidar com mudanças tecnológicas e de processo Empatia e bom relacionamento interpessoal Comprometimento com qualidade e boas práticas Habilidade para compartilhar conhecimento com a equipe Capacidade de mentoria técnica Habilidade para liderar discussões técnicas Visão sistêmica para propor soluções arquiteturais
O que oferecemos : Uma cultura que valoriza aprendizado, inovação e colaboração.
Oportunidades reais de crescimento profissional.
Possibilidade de atuar em projetos de impacto global e com tecnologias inovadoras.
Faça parte de um time que transforma ideias em experiências memoráveis!