Resumo da posição
Principais responsabilidades
- Liderança técnica da plataforma de monitoramento ponta a ponta (métricas, logs e alertas), definindo padrões, SLAs / SLOs, runbooks e melhores práticas.
- Desenhar, implantar e otimizar monitoramento de servidores, aplicações, redes e serviços críticos (incluindo dependências e checks sintéticos).
- Atuar como último nível (N3) em incidentes de alta complexidade, realizando troubleshooting avançado e coordenação técnica em war rooms.
- Mentorar e capacitar N1 e N2 (guides, playbooks, lab sessions), reduzindo MTTR e aumentando taxa de resolução no primeiro contato.
- Administrar e endurecer ambientes Microsoft (Windows Server, AD, GPO, DNS, DHCP, IIS, SQL Server) com foco em segurança e performance.
- Planejar e suportar redes Enterprise (L2 / L3, VLANs, roteamento, VPNs, Wi-Fi corporativa, balanceamento e firewalls), com ênfase em hardening e alta disponibilidade.
- Governança de patches, backup e DR (planejamento, testes periódicos, documentação e melhoria contínua).
- Automação e IaC para tarefas recorrentes (scripts, pipelines, templates) e integração do monitoramento ao ciclo de mudanças.
- Documentar arquitetura, procedimentos operacionais, diagramas e runbooks; manter CMDB / Inventário atualizados.
- Colaborar com Segurança / Redes / Aplicações na prevenção de incidentes, revisão de mudanças e análise pós-incidente (postmortem / RCA).
Escopo técnico (stack alvo)
- Monitoramento e Observabilidade : Zabbix, Prometheus / VictoriaMetrics, Alertmanager / VMAlert, Grafana; coleta de logs (ELK / EFK), syslog; health checks e sintéticos.
- Firewalls e Segurança de Borda : Fortinet, Ubiquiti, Cisco, Aruba, Sophos (e afins); políticas, NAT, VPN (IPsec / SSL), IDS / IPS, segmentação.
- Windows Microsoft : Windows Server , AD, GPO, DNS / DHCP, IIS, SQL Server (administração, tuning, backup / restore).
- Backup Disaster Recovery : Acronis / Veeam / Commvault, políticas de retenção, testes de restauração e DR runbooks.
- Virtualização Hypervisors : VMware vSphere / ESXi, Hyper‑V, KVM / libvirt (desejável Proxmox); HA / DRS, templates, hotfix / patching.
- Redes Enterprise : Switching / roteamento (VLANs, STP, LACP), balanceadores (NGINX / HAProxy), Wi‑Fi corporativa, QoS.
- Automação / Scripting : PowerShell, Ansible (desejável Python); integração com APIs dos vendors e do stack de monitoramento.
- Nuvem / Híbrido (desejável) : Integrações em Azure / AWS (VPNs, rotas, identidade, monitoramento e logging gerenciado).
- Sistemas Linux (desejável) : Administração intermediária para serviços de rede, agentes e exporters.
Requisitos
Formação
Graduação completa em Ciência / Engenharia da Computação, Sistemas de Informação ou áreas correlatas.
Experiência
- 5+ anos em Infraestrutura de TI com foco em ambientes empresariais, redes e Microsoft.
- Vivência com operações 24×7, SLAs, gestão de mudanças (ITIL) e postmortems / RCA.
Conhecimentos essenciais
- Administração avançada de Windows Server / AD / GPO / DNS / DHCP / IIS.
- Monitoramento corporativo (Zabbix / Prometheus / VictoriaMetrics, Grafana) e coleta de logs (ELK / EFK / syslog).
- Redes TCP / IP avançadas, switching / roteamento, VPNs, firewalls (Fortinet / Ubiquiti / Cisco / Aruba / Sophos).
- Backup DR (Acronis, Veeam, CrashPlan ou similares) com testes regulares de recuperação.
- Virtualização (VMware / ESXi, Hyper‑V, KVM / libvirt).
- Scripting / Automação (PowerShell, Ansible) e documentação clara (diagramas / runbooks).
Desejáveis
- Linux (administração intermediária), containers básicos (Docker)
- Cloud (Azure / AWS / GCP) e identidade híbrida.
- Ferramentas de endpoint / patching (SCCM / Intune / WSUS).
- Experiência com balanceadores, NAC / X e segmentação avançada.
Perfil
- Liderança técnica, colaboração e didática com N1 / N2.
- Comunicação objetiva e foco em redução de MTTR e ruído de alertas.
- Mentalidade de engenharia de confiabilidade (SLOs, erro orçado, automação antes de escala).
- Proatividade, ownership e atenção a detalhes de segurança.
Modelo de atuação
- Participação em war rooms e, quando necessário, plantões e janelas de manutenção.
- Definição de padrões, revisão técnica de mudanças e apoio a auditorias / controles.
- Trilha de carreira com possibilidade de migração para coordenação / gestão.
O que oferecemos
- Ambiente colaborativo com autonomia técnica e impacto real.
- Participação em projetos estratégicos de alta criticidade.
- Oportunidade de crescimento técnico e evolução para liderança formal.
- Pacote de benefícios competitivo.