Desde Alcorce Telecomunicaciones, empresa con más de 15 años de experiencia en el Sector IT, buscamos un / a Incident Manager con nivel de ingles alto para uno de nuestros principales proyectos internacionales en modalidad 100% remoto.
Funciones principales :
- Liderar la gestión de incidentes críticos de infraestructura y servicios, coordinando la respuesta, recuperación y prevención de recurrencias.
- Supervisar la operación de cargas de trabajo empresariales en la nube, garantizando su confiabilidad, disponibilidad y escalabilidad.
- Analizar, resolver y documentar incidentes complejos en entornos de alta presión, asegurando la mínima interrupción del servicio.
- Monitorear el rendimiento de sistemas mediante herramientas de observabilidad (Dynatrace, CloudWatch, OpenSearch, etc.) para detectar y prevenir degradaciones.
- Comunicar eficazmente con las partes interesadas, incluyendo altos directivos, elaborando informes de incidentes, análisis de causa raíz y métricas operativas.
Requisitos técnicos y habilidades :
- Experiencia sólida en administración de sistemas (Linux / Windows) y prácticas de Site Reliability Engineering (SRE) en entornos cloud.
- Conocimiento profundo en herramientas de monitoreo y registro (Dynatrace, CloudWatch, OpenSearch u otras similares).
- Dominio en gestión de incidentes y control de cambios, incluyendo liderazgo en la recuperación ante caídas de infraestructura.
- Excelentes habilidades de resolución de problemas y capacidad para diagnosticar sistemas complejos bajo presión.
- Nivel alto de inglés; conocimiento en la suite Office 365 y habilidades de presentación efectivas.
¡Si te interesa la oportunidad no dudes en apuntarte!