¡Activa las notificaciones laborales por email!

Incident Manager - Team Lead

Alcorce Telecomunicaciones S.L.

Almería

A distancia

EUR 40.000 - 60.000

Jornada completa

Hoy

Sé de los primeros/as/es en solicitar esta vacante

Descripción de la vacante

Una empresa de tecnologías de la información en Andalucía busca un Incident Manager para gestionar incidentes críticos en un entorno 100% remoto. Se requiere experiencia en administración de sistemas, herramientas de monitoreo y un alto nivel de inglés. Los candidatos deben tener excelentes habilidades de resolución de problemas y capacidad para trabajar bajo presión.

Formación

Experiencia sólida en administración de sistemas (Linux / Windows) y prácticas de Site Reliability Engineering (SRE) en entornos cloud.
Conocimiento profundo en herramientas de monitoreo y registro.
Dominio en gestión de incidentes y liderazgo en recuperación ante caídas de infraestructura.
Excelentes habilidades de resolución de problemas.
Nivel alto de inglés; habilidades de presentación efectivas.

Responsabilidades

Liderar la gestión de incidentes críticos de infraestructura y servicios.
Supervisar la operación de cargas de trabajo empresariales en la nube.
Analizar, resolver y documentar incidentes complejos en entornos de alta presión.
Monitorear el rendimiento de sistemas mediante herramientas de observabilidad.
Comunicar con las partes interesadas y elaborar informes de incidentes.

Conocimientos

Administración de sistemas (Linux / Windows)

Prácticas de Site Reliability Engineering (SRE)

Herramientas de monitoreo (Dynatrace, CloudWatch, OpenSearch)

Gestión de incidentes

Resolución de problemas

Inglés alto

Suite Office 365

Desde Alcorce Telecomunicaciones, empresa con más de 15 años de experiencia en el Sector IT, buscamos un / a Incident Manager con nivel de ingles alto para uno de nuestros principales proyectos internacionales en modalidad 100% remoto.

Funciones principales :

Liderar la gestión de incidentes críticos de infraestructura y servicios, coordinando la respuesta, recuperación y prevención de recurrencias.
Supervisar la operación de cargas de trabajo empresariales en la nube, garantizando su confiabilidad, disponibilidad y escalabilidad.
Analizar, resolver y documentar incidentes complejos en entornos de alta presión, asegurando la mínima interrupción del servicio.
Monitorear el rendimiento de sistemas mediante herramientas de observabilidad (Dynatrace, CloudWatch, OpenSearch, etc.) para detectar y prevenir degradaciones.
Comunicar eficazmente con las partes interesadas, incluyendo altos directivos, elaborando informes de incidentes, análisis de causa raíz y métricas operativas.

Requisitos técnicos y habilidades :

Experiencia sólida en administración de sistemas (Linux / Windows) y prácticas de Site Reliability Engineering (SRE) en entornos cloud.
Conocimiento profundo en herramientas de monitoreo y registro (Dynatrace, CloudWatch, OpenSearch u otras similares).
Dominio en gestión de incidentes y control de cambios, incluyendo liderazgo en la recuperación ante caídas de infraestructura.
Excelentes habilidades de resolución de problemas y capacidad para diagnosticar sistemas complejos bajo presión.
Nivel alto de inglés; conocimiento en la suite Office 365 y habilidades de presentación efectivas.

¡Si te interesa la oportunidad no dudes en apuntarte!

Consigue la evaluación confidencial y gratuita de tu currículum.

o arrastra un archivo en formato PDF, DOC, DOCX, ODT o PAGES de hasta 5 MB.