¿Te gustaría
- proteger y aportar seguridad
- con tu próximo reto profesional de la mano de la mejor tecnología
- IA y Machine Learning
- Esto es lo que hace nuestro partner, pero con la
- identidad
- de personas, documentos críticos y otros muchos puntos de alta complejidad.
Ahora puedes formar parte de un exitoso crecimiento como
- Application Operations Manager (Cloud / DevOps)
- para liderar nuestro equipo global de Operaciones de Aplicaciones
El equipo de Operaciones de Aplicaciones es
- responsable de garantizar que los productos SaaS de nuestro partner
- orientados al cliente cumplan con sus altos estándares de fiabilidad y disponibilidad.
Tu contribución será la clave del éxito del
- equipo de App Ops
- siendo responsable de su desarrollo y hoja de ruta.
Tendrás la oportunidad de construir
- proyectos de automatización de la infraestructura, mejorar las habilidades en la nube
- unirte a un equipo altamente colaborativo y familiarizarte con la
- nube y los sistemas de monitorización a gran escala
¿Qué harás?
- Formar y orientar, en un papel de entrenador / jugador, a un equipo
- de primeros especialistas en Operaciones de Aplicaciones e ingenieros de sistemas (Ingenieros de Operaciones de Aplicaciones).
- Escalar los incidentes y problemas, y asumir la propiedad del proceso de escalado, a otros equipos internos.
- Desarrollar una hoja de ruta
- para la tecnología y los procesos relacionados con la gestión de plataformas SaaS en la nube
- Implementar, modificar y ajustar la monitorización de aplicaciones y la infraestructura de la nube en colaboración con Cloud Engineering o Software Engineering
- Crear / desarrollar la automatización o los procedimientos para abordar los incidentes o las solicitudes
- propietario del ciclo de vida
- de la Gestión de Incidentes durante y después de los mismos, incluyendo la gestión de la sala de guerra.
- Realizar despliegues de producción y actualizaciones del sistema.
- Supervisar los sistemas y las aplicaciones para identificar proactivamente los problemas y realizar comprobaciones periódicas de la salud.
- Comunicar las actualizaciones de la gestión de problemas e incidentes a los usuarios empresariales afectados, incluyendo las medidas adoptadas para resolverlos.
- Mantener una base de conocimientos de acciones comunes de resolución y recuperación para todos los sistemas y aplicaciones críticos.
- Medir e informar sobre las métricas de producción, incluido el "tiempo de actividad", pero sin limitarse a utilizar las métricas y los acuerdos de nivel de servicio para cada área tecnológica mensualmente.
- Proporcionar apoyo para el análisis de la causa raíz y el análisis preventivo de los incidentes.
- Desarrollo de documentos de formación y tutoriales.
- Comunicar las actualizaciones de la gestión de problemas e incidentes a los usuarios de negocio afectados, incluyendo las medidas adoptadas para resolverlos.
Requisitos mínimos
- Licenciatura en Ciencias de la Computación, Ingeniería, Tecnología de la Información, o campo relacionado preferido.
- Conocimientos, destrezas y habilidades adquiridos normalmente entre 5-8 años de experiencia en TI / Desarrollo, incluso en un Centro de Operaciones de Red.
- Experiencia de liderazgo como jefe / a de equipo técnico o gerente de un equipo de operaciones.
- Conocimiento de la gestión de cambios de software, la gestión de incidentes de producción, la gestión de problemas, la supervisión de sistemas y aplicaciones y el registro.
- Conocimiento profundo de la supervisión de cargas de trabajo de producción de Windows y Linux en un entorno de nube.
- Experiencia probada con la monitorización / alerta de la salud del sistema y la aplicación como Grafana, Zabbix, ElasticSearch, Nagios y Kibana.
- Sólida experiencia en lenguajes de scripting como Bash, Python o PowerShell.
- Sólidas habilidades de documentación respecto a problemas del sistema, pasos de solución, resolución y comunicación con las partes interesadas.
- Éxito demostrado trabajando en un entorno altamente colaborativo.
- Fuerte predisposición a la acción y a la propiedad de los problemas de los clientes.
- Disponibilidad para trabajar en horarios flexibles, incluyendo turnos nocturnos y/o rotativos, y para formar parte de una rotación de guardia.
- Excelentes habilidades de comunicación escrita y verbal en inglés.
¿Qué sería bueno tener?
- Conocimiento de conceptos básicos de red y enrutamiento.
- Conocimientos en tecnologías de proveedores de servicios en la nube como AWS (se prefieren certificaciones, pero no son requeridas).
- Sólidos conocimientos en trabajo con API's REST y resolución de problemas.
- Experiencia probada con Kanban u otros procesos ágiles.
- Fuerte conocimiento de contenedores y tecnologías sin servidor.