Missions
- Définir et implémenter des mécanismes d?observabilité (Azure Monitor, KQL, Application Insights, Log Analytics, Container Insights) et d?alerting multi?niveaux.
- Mettre en place des dashboards et SLI / SLO / SLA pour la supervision proactive.
- Contribuer à la résilience : sauvegardes / restaurations natives Azure / AWS, DRP, tests réguliers.
- Concevoir et exécuter des scénarios de Chaos Engineering (Azure / AWS).
- Optimiser la gestion des incidents : runbooks, Status Page, webhooks Teams / Jira, post?mortem.
- Automatiser via Terraform (modules AzureRM), Ansible et pipelines CI / CD (Azure DevOps / GitHub).
- Être force de proposition pour intégrer des solutions AIOps / GenAI (observabilité, remédiation).
Profil candidat
L?ENVIRONNEMENT TECHNIQUE
- Cloud : Azure (Monitor, App Insights, Log Analytics, AKS, Data Factory, Synapse), AWS (CloudWatch), GCP (Monitoring).
- Observabilité : Azure Monitor, KQL, Prometheus, Grafana, OpenTelemetry (nice?to?have).
- IaC & DevOps : Terraform (expert), Ansible, CI / CD (Azure DevOps, GitHub).
- Langages : Python (confirmé).
- Outils incidents : Status Page, Jira, Teams webhooks.
COMPETENCES TECHNIQUES
- Expertise Azure Monitor (KQL, App Insights, Log Analytics, Container Insights).
- Maîtrise Terraform (IaC) et intégration CI / CD.
- Connaissance avancée Prometheus / Grafana, CloudWatch.
- Expérience DRP et Chaos Engineering.
SAVOIR-FAIRE
- Collaboration en équipe d?experts, communication claire (FR / EN).
- Capacité à argumenter et à challenger techniquement.
- Autonomie et proactivité.
SAVOIR-ETRE :
- Collaboration en équipe d?experts, communication claire (FR / EN).
- Capacité à argumenter et à challenger techniquement.
- Autonomie et proactivité.
Autres informations
- Certifications Azure appréciées : AZ?305 (Architect), AZ?400 (DevOps).