Site Reliability Manager (m / w / d)

Sei unter den ersten Bewerbenden.
Nur für registrierte Mitglieder
Frankfurt
EUR 60.000 - 90.000
Sei unter den ersten Bewerbenden.
Vor 4 Tagen
Jobbeschreibung

Intro Fokus auf SRE‑Prinzipien : SLIs / SLOs, Fehlerbudgets, Automatisierung Betreuung von Cloud- & On-Prem-Umgebungen inkl. Kubernetes & IaC Firmenprofil Der Mandant ist Teil einer dynamischen Unternehmensgruppe, die technologisch führend unterwegs ist. Seine IT-Infrastruktur ist kein Alibi-Projekt, sondern Business-Enabler : Hybrid-Cloud-Lösungen, Kubernetes‑Cluster, CI / CD‑Pipelines und Monitoring‑Stacks mit SLO‑Alignment sind hier gelebte Praxis. Das IT-Team ist klein, agil und interdisziplinär - mit flachen Hierarchien, Hands-on-Mentalität und viel Gestaltungsspielraum. Auf On‑Premises‑Systeme folgt die Cloud‑Evolution; Altsysteme werden modernisiert, automatisiert und verschmolzen mit neuen Tool‑Landscapes. Kultur? Offen, innovativ und stärkenfokussiert. Du bist nicht nur Dienstleister, sondern Mitgestalter. Entscheidungen werden gemeinsam besprochen und zügig umgesetzt - vom Chaos‑Engineering‑Experiment bis zur letzten Pipeline‑Optimierung. Flexible Arbeitsmodelle mit Remote‑Option, moderne Büros und maßgeschneiderte Weiterbildung gehören zum Paket. Hier kannst du nicht nur die Betriebsstabilität sichern, sondern Infrastruktur neu denken - von Monitoring über Security bis hin zu Self‑Healing‑Mechanismen. Aufgabengebiet Betrieb, Monitoring und Skalierung von Kubernetes‑Clustern sowie Cloud‑Infrastruktur (AWS, Azure oder GCP) Automatisierung repetitiver Prozesse via Terraform, Ansible, Pulumi o. ä. Aufbau und Weiterentwicklung von CI / CD‑Pipelines Definition & Tracking von SLIs / SLOs, Umgang mit Fehlerbudgets Incident‑Management und Post‑Mortem‑Analyse Implementierung von Observability mit Tools wie Prometheus, Grafana, ELK, OpenTelemetry Einführung von Self‑Healing- und Chaos‑Engineering‑Methoden Enge Zusammenarbeit mit Entwicklern, Architekten & Security‑Teams für skalierbare und sichere Lösungen Anforderungsprofil Abgeschlossenes Studium (Informatik, Software‑Engineering o. Ä.) oder vergleichbare Qualifikation Mehrjährige Berufserfahrung als SRE, DevOps Engineer oder vergleichbar Tiefes Verständnis für Linux, Container-Technologien (Docker, Kubernetes) Praxiserfahrung mit Cloud‑Plattformen und Infrastructure as Code Erfahrung im Aufbau von Monitoring und Ausfallsicherheits‑Strategien Kenntnisse in einer Scriptsprache (Python, Go oder Bash) Analytisch, proaktiv, empathisch und kommunikativ Du arbeitest strukturiert, teamorientiert und fühlst dich in agilen Abläufen wohl Vergütungspaket Mandant, der IT als strategische Stärke betrachtet, nicht als Kostenfaktor Hohe Autonomie, klare Verantwortungsbereiche und aktiver Gestaltungsspielraum Flexible Arbeitsmodelle : Remote‑Option, Gleitzeit, Home‑Office Regelmäßige Weiterbildung, Zertifizierungsmöglichkeiten (z. B. CKA, Terraform Associate) Modern ausgestattetes Arbeitsumfeld mit Top-Tools Kollegiale Atmosphäre mit flachen Hierarchien Attraktives Vergütungspaket + Bonusmodelle unbefristete Festanstellung bei meinem Mandanten u.v.m. Kontakt Patrick Schüssler Referenznummer JN-062025-6762262 Beraterkontakt +49 1622001865

Jobalert für diese Suche erstellen