Job Description
Ein etabliertes IT-Team mit Start-up-Mentalität sucht dich: Als Site Reliability Engineer (SRE) unterstützt du den stabilen Betrieb einer unternehmenskritischen Plattform – mit modernem Stack, viel Gestaltungsspielraum und einer offenen Kultur. Du arbeitest eng mit Entwicklungsteams zusammen, bringst SRE-Prinzipien auf die Straße und hilfst dabei, operative Exzellenz neu zu definieren.
Deine Rolle:
- Du entwickelst Standards, Mechanismen und Tools zur Sicherstellung von Stabilität, Skalierbarkeit und Transparenz der Plattform.
- Du begleitest den Aufbau von SLOs/SLAs, Monitoring-Architekturen (OpenTelemetry, Grafana) und Alerting-Strukturen.
- Du bist Ansprechpartner bei Incidents, führst Post-Mortem-Analysen durch und setzt proaktiv Maßnahmen zur Verbesserung um.
- Du automatisierst Infrastrukturprozesse (Infrastructure as Code), unterstützt das Troubleshooting und betreibst systematische Ursachenanalysen.
- Du arbeitest eng mit Cloud Engineers, Test/Release, ITSM und Softwareentwicklerinnen zusammen – eingebettet in ein interdisziplinäres Plattformteam von rund 60 Kolleginnen.
Was du mitbringst:
- Abgeschlossenes Studium der Informatik oder eine vergleichbare Qualifikation.
- Mehrjährige Erfahrung in der Rolle als SRE, DevOps Engineer oder vergleichbarer Position in einem komplexen Systemumfeld.
- Fundierte Kenntnisse in Azure, Kubernetes, IaC (z. B. Terraform) und Monitoring/Logging-Tools (z. B. OpenTelemetry, Prometheus, Grafana).
- Erfahrung im Umgang mit Incidents, der Definition technischer Betriebskennzahlen (SLOs/SLAs) und in der Zusammenarbeit mit Dev-Teams.
- Ausgeprägte Hands-on-Mentalität, analytisches Denken und strukturierte Herangehensweise.
- Sehr gute Deutschkenntnisse (mind. C1) sowie die Bereitschaft, regelmäßig vor Ort in Frankfurt zu arbeiten.
Was dich erwartet:
- Hybrides Arbeitsmodell: 2–3 Tage pro Woche vor Ort, sonst flexibel remote.
- Moderne Arbeitsplätze: hochwertige Ausstattung, frische Kantine, hauseigenes Café im Herzen Frankfurts.
- Wirkungsumfeld: Verantwortung für zentrale Systeme, die täglich von über 18.000 Beratern genutzt werden.
- Teamkultur: offene Kommunikation, fachlicher Austausch, Feedbackkultur – geführt von erfahrenen Leadern mit technischer Tiefe.
- Sicherheit & Freiraum: Ein stabiles Umfeld mit Start-up-naher IT-Dynamik – keine BaFin-Regulatorik
- Zusatzleistungen: Deutschlandticket, JobRad, Wellpass, betriebliche Altersvorsorge, 30 Urlaubstage + 24. & 31.12. frei.
Bereit, Plattformverantwortung zu übernehmen und die IT-Landschaft von morgen mitzugestalten?
Dann melde dich bei uns – wir erzählen dir mehr über das Setup, die Vision und warum jetzt der perfekte Zeitpunkt für den Einstieg ist.
#SRE #Azure #Kubernetes #DevOps #Observability #HybridJob #Frankfurt #ITPlattform #StabilitätMitWirkung