Deine Aufgaben
- Stabilität & Reliability: Du bist verantwortlich für die Aufrechterhaltung und Optimierung der Stabilität und Verfügbarkeit unserer hochverfügbaren, resilienten Storageinfrastruktur (Block-, Objekt-, Backup- und File-Storage). Dies stellst Du durch proaktives Monitoring sicher, löst aufkommende Störungen eigenverantwortlich und vermeidest deren zukünftiges Auftreten
- Automatisierung: Du automatisierst die Bereitstellungs- und Betriebsprozesse im Storage Umfeld mit dem eigenen Anspruch, jeden Tag ein bisschen besser zu werden und unsere Produkte kontinuierlich zu optimieren
- Architektur: Mit Deinem Team verantwortest Du eine robuste und effiziente Storagearchitektur – weil es Dir wichtig ist, eine langfristig stabile und zuverlässige Lösung zu bauen, die unsere Kunden gerne einsetzen
- Ende-zu-Ende-Verantwortung: Die Identifikation mit unseren Produkten, die wir unseren Kunden bereitstellen, ist uns sehr wichtig. Daher leben wir aktiv eine Ende-zu-Ende-Verantwortung und bekommen hierbei Unterstützung aus vielen internen STACKIT Service Teams zur Veredelung unserer Services
- Performance- und Kapazitätsplanung: Du analysierst und optimierst die Performance unserer Bestandssysteme im Hinblick auf zukünftige Skalierung der Landschaft. Dies beinhaltet auch eine vorausschauende Kapazitätsplanung
- Incident- und Postmortem-Analyse: Dir obliegt die Aufarbeitung von (Major) Incidents mit Storage-Beteiligung im Rahmen des Incident & Problem Management Prozesses der STACKIT mit dem Ziel, mitigierende Maßnahmen für die Zukunft abzuleiten und anschließend erfolgreich umzusetzen
Dein Profil
- Du hast Lust, etwas Großes zu bewegen und dabei die Lösung mit modernsten Cloud-Technologien maßgeblich mitzugestalten
- Du hast ausgeprägte Erfahrung im Marktumfeld mit verschiedenen Storageprodukten (z.B. NetApp, Cohesity, Pure, Ceph) im Bereich Block-, Objekt-, Backup- oder File Storage und verfügst über gute Kenntnisse mit Cloud Umgebungen und deren Architekturen
- Du bist Experte im Betrieb von Storageinfrastruktur (z.B. Lösungsszenarien, Bereitstellung, Skalierung, Migration, Incident response) und deren Automatisierung (z.B. mittels Golang/Python, Bash, Ansible)
- Du kennst Dich gut in containerisierten Systemlandschaften des Storageumfelds aus (z.B. k8s)
- Du hast Erfahrung im Monitoring, Alerting und Logging zur Sicherstellung einer lückenlosen Systemüberwachung (z.B. Prometheus, Grafana, Elasticsearch)
- Du arbeitest bereits mit APIs und entwickelst diese weiter (z.B. REST API mit Golang und Python)
- Du hast Spaß an den Herausforderungen beim Betrieb von Storage-Systemen (z.B. Protokolle, Troubleshooting, Performanceanalysen, Hochverfügbarkeit, Lifecycle)
- Du bringst Leidenschaft und Begeisterung für neue Technologien und Themen rund um verschiedene Speichersysteme mit
- Du bist gerne Teil eines motivierten Teams, das immer nach Verbesserungen strebt und sich selbst (und die Produkte) kontinuierlich weiterentwickelt
- Deine ausgezeichnete Kommunikationsfähigkeit in Deutsch und Englisch bildet die Basis für eine erfolgreiche Zusammenarbeit in internationalen, agilen Teams
Wir freuen uns auf deine Bewerbung!