Aktiviere Job-Benachrichtigungen per E-Mail!

Site Reliability Engineer (Intermediate level) (M / W / D) - System Engineering / Admin, Ingenieur

gridX

Aachen

Hybrid

EUR 60.000 - 85.000

Vollzeit

Vor 4 Tagen
Sei unter den ersten Bewerbenden

Erhöhe deine Chancen auf ein Interview

Erstelle einen auf die Position zugeschnittenen Lebenslauf, um deine Erfolgsquote zu erhöhen.

Zusammenfassung

Ein führendes Unternehmen im Bereich der digitalen Transformation in der Energiebranche sucht einen Cloud Infrastructure Engineer. In dieser Rolle sind Sie verantwortlich für die Verwaltung und Verbesserung der Cloud-Infrastruktur, um die Skalierbarkeit und Zuverlässigkeit der Plattform zu gewährleisten. Sie arbeiten mit modernen Technologien wie Kubernetes und Terraform und tragen aktiv zur Optimierung der Serviceplattform bei. Flexible Arbeitszeiten und zahlreiche Benefits wie 30 Tage Urlaub und Zuschüsse für Sport und Weiterbildung werden geboten.

Leistungen

Flexibles & mobiles Arbeiten: bis zu 70 Tage remote in der EU.
30 Tage Urlaub + Sonderurlaub an Weihnachten.
Zuschüsse für Sport, Gesundheitsmanagement, Weiterentwicklung.
Moderner Arbeitsplatz in Aachen und München mit IT-Equipment.
Jährliche Teamweek, Teamevents, Sabbaticals.

Qualifikationen

  • Erfahrung im Umgang mit Prinzipien des Site Reliability Engineering.
  • Kenntnisse in Hochverfügbarkeit, Skalierbarkeit und Fehlertoleranz für verteilte Software.
  • Erfahrung mit Kubernetes, auch bei größeren Clustern.
  • Umgang mit IaC-Tools, vorzugsweise Terraform.
  • Verständnis für AWS-Dienste wie EC2, EKS, Lambda, etc.
  • Sicherheitsbewusstsein und Beachtung von Best Practices.
  • Kenntnisse in modernen Programmiersprachen wie Go, Python, Java (mindestens 2 Jahre Erfahrung in einer Sprache, bevorzugt Go).
  • Erfahrung mit Monitoring-Tools wie Prometheus und Grafana.

Aufgaben

  • Verantwortlich für die kritische Cloud-Infrastruktur und Verwaltung als Code.
  • Kontinuierliche Verbesserung der Cloud-Infrastruktur.
  • Erkennung potenzieller Probleme und Verbesserung der Serviceplattform.
  • Unterstützung der Entwickler beim Betrieb ihrer Dienste in Produktion.
  • Überwachung und Anleitung bei der Einrichtung von Dashboards und Alerts.

Kenntnisse

Site Reliability Engineering
Hochverfügbarkeit
Skalierbarkeit
Fehlertoleranz
Kubernetes
Terraform
AWS-Dienste
Go
Python
Java
Monitoring-Tools

Jobbeschreibung

Do stuff that matters - werde ein Teil von gridX und trage Deinen eigenen Teil dazu bei, mit uns die Energiebranche zu digitalisieren und somit erneuerbare Energien überall zugänglich und bezahlbar zu machen.

Unser IoT-Gateway, die gridBox, ist ein zentraler Teil unserer Plattform.

Als Cloud Infrastructure Team schaffen wir die Grundlage des Erfolges und sichern die Skalierbarkeit - angefangen von ihrer Produktion bis zum eigenen Deployment-System, durch das wir neue Anwendungen in kürzester Zeit entwickeln und bei unseren Kund:innen ausrollen können. Über unsere größtenteils in Go entwickelten Tools machen wir anderen internen Teams, die mit der gridBox arbeiten, den Alltag leichter.

Deine Aufgaben:

  1. Du bist verantwortlich für unsere kritische Cloud-Infrastruktur und verwaltest diese als Code.
  2. Du möchtest Verantwortung tragen und die Cloud-Infrastruktur von gridX kontinuierlich verbessern.
  3. Du erkennst potenzielle Probleme oder Bottlenecks bereits im Vorfeld und bringst eigene Ideen ein, um unsere Serviceplattform belastbarer und zuverlässiger zu machen.
  4. Du verstehst den Wert einer "Service Ownership"-Kultur.
  5. Du unterstützt unsere Entwickler beim zuverlässigen Betrieb ihrer Dienste in Produktion, z.B. bei der Bereitstellung ihrer Anwendungen und der Interaktion mit Cloud-Diensten.
  6. Du kümmerst Dich um unser internes Monitoring für Anwendungen und Infrastruktur und leitest die Entwickler bei der Einrichtung ihrer Dashboards und Alerts an.
  7. Du verwaltest zentrale Tools wie CI/CD, Docker Base Images, um unsere Entwicklung zu beschleunigen.
  8. Du setzt Cloud Native Best Practices im Unternehmen um.
  9. Du dokumentierst alles und pflegst unsere Runbooks.

Was Du mitbringen solltest:
  1. Erfahrung im Umgang mit Prinzipien des Site Reliability Engineering.
  2. Kenntnisse in Hochverfügbarkeit, Skalierbarkeit und Fehlertoleranz für verteilte Software.
  3. Erfahrung mit Kubernetes, auch bei größeren Clustern.
  4. Umgang mit IaC-Tools, vorzugsweise Terraform.
  5. Verständnis für AWS-Dienste wie EC2, EKS, Lambda, etc.
  6. Sicherheitsbewusstsein und Beachtung von Best Practices.
  7. Kenntnisse in modernen Programmiersprachen wie Go, Python, Java (mindestens 2 Jahre Erfahrung in einer Sprache, bevorzugt Go).
  8. Erfahrung mit Monitoring-Tools wie Prometheus und Grafana.

Warum gridX?
  1. Flexibles & mobiles Arbeiten: bis zu 70 Tage remote in der EU.
  2. 30 Tage Urlaub + Sonderurlaub an Weihnachten.
  3. Zuschüsse für Sport, Gesundheitsmanagement, Weiterentwicklung, Mitarbeiterrabatte, JobRad, Altersvorsorge, ÖPNV.
  4. Moderner Arbeitsplatz in Aachen und München mit IT-Equipment.
  5. Jährliche Teamweek, Teamevents, Geburtstags-Spenden, Sabbaticals, und mehr Benefits, die bei 100% Remote abweichen können.

Über uns

Wir glauben an eine Zukunft, in der alle dezentralen Energieanlagen verbunden und optimiert sind, um das neue Energiezeitalter effizient zu gestalten! Unser interdisziplinäres Team an den Standorten in Aachen und München treibt die digitale Transformation in der Energiebranche voran. Mit unserer IoT-Plattform bringen wir Konnektivität, Analysefähigkeiten und intelligente Steuerung in dezentrale Energiesysteme. Begleite uns bei der Revolution der internationalen Energiewelt mit unserer skalierbaren IoT-Plattform!

Hol dir deinen kostenlosen, vertraulichen Lebenslauf-Check.
eine PDF-, DOC-, DOCX-, ODT- oder PAGES-Datei bis zu 5 MB per Drag & Drop ablegen.