Westhouse ist eines der führenden internationalen Recruitment Unternehmen für die Vermittlung von hochqualifizierten Fachexperten in Bereichen wie IT Life Cycle, SAP, Engineering, Kaufmännischem und Fachberatung.
Für unseren Kunden suchen wir aktuell eine/n
Senior Kafka Architect in the Product Cluster Grid Asset (m/w/d) - 95% Remote, 5% Berlin
Rahmeninformationen
- Referenz: 176886
- Start: 2026-01-19
- Dauer: bis: 19.06.2026+Option auf Verlängerung
- Standort: 95% Remote, 5% Berlin
- Arbeitsumfang: full-time
- Sprachen: Deutsch und Englisch
Ihre Qualifikationen
- Bitte nur bewerben, wenn Sie alle Must haves erfüllen!
- Must-have:
- mind. 5 Jahre Erfahrung als DevOps Engineer UND 3 Jahre als Kafka-Architekt
- Kafka - Backup-, Restore- und Disaster-Recovery-Verfahren (z. B. MirrorMaker 2, Cluster Replication)
- sehr gute Kenntnisse in Kafka Hochverfügbarkeitsumgebungen
- Operationalisierung von Apache Kafka als Kerntechnologie
- umfangreiches Know-How in Deployments mit ArgoCD und Helm
- sehr gute Erfahrungen mit Microservices und Containerorchestration
- sehr gute Deutschkenntnisse und English C1
- Nice to have:
- Tiefgehende Kenntnisse in der Architektur von Apache Kafka (Broker, Controller/KRaft, Topics, Partitionen, Replikation)
- Kenntnisse in Performance-Tuning, Kapazitätsplanung und Troubleshooting
- Erfahrung mit Sicherheitskonzepten (TLS, Authentifizierung, Autorisierung, ACLs/RBAC)
- Nachweisliche Erfahrung im Betrieb von Apache Kafka auf Kubernetes
- Kenntnisse gängiger Kafka-Operatoren (z. B. Strimzi, Confluent Operator)
- Erfahrung mit StatefulSets, Persistent Volumes, Storage-Klassen und Netzwerk-Policies
- Fundierte Kenntnisse von Kubernetes-Architektur und -Betrieb (Pods, Nodes, Scheduling, Networking)
- Erfahrung mit Hochverfügbarkeits- und Multi-Zonen-Setups
- Erfahrung in der Erstellung von Betriebskonzepten und Runbooks
- Erfahrung in technischer Beratung und Architekturdesign
- Fähigkeit zur Analyse bestehender Umgebungen und zur Entwicklung tragfähiger Zielarchitekturen
Ihre Aufgaben
- Optimierung der Kafka-Architektur
- Analyse der bestehenden Kafka-Cluster-Architektur, einschließlich Topologie, Broker-Konfiguration, Replikationsfaktoren und Netzwerkdesign
- Identifikation von Architektur- und Performance-Schwachstellen
- Erarbeitung von Optimierungsvorschlägen hinsichtlich Skalierbarkeit, Sicherheit, Ausfallsicherheit, Resiliency, Latenz, Durchsatz und Betriebssicherheit
- Ableitung konkreter Architektur- und Konfigurationsempfehlungen
- Dokumentation der Zielarchitektur und Migrationspfade
- Definition von Verfügbarkeitsanforderungen (SLA, SLO)
- Konzeption einer hochverfügbaren Kafka-Architektur unter Berücksichtigung von:
- Multi-Broker- und Multi-Zonen-Setups
- Replikations- und Partitionierungsstrategien
- Controller- und Quorum-Design (z. B. KRaft)
- Bewertung von Failure-Szenarien und deren Auswirkungen
- Erstellung eines dokumentierten HA-Konzepts inkl. Failover-Strategien
- Erstellung und Umsetzung eines Konzepts für das Nutzer- und Rechte-Management in Kafka
- Behandlung von Security Aspekten auf Kubernetes Ebene im Zusammenspiel der Kafka Ressourcen-Verwaltung
- Migration der Schema-Verwaltung nach ApiCurio
- Umsetzung und Implementierung der ermittelten Maßnahmen mit dem internen Projektteam
- Erstellung und Implementierung eines Backup-, Restore- und Disaster-Recovery-Konzepts
- Analyse der bestehenden Backup- und Wiederherstellungsmechanismen.
- Definition von RTO- und RPO-Zielen.
- Konzeption eines Backup- und Restore-Verfahrens für:
- Kafka-Daten (Topics, Partitionen, Offsets)
- Konfigurations- und Metadaten
- Entwicklung eines Disaster-Recovery-Konzepts (z. B. Cross-Cluster-Replikation, MirrorMaker 2)
- Technische Begleitung bzw. Umsetzung der Implementierung
- Durchführung und Dokumentation von Wiederherstellungs- und DR-Tests
- Erstellung eines Betriebskonzepts
- Definition von Betriebs- und Supportprozessen (Incident-, Change- und Problem-Management)
- Konzeption von Monitoring-, Logging- und Alerting-Strategien
- Festlegung von Wartungs-, Update- und Patch-Prozessen
- Erstellung von Runbooks für Standard- und Störfälle
- Definition von Rollen, Verantwortlichkeiten und Eskalationswegen
Interessiert?
Wir freuen uns auf Ihre aussagekräftigen Bewerbungsunterlagen in elektronischer Form.
Ihre Ansprechpartner
Merve Ilkiz
P: +49-170-6866735
E: m.ilkiz@westhouse-group.com