Attiva gli avvisi di lavoro via e-mail!

Site Reliability Engineer

JR Italy

Ascoli Piceno

Remoto

EUR 45.000 - 65.000

Tempo pieno

16 giorni fa

Descrizione del lavoro

Un'azienda leader nel settore di infrastrutture Cloud è alla ricerca di un Site Reliability Engineer motivato. Il candidato si occuperà di ottimizzare sistemi complessi su Azure, con responsabilità su database e gestione di emergenze. Offriamo un ambiente stimolante e opportunità di crescita, in un contesto 'remote friendly'.

Competenze

  • Esperienza con Azure e Kubernetes è vantaggiosa.
  • Capacità di operare in un contesto di sistemi distribuiti.
  • Attitudine alla formazione continua e alla gestione delle emergenze.

Mansioni

  • Migliorare resilienza ed ottimizzazione del cluster Kubernetes.
  • Configurare e ottimizzare database relazionali e non.
  • Automatizzare processi operativi e rispondere a incidenti.

Conoscenze

Kubernetes
Azure
PostgreSQL
MongoDB
Apache Kafka
Automazione

Descrizione del lavoro

agap2 Italia

ascoli piceno, Italy

Siamo alla ricerca di un Site Reliability Engineer motivato a contribuire alla scalabilità e all’ottimizzazione di una complessa infrastruttura Cloud in produzione su Azure.

Si tratta di un sistema distribuito progettato per raccogliere, gestire e distribuire grosse moli di dati in tempo reale. Include componenti connessi “at the edge” che devono essere in grado di operare in scenari “offline” e garantire “eventual consistency” dei dati. La lingua di lavoro principale è l’inglese, dato che il sistema è utilizzato da clienti internazionali.

Il ruolo richiede un forte focus sull’affidabilità, la scalabilità, la sicurezza e la resilienza dell’infrastruttura, con un utilizzo intensivo di Azure Kubernetes Service (AKS), Azure Database for PostgreSQL, MongoDB Atlas ed Apache Kafka.

Il candidato deve inoltre essere disponibile a partecipare alla turnazione on-call, ovviamente remunerata e concordata per essere distribuita equamente nel mese, per la gestione di emergenze e incidenti fuori orario lavorativo standard.

Non è necessario avere esperienza approfondita su tutti i tool utilizzati: siamo pronti a offrire formazione tramite corsi e “training on the job” per colmare eventuali lacune e supportare la crescita professionale.

Responsabilità principali

  • Migliorare la resilienza ed ottimizzare il cluster Kubernetes (AKS su Azure), assicurando performance, scalabilità, sicurezza ed alta affidabilità dei servizi deployati
  • Configurare ed ottimizzare i database relazionali (PostgreSQL su Azure) e non relazionali (MongoDB Atlas) per garantire performance, affidabilità e sicurezza dei dati
  • Gestire e ottimizzare Apache Kafka (su AKS) per la raccolta e distribuzione di dati in tempo reale
  • Automatizzare processi operativi per ridurre il “toil” e migliorare l’efficacia dei team (Platform team e Product team)
  • Partecipare alla turnazione on-call per garantire una rapida risposta agli incidenti e alle emergenze
  • Sviluppare pipeline di monitoraggio e alerting per identificare e debuggare rapidamente problemi operativi
  • Identificare prontamente la “root cause” di problemi bloccanti, sviluppando documentazione tecnica dettagliata ed automazioni per evitare che problemi noti si verifichino nuovamente
  • Collaborare con il team di sviluppo per il miglioramento continuo del ciclo di vita dello sviluppo software (SDLC), garantendo pratiche solide e coerenti
  • Opportunità di lavorare su infrastrutture cloud-native moderne, resilienti e scalabili, in un contesto di stream processing ed edge computing
  • Forte attenzione alla cura delle persone, guidata dai nostri valori aziendali di intraprendenza, curiosità, cura e onestà
  • Ambiente collaborativo e stimolante, “remote friendly”, orientato alla crescita professionale e personale
Ottieni la revisione del curriculum gratis e riservata.
oppure trascina qui un file PDF, DOC, DOCX, ODT o PAGES di non oltre 5 MB.