Enable job alerts via email!

SITE RELIABILITY ENGINEER SPECIALIST

PT Knitto Tekstil Indonesia

Kota Bandung

On-site

IDR 300.000.000 - 400.000.000

Full time

Today
Be an early applicant

Job summary

Perusahaan Teknologi Terkemuka mencari seorang SRE/DevOps Engineer di Kota Bandung. Kandidat harus memiliki pengalaman 2–5 tahun dalam SRE/DevOps dengan keahlian dalam cloud platform seperti AWS dan GCP, serta CI/CD. Tanggung jawab termasuk menjaga performa aplikasi dan melakukan automasi deployment. Bergabunglah dan kembangkan karier Anda di lingkungan yang dinamis.

Qualifications

  • Pengalaman 2–5 tahun di bidang SRE/DevOps/Infra Engineer.
  • Familiar dengan security hardening dan secrets management.
  • Pernah menerapkan konsep SLA/SLO/SLI di skala produksi.

Responsibilities

  • Menjaga ketersediaan, reliabilitas, dan performa sistem/aplikasi.
  • Bekerjasama dengan tim Development untuk membangun sistem yang dapat diandalkan.
  • Mengembangkan sistem monitoring, alerting, dan observability.
  • Menangani insiden kritis dan melakukan analisa penyebab akar.
  • Menerapkan standar security dan praktik terbaik DevOps.

Skills

Pengalaman dengan cloud platform (AWS, GCP, Azure)
Container orchestration (Kubernetes, Docker)
CI/CD (GitLab CI, Jenkins, GitHub Actions)
Infrastructure as Code (Terraform, Ansible)
Monitoring & logging tools (Prometheus, Grafana)
Pemahaman database (MySQL, PostgreSQL)
Keterampilan scripting/programming (Go, Python)
Arsitektur microservices
Security hardening

Education

Sarjana (S1) dengan jurusan terkait
Job description
Gambaran Umum

Pendidikan minimal Sarjana (S1) dengan jurusan Teknik Informatika / Ilmu Komputer, Teknik Elektro (konsentrasi komputer/jaringan), Teknik Telekomunikasi, atau jurusan terkait. Pengalaman 2–5 tahun di bidang SRE/DevOps/Infra Engineer. Pengalaman dengan cloud platform (AWS, GCP, Azure) dan container orchestration (Kubernetes, Docker). Penguasaan tools CI/CD (GitLab CI, Jenkins, GitHub Actions, ArgoCD). Pengalaman dengan Infrastructure as Code (Terraform, Ansible, Helm). Familiar dengan monitoring & logging tools (Prometheus, Grafana, ELK, OpenTelemetry). Pemahaman database (MySQL, PostgreSQL, Redis, MongoDB) termasuk backup & high availability. Keterampilan scripting/programming (Go, Python, Bash, atau sejenisnya). Memiliki pengalaman dengan arsitektur microservices, familiar dengan security hardening dan secrets management serta pernah menerapkan konsep SLA/SLO/SLI di skala produksi menjadi nilai plus. Bersedia ditempatkan di Kota Bandung.

Persyaratan (Qualifications)
  • Pendidikan minimal Sarjana (S1) dengan jurusan terkait seperti Teknik Informatika / Ilmu Komputer, Teknik Elektro (konsentrasi komputer/jaringan), Teknik Telekomunikasi, atau jurusan terkait.
  • Pengalaman 2–5 tahun di bidang SRE/DevOps/Infra Engineer.
  • Pengalaman dengan cloud platform (AWS, GCP, Azure) dan container orchestration (Kubernetes, Docker).
  • Penguasaan tools CI/CD (GitLab CI, Jenkins, GitHub Actions, ArgoCD).
  • Pengalaman dengan Infrastructure as Code (Terraform, Ansible, Helm).
  • Familiar dengan monitoring & logging tools (Prometheus, Grafana, ELK, OpenTelemetry).
  • Pemahaman database (MySQL, PostgreSQL, Redis, MongoDB) termasuk backup & high availability.
  • Keterampilan scripting/programming (Go, Python, Bash, atau sejenisnya).
  • Memiliki pengalaman dengan arsitektur microservices, familiar dengan security hardening dan secrets management serta pernah menerapkan konsep SLA/SLO/SLI di skala produksi menjadi nilai plus.
  • Bersedia ditempatkan di Kota Bandung.
Tanggung Jawab (Responsibilities)
  1. Menjaga ketersediaan, reliabilitas, dan performa sistem/aplikasi perusahaan.
  2. Bekerjasama dengan tim Development dan Operations untuk membangun sistem yang otomatis, terukur, dan dapat diandalkan.
  3. Menjamin layanan berjalan sesuai SLA, SLO, dan SLI.
  4. Mengembangkan sistem monitoring, alerting, dan observability (Prometheus, Grafana, ELK, dsb).
  5. Mengotomatiskan deployment, scaling, backup, dan recovery dengan CI/CD serta Infrastructure as Code (IaC).
  6. Menangani insiden kritis, melakukan root cause analysis, dan menyusun blameless postmortem.
  7. Melakukan capacity planning, load testing, dan performance tuning untuk memastikan sistem siap menghadapi pertumbuhan pengguna.
  8. Menerapkan standar security, compliance, dan best practice DevOps.
  9. Berkolaborasi dengan developer untuk membuat aplikasi yang resilent dan scalable.
Get your free, confidential resume review.
or drag and drop a PDF, DOC, DOCX, ODT, or PAGES file up to 5MB.