Kami sedang merekrut Lead Site Reliability Engineer untuk bergabung dengan Grab Financial. Peran ini membutuhkan seorang profesional yang termotivasi dengan pengalaman lebih dari 7 tahun di domain Site Reliability Engineer. Anda akan menjadi bagian dari tim teknik berkinerja tinggi yang mengerjakan produk-produk mutakhir. Ini adalah posisi Hybrid dengan kompensasi yang kompetitif.
Tanggung Jawab Utama
Tentukan dan terapkan SLO, SLA, dan anggaran kesalahan untuk layanan platform penting
Membangun dan memelihara infrastruktur observabilitas menggunakan Prometheus, Grafana, dan penelusuran terdistribusi
Pimpin tinjauan pasca-insiden dan dorong peningkatan keandalan sistemik melalui pemeriksaan postmortem yang tidak bercela
Kembangkan otomatisasi untuk menghilangkan kerja keras dan meningkatkan efisiensi operasional dalam skala besar
Bermitra dengan tim pengembangan untuk menanamkan praktik rekayasa keandalan selama desain dan pengembangan
Kualifikasi yang Diperlukan
5+ tahun pengalaman SRE atau rekayasa platform
Kemahiran dalam Go atau Python untuk membangun peralatan internal
Pengetahuan yang kuat tentang Kubernetes dan arsitektur cloud-native
Pengalaman merancang dan mengimplementasikan tumpukan observabilitas
Pemahaman mendalam tentang pola keandalan sistem terdistribusi
Keterampilan yang Bagus untuk Dimiliki
Rekayasa Kekacauan Jaring Layanan (Istio) BukaTelemetri Tugas Pager eBPF
Manfaat & Keuntungan
Kompensasi saat panggilan
Gaji tingkat atas
Ekuitas
Kesehatan premium
Anggaran pembelajaran
Siap Melamar?
Bergabunglah dengan tim kami dan ambil langkah selanjutnya dalam karier Anda. Kami sangat senang mendengar pendapat Anda!