Awan besar pemadaman listrik yang terjadi di wilayah utama Amazon Web Services US-EAST-1, pusatnya di Virginia utara, dekat US Capitol, menyebabkan gangguan luas pada situs web dan platform di seluruh dunia pada Senin pagi. Platform e-niaga utama Amazon dan properti lainnya, termasuk bel pintu Ring dan asisten pintar Alexa, mengalami gangguan dan pemadaman sepanjang pagi, begitu pula platform komunikasi Meta WhatsApp, ChatGPT OpenAI, platform pembayaran Venmo PayPal, beberapa layanan web dari Epic Games, beberapa situs pemerintah Inggris, dan banyak lainnya.

Pemadaman ini berasal dari antarmuka pemrograman aplikasi database DynamoDB Amazon di US-EAST-1, dan AWS mengatakan dalam pembaruan status bahwa masalahnya secara khusus terkait dengan masalah resolusi DNS. “Sistem nama domain” adalah layanan internet dasar yang pada dasarnya bertindak sebagai pencarian buku telepon otomatis untuk menerjemahkan URL web seperti www.wired.com menjadi alamat IP server numerik sehingga browser web menampilkan konten yang tepat kepada pengguna. Masalah resolusi DNS terjadi ketika server DNS tidak menghubungkan titik-titik ini secara akurat dan, sesuai dengan analogi buku telepon, memberikan nomor yang salah untuk nama tertentu, atau sebaliknya.

“Berdasarkan penyelidikan kami, masalah ini tampaknya terkait dengan resolusi DNS titik akhir API DynamoDB di US-EAST-1,” tulis AWS dalam pembaruan status pada hari Senin. Tak lama kemudian, perusahaan menambahkan: “Jika Anda masih mengalami masalah dalam menyelesaikan titik akhir layanan DynamoDB di US-EAST-1, kami sarankan untuk menghapus cache DNS Anda.”

Juru bicara AWS tidak segera menanggapi ketika ditanyai rincian tentang sifat kegagalan tersebut. Masalah resolusi DNS bisa berbahaya—dikenal sebagai pembajakan DNS—namun tidak ada indikasi bahwa pemadaman AWS pada hari Senin merupakan hal yang jahat.

“Ketika sistem tidak dapat menentukan dengan benar server mana yang harus disambungkan, kegagalan yang terjadi secara bertahap akan mematikan layanan di internet,” kata Davi Ottenheimer, manajer operasi keamanan dan kepatuhan yang sudah lama menjabat dan wakil presiden di perusahaan infrastruktur data Inrupt. “Pemadaman AWS saat ini adalah masalah ketersediaan klasik, dan kita harus mulai melihatnya lebih sebagai kegagalan integritas data.”

Masalah dimulai sekitar jam 3 pagi ET. Pada pukul 5:22 pagi, AWS telah menerapkan “mitigasi awal” yang mulai berlaku. Pada pukul 6:35 pagi, Amazon mengatakan bahwa mereka telah sepenuhnya mengatasi masalah teknis yang mendasarinya, tetapi “beberapa layanan akan memiliki banyak pekerjaan yang harus diselesaikan, yang mungkin memerlukan waktu tambahan untuk diproses sepenuhnya.”

AWS juga mengalami pemadaman skala besar lainnya, termasuk a insiden besar pada tahun 2023. Ketergantungan pada layanan cloud sentral dari raksasa seperti AWS, Microsoft Azure, dan Google Cloud Services, dalam banyak hal, telah meningkatkan keamanan dan stabilitas siber di seluruh dunia dengan menciptakan garis dasar pagar pembatas dan praktik terbaik untuk semua pelanggan. Namun standardisasi ini memiliki konsekuensi yang besar, karena platform menjadi satu-satunya titik kegagalan bagi sebagian besar layanan penting.

“Kegagalan semakin banyak disebabkan oleh integritas,” kata Ottenheimer. “Data rusak, validasi gagal, atau, dalam kasus ini, resolusi nama yang rusak yang meracuni setiap ketergantungan hilir. Sampai kita lebih memahami dan melindungi integritas, fokus kita pada uptime hanyalah sebuah ilusi.”

Tautan Sumber