Pada akhirnya bulan Agustus, perusahaan AI Anthropic diumumkan bahwa chatbotnya, Claude, tidak akan membantu siapa pun membuat senjata nuklir. Menurut Anthropic, pihaknya telah bermitra dengan Departemen Energi (DOE) dan Administrasi Keamanan Nuklir Nasional (NNSA) untuk memastikan Claude tidak membocorkan rahasia nuklir.

Pembuatan senjata nuklir merupakan ilmu pasti dan masalah yang sudah terpecahkan. Banyak informasi tentang senjata nuklir tercanggih Amerika yang sangat rahasia, namun ilmu nuklir aslinya sudah berusia 80 tahun. Korea Utara membuktikan bahwa negara yang berdedikasi dan berkepentingan untuk memperoleh bom tersebut dapat melakukannya, dan negara tersebut tidak memerlukan bantuan chatbot.

Bagaimana tepatnya pemerintah AS bekerja sama dengan perusahaan AI untuk memastikan chatbot tidak membocorkan rahasia sensitif nuklir? Dan juga: Apakah ada bahaya chatbot membantu seseorang membuat nuklir?

Jawaban atas pertanyaan pertama adalah bahwa mereka menggunakan Amazon. Jawaban atas pertanyaan kedua rumit.

Penawaran Amazon Web Services (AWS). Layanan cloud Sangat Rahasia kepada klien pemerintah di mana mereka dapat menyimpan informasi sensitif dan rahasia. DOE sudah memiliki beberapa server ini ketika mulai bekerja dengan Anthropic.

“Kami menerapkan Claude versi terdepan di lingkungan Sangat Rahasia sehingga NNSA dapat menguji secara sistematis apakah model AI dapat menciptakan atau memperburuk risiko nuklir,” Marina Favaro, yang mengawasi Kebijakan Keamanan Nasional & Kemitraan di Anthropic mengatakan kepada WIRED. “Sejak itu, NNSA telah menggabungkan model Claude berturut-turut dalam lingkungan cloud mereka yang aman dan memberikan masukan kepada kami.”

Proses tim merah NNSA—artinya, menguji kelemahan—membantu para ilmuwan nuklir Anthropic dan Amerika mengembangkan solusi proaktif untuk program nuklir yang dibantu chatbot. Bersama-sama, mereka “mengembangkan pengklasifikasi nuklir, yang dapat Anda anggap seperti filter canggih untuk percakapan AI,” kata Favaro. “Kami menyusunnya menggunakan daftar yang dikembangkan oleh NNSA mengenai indikator risiko nuklir, topik spesifik, dan rincian teknis yang membantu kami mengidentifikasi kapan pembicaraan mungkin mengarah ke wilayah berbahaya. Daftar itu sendiri dikendalikan tetapi tidak dirahasiakan, dan ini sangat penting, karena ini berarti staf teknis kami dan perusahaan lain dapat menerapkannya.”

Favaro mengatakan perlu waktu berbulan-bulan untuk penyesuaian dan pengujian agar pengklasifikasi dapat berfungsi. “Ini menangkap percakapan yang memprihatinkan tanpa menandai diskusi yang sah tentang energi nuklir atau isotop medis,” katanya.

Tautan Sumber