Penerapan AI untuk masyarakat harus menghilangkan hype sehingga “keberhasilan control panel” tidak menjadi “kegagalan kesejahteraan”, kata kepala salah satu badan penelitian ekonomi terkemuka di dunia, seraya memperingatkan bahwa mengembangkan solusi kecerdasan buatan yang belum terbukti dapat menyebabkan kerugian aktif– tidak hanya membuang-buang uang.

Iqbal Dhaliwal adalah direktur eksekutif worldwide Laboratory Aksi Kemiskinan Abdul Latif Jameel

Saat para pembuat kebijakan, peneliti dan pemimpin teknologi berkumpul untuk diskusi “AI untuk Kebaikan Sosial” pada hari kedua India AI Impact Summit di New Delhi pada hari Selasa, Iqbal Dhaliwal, direktur eksekutif international dari Abdul Latif Jameel Poverty Action Laboratory (J-PAL), mengatakan obsesi saat ini terhadap pengunduhan aplikasi dan log obrolan mengancam untuk mengaburkan tujuan akhir: meningkatkan kehidupan manusia. Yang lebih buruk lagi, hal ini berisiko memperparah kesenjangan, mengikis kepercayaan masyarakat terhadap teknologi, dan menghilangkan penilaian kritis manusia.

“Keterlibatan itu penting … tapi itu adalah kondisi yang diperlukan– itu bukanlah kondisi yang cukup,” kata Dhaliwal kepada HT pada hari Senin. “Kondisi memadai tidak berubah … (itulah) dampaknya.”

J-PAL pada hari Selasa meluncurkan AI Evidence Playbook– sebuah panduan untuk memandu pejabat pemerintah dalam menerapkan AI secara bertanggung jawab. Ringkasan ini menyaring pembelajaran dari penelitian global untuk menyelaraskan adopsi AI dengan bukti yang kuat.

“Perangkap keterlibatan”

Kehati-hatian Dhaliwal berakar pada apa yang ia sebut sebagai “jebakan keterlibatan”– yaitu metrik penggunaan yang tinggi menutupi kegagalan dalam memberikan manfaat nyata. Dia mengutip chatbot AI berbasis WhatsApp untuk wirausahawan di Kenya yang menunjukkan keterlibatan besar-besaran, dengan 85 % pengguna berinteraksi dengannya.

“Keterlibatan yang luar biasa … namun keuntungan atau pendapatan tampaknya tidak meningkat,” kata Dhaliwal. “Mengetahui orang-orang mengobrol dengan robot … tidak menunjukkan dampak pada hasil di dunia nyata.”

Selain mengukur apakah AI berfungsi, Dhaliwal menekankan penilaian efektivitas biaya dan dampak distribusi. “Apakah ini efektif? Nomor dua, apakah hemat biaya?” dia bertanya. “Pada awalnya semua orang menawarkan hal-hal ini secara gratis, namun information dan pertanyaan akan memerlukan biaya dan mempunyai implikasi terhadap lingkungan.”

Yang tidak kalah pentingnya adalah menanyakan siapa yang diuntungkan. “Apakah dampaknya menguntungkan semua orang atau dampak rata-ratanya ditentukan oleh sebagian orang saja?” katanya, dan mencatat bahwa hasil mungkin didorong oleh perusahaan yang sudah memiliki kinerja tinggi, dan bukan oleh perusahaan yang paling membutuhkan.

Sektor pembangunan sudah terlihat

Dhaliwal menggambarkan kehebohan AI saat ini dengan pola kekecewaan sektor pembangunan yang lazim. “Hal ini telah menjadi jebakan dalam sektor pembangunan selama ini,” katanya, mengutip keuangan mikro dan “Satu Laptop Per Anak”.

“Pembiayaan mikro seharusnya menyelesaikan semua masalah kita– memberdayakan perempuan, meningkatkan penghidupan mereka, mengurangi guncangan kesehatan,” kenangnya. “Kami menemukan bahwa keuangan mikro memberikan beberapa manfaat. Mungkin meningkatkan pendapatan, namun tidak secara otomatis mengarah pada hal-hal lain.”

Demikian pula, Satu Laptop Per Anak dimaksudkan untuk meningkatkan pendidikan dan membantu anak-anak mengakses program manfaat sosial. “Itu tidak berhasil karena keterkaitan ke belakang dan ke depan dari bagaimana hal itu terjadi di lapangan tidak akan terjadi,” ujarnya.

Bahayanya bukan hanya membuang-buang uang tetapi juga kerugian aktif. Memperluas solusi yang tidak efektif dapat memperparah kesenjangan atau menggantikan penilaian kritis manusia. Dia menunjuk pada aplikasi kesehatan psychological sebagai hal yang sangat memprihatinkan, memperingatkan agar tidak mengganti konselor dengan algoritma hanya karena kekurangannya.

“Daripada dokter, sekarang ini adalah hubungan satu-lawan-satu antara AI dan pasien. Hal ini bisa berdampak sangat cepat,” katanya.

Meskipun dokter ternama di AIIMS mungkin menyaring “halusinasi” dari alat AI, seorang perawat di pusat kesehatan guide di Bihar atau Uttar Pradesh mungkin merasa terdorong untuk mengikuti “nasihat yang diberikan oleh departemen”, yang berpotensi menimbulkan bahaya jika AI salah.

Risikonya juga mencakup terkikisnya kepercayaan masyarakat terhadap teknologi. Dhaliwal mengilustrasikan hal ini dengan penyuluh pertanian– yang biasanya merupakan penasihat yang langka namun berharga yang akan mengunjungi pertanian, merekomendasikan pengobatan, dan yang terpenting, kembali untuk memeriksa hasilnya.

“Petugas penyuluhan akan kembali setelah seminggu dan berkata ‘kuch farak pada?’ (apakah ada bedanya?),” jelas Dhaliwal. “Jika petani mengatakan ‘ye to aur kharab ho gaya’ (ini menjadi lebih buruk), dia akan segera mengubahnya.”

Sekarang bayangkan sebuah aplikasi AI memberikan saran yang salah melalui medical diagnosis berbasis foto. “Apa yang terjadi jika Anda memberikan nasihat yang salah (dan) sesuatu yang buruk terjadi? Bagaimana dengan kepercayaan terhadap teknologi? Apakah mereka akan kembali kepada Anda atau tidak?”

India sebagai modal bukti

Meskipun ada kehati-hatian, Dhaliwal melihat India mempunyai posisi yang unik untuk memecahkan teka-teki global ini. Sementara negara-negara Barat berjuang melawan sistem lama yang terfragmentasi, Infrastruktur Publik Digital (DPI) India– termasuk Aadhaar dan UPI– telah menjadikannya “ibu kota penerapan AI dunia”.

“Perbedaan datang ke India dan melihat kinerja DPI versus pergi ke negara berpenghasilan rendah dan menengah lainnya sangatlah fenomenal,” kata Dhaliwal. “Digitalisasi dan information yang tersedia di India tidak masuk akal.”

Tulang punggung electronic ini memungkinkan India menjalankan evaluasi acak (RCT) yang cepat dan berbiaya rendah untuk menguji apakah alat AI benar-benar berfungsi.

Kecepatan vs ketelitian

Dhaliwal mengakui ketegangan antara evaluasi yang ketat dan jadwal politik bukanlah hal baru. “Selama 16 tahun saya bekerja di J-PAL, apa yang menjadi pertanyaan umum? ‘Ini akan memakan waktu terlalu lama. Kita harus menerapkannya sekarang juga,'” katanya.

Tekanan tersebut datang dari berbagai sumber: pemilu mendatang, transfer birokrasi (para pejabat menginginkan hasil sebelum masa jabatan mereka selama 18 bulan berakhir), dan siklus anggaran yang memerlukan pengeluaran paling lambat tanggal 31 Maret. “Dan yang mendasari semua ini juga adalah keinginan untuk melakukan yang terbaik,” ujarnya.

Tanggapannya: “Memperlambatnya bukan karena kita tidak peduli terhadap masyarakat miskin, namun justru karena kita peduli terhadap masyarakat miskin dan benar-benar ingin mereka mendapatkan hasil.”

Tapi dia menolak premis itu. Berkat infrastruktur digital India, evaluasi kini “jauh lebih cepat”. “Kami kini dapat memperoleh lebih banyak data tentang penerimaan kesehatan, hasil pendidikan, dan produktivitas petani secara digital,” sehingga memungkinkan hasil awal yang lebih cepat.

Augmentasi, bukan penggantian

Dhaliwal berargumen bahwa pentingnya penerapan AI di negara-negara Selatan adalah untuk menyelamatkan manusia dari pekerjaan yang membosankan, bukan untuk menggantikan mereka.

Dia menunjuk pada “Letrus”, alat penilaian AI di Brasil yang menangani pekerjaan mekanis seperti pemeriksaan ejaan dan tata bahasa untuk tes standar. Hal ini membebaskan guru untuk fokus pada pendampingan. “Hal ini membuat peran seorang manusia yang menilai menjadi berlebihan … (membebaskan) expert untuk duduk bersama Anda … dan memikirkan cara analitis yang Anda gunakan untuk mendekati masalah ini,” jelasnya.

Demikian pula, AI dapat memperbaiki bias manusia dalam pemungutan pajak. Di Senegal– konteksnya mirip dengan lingkungan seperti Vasant Kunj– petugas pajak sering kali “meremehkan” rumah-rumah ultra-mewah karena mereka tidak dapat memahami biaya penyelesaian akhir yang mewah.

Daftar periksa birokrat

Dhaliwal, mantan perwira IAS, menawarkan “daftar periksa” pragmatis untuk hakim distrik dan sekretaris di pertemuan puncak tersebut. Dia akan meminta jawaban atas tiga pertanyaan sebelum menandatangani kontrak AI apa word play here.

Pertama, teori perubahan: “Apakah teori perubahan kita menyatakan bahwa expert itu mubazir, atau … bahwa expert melakukan hal-hal yang tidak berguna dan dapat diotomatisasi agar mereka dapat fokus pada sisi pengajaran yang lebih analitis?”

Kedua, data pelatihan: “Apakah mereka mengunduh data pelatihan dari AS atau information pelatihan berasal dari India? Karena hal tersebut akan menentukan sepenuhnya, terutama dalam hasil kesehatan … Kami telah menderita selama bertahun-tahun karena banyak uji coba ini terjadi di negara-negara Barat.”

Terakhir, ketahanan di lapangan: “Bagaimana cara kerjanya di lapangan? Saya sudah memberi tahu Anda contoh mesin yang akan mati … internet dan listrik yang terus-menerus padam.”

“Saya akan menanyakan semua pertanyaan ini dengan sangat teliti,” Dhaliwal menyimpulkan. “Dan setelah itu saya akan berkata … ‘Mari kita uji coba selama tiga, empat, lima bulan. Mari kita uji coba … dan jika ya, maka mari kita lakukan.'”

Dhaliwal mengklarifikasi bahwa uji coba acak yang ketat tidak diperlukan untuk setiap aplikasi. Pengujian A/B sederhana berfungsi untuk aplikasi yang menangani pertanyaan penagihan, dengan peringkat pasca-interaksi atau pelacakan panggilan balik.

Tautan Sumber