Mintalah Swiftie mana pun untuk memilih album Taylor Swift terbaik sepanjang masa, dan Anda akan membuat mereka terus mengoceh sepanjang hari. Saya memiliki preferensi saya sendiri sebagai penggemar seumur hidup (Red, Reputation, dan Midnights), tetapi ini adalah pertanyaan rumit dengan banyak kemungkinan jawaban. Jadi tidak ada topik debat yang lebih baik untuk diajukan ke chatbot AI generatif yang dirancang khusus untuk tidak sependapat dengan saya.

Tidak Setuju Bot adalah chatbot AI yang dibuat oleh Brinnae Bent, profesor AI dan keamanan siber di Duke University dan direktur Lab KEPERCAYAAN Duke. Dia membuatnya sebagai tugas kelas untuk murid-muridnya dan mengizinkan saya melakukan uji coba dengannya.

“Tahun lalu saya mulai bereksperimen dengan mengembangkan sistem yang merupakan kebalikan dari pengalaman AI chatbot yang umum dan menyenangkan, sebagai alat pendidikan bagi siswa saya,” kata Bent melalui email.

Siswa Bent ditugaskan untuk mencoba ‘meretas’ chatbot tersebut dengan menggunakan rekayasa sosial dan metode lain agar chatbot sebaliknya setuju dengan mereka. “Anda perlu memahami suatu sistem untuk dapat meretasnya,” katanya.

Sebagai reporter dan pengulas AI, saya memiliki pemahaman yang cukup baik tentang cara kerja chatbot dan yakin bahwa saya mampu melakukan tugas tersebut. Saya dengan cepat tidak menerima gagasan itu. Disagree Bot tidak seperti chatbot mana pun yang pernah saya gunakan. Orang yang terbiasa dengan kesopanan Gemini atau kualitas pria hype di ChatGPT akan segera melihat perbedaannya. Bahkan Grok, chatbot kontroversial buatan xAI milik Elon Musk yang digunakan di X/Twitter, tidak sama dengan Disagree Bot.


Jangan lewatkan konten teknologi dan ulasan berbasis laboratorium kami yang tidak memihak. Tambahkan CNET sebagai sumber Google pilihan.


Kebanyakan chatbot AI generatif tidak dirancang untuk bersifat konfrontatif. Faktanya, mereka cenderung menuju ke arah yang berlawanan; mereka ramah, terkadang terlalu berlebihan. Hal ini dapat menjadi masalah dengan cepat. Sycophantic AI adalah istilah yang digunakan oleh para ahli untuk menggambarkan kepribadian AI yang berlebihan, bersemangat, dan terkadang terlalu emosional. Selain mengganggu saat digunakan, hal ini dapat menyebabkan AI memberikan informasi yang salah dan memvalidasi ide terburuk kita.

Anda memiliki atlas

Hal ini terjadi pada versi ChatGPT-4o musim semi lalu dan perusahaan induknya OpenAI akhirnya harus menghentikan komponen pembaruan tersebut. AI pun memberikan tanggapan kepada perusahaan ditelepon “terlalu mendukung tetapi tidak jujur,” sejalan dengan keluhan beberapa pengguna bahwa mereka tidak menginginkan chatbot yang terlalu penuh kasih sayang. Pengguna ChatGPT lainnya melewatkan nada menjilatnya saat meluncurkan GPT-5, sehingga menyoroti peran kepribadian chatbot dalam kepuasan kami secara keseluruhan dalam menggunakannya.

“Meskipun pada tingkat permukaan hal ini mungkin tampak seperti kebiasaan yang tidak berbahaya, penjilatan ini dapat menyebabkan masalah besar, baik Anda menggunakannya untuk pekerjaan atau untuk pertanyaan pribadi,” kata Bent.

Ini tentu saja bukan masalah dengan Disagree Bot. Untuk benar-benar melihat perbedaannya dan menguji chatbots, saya memberikan pertanyaan yang sama kepada Disagree Bot dan ChatGPT untuk melihat bagaimana tanggapan mereka. Begini pengalaman saya.

Tidak Setuju Bot berargumentasi dengan hormat; ChatGPT tidak membantah sama sekali

Seperti siapa pun yang aktif di Twitter pada tahun 2010-an, saya telah melihat banyak troll yang tidak menyenangkan. Anda tahu tipenya; mereka muncul di thread tanpa diundang, dengan kalimat “Sebenarnya…” yang tidak membantu. Jadi, saya sedikit khawatir untuk terlibat dalam percakapan dengan Disagree Bot, khawatir ini akan menjadi upaya yang sama menyedihkan dan sia-sianya. Saya sangat terkejut bahwa hal itu tidak terjadi sama sekali.

Chatbot AI pada dasarnya bertentangan, dirancang untuk menolak ide apa pun yang Anda berikan. Namun mereka tidak pernah melakukannya dengan cara yang menghina atau kasar. Meskipun setiap tanggapan dimulai dengan “Saya tidak setuju”, tanggapan tersebut diikuti dengan argumen yang sangat masuk akal dan berisi poin-poin yang bijaksana. Responsnya mendorong saya untuk berpikir lebih kritis mengenai pendirian yang saya perdebatkan dengan meminta saya mendefinisikan konsep yang saya gunakan dalam argumen saya (seperti “lirik yang dalam” atau apa yang membuat sesuatu menjadi “yang terbaik”) dan mempertimbangkan bagaimana saya akan menerapkan argumen saya pada topik terkait lainnya.

Karena kurangnya analogi yang lebih baik, mengobrol dengan Disagree Bot terasa seperti berdebat dengan pendebat yang terpelajar dan penuh perhatian. Untuk mengimbanginya, saya harus lebih bijaksana dan spesifik dalam memberikan tanggapan. Itu adalah percakapan yang sangat menarik yang membuat saya tetap waspada.

tiga screenshot perdebatan dengan Disagree Bot

Perdebatan saya yang penuh semangat dengan Disagree Bot tentang album Taylor Swift terbaik membuktikan bahwa AI tahu betul.

Tangkapan layar oleh Katelyn Chedraoui/CNET

Sebaliknya, ChatGPT nyaris tidak berdebat sama sekali. Saya memberi tahu ChatGPT bahwa menurut saya Red (Taylor’s Version) adalah album Taylor Swift terbaik, dan mereka dengan antusias menyetujuinya. Itu menanyakan beberapa pertanyaan lanjutan tentang mengapa menurut saya album ini adalah yang terbaik tetapi tidak cukup menarik untuk menarik perhatian saya dalam waktu lama. Beberapa hari kemudian, saya memutuskan untuk menggantinya. Saya secara khusus meminta ChatGPT untuk berdebat dengan saya dan mengatakan Midnights adalah album terbaik. Coba tebak album mana yang dipatok ChatGPT sebagai yang terbaik? Merah (Versi Taylor).

Ketika saya bertanya apakah mereka memilih Merah karena obrolan kami sebelumnya, mereka dengan cepat menjawab ya tetapi mengatakan bahwa mereka bisa membuat argumen independen untuk Merah. Mengingat apa yang kami ketahui tentang ChatGPT dan kecenderungan chatbot lainnya yang mengandalkan “memori” mereka (jendela konteks) dan cenderung setuju dengan kami untuk menyenangkan kami, saya tidak terkejut dengan hal ini. ChatGPT mau tidak mau setuju dengan beberapa versi saya — bahkan ketika versi tersebut menandai 1989 sebagai album terbaik dalam obrolan bersih, kemudian Merah, lagi.

Tetapi bahkan ketika saya meminta ChatGPT untuk berdebat dengan saya, saya tidak berdebat seperti yang dilakukan Disagree Bot. Suatu kali, ketika saya menceritakannya, saya berargumentasi bahwa University of North Carolina memiliki warisan bola basket perguruan tinggi terbaik dan memintanya untuk mendebat saya, mereka memberikan argumen tandingan yang komprehensif, lalu menanyakan apakah saya ingin universitas tersebut mengumpulkan poin-poin untuk argumen saya sendiri. Hal ini sama sekali tidak sesuai dengan tujuan perdebatan yang saya minta. ChatGPT sering kali mengakhiri tanggapannya seperti itu, menanyakan apakah saya ingin mereka mengumpulkan berbagai jenis informasi bersama-sama, lebih seperti asisten peneliti daripada musuh verbal.

Tidak Setuju Bot (kiri) versus ChatGPT (kanan) tentang apakah Midnights adalah album terbaik Taylor Swift

Sementara Disagree Bot (kiri) menggali argumen saya lebih dalam, ChatGPT meminta argumen saya untuk saya (kanan).

Tangkapan layar oleh Katelyn Chedraoui/CNET

Mencoba berdebat dengan ChatGPT adalah misi yang membuat frustrasi, berputar-putar, dan tidak berhasil. Rasanya seperti berbicara dengan seorang teman yang mengoceh panjang lebar tentang mengapa mereka percaya sesuatu adalah yang terbaik, hanya untuk diakhiri dengan “Tetapi hanya jika Anda juga berpikir demikian.” Disagree Bot, sebaliknya, merasa seperti teman yang sangat bersemangat dan berbicara dengan fasih tentang topik apa pun, mulai dari Taylor Swift hingga geopolitik dan bola basket perguruan tinggi. (Pengungkapan: Ziff Davis, perusahaan induk CNET, pada bulan April mengajukan gugatan terhadap OpenAI, menuduhnya melanggar hak cipta Ziff Davis dalam pelatihan dan pengoperasian sistem AI-nya.)

Kami membutuhkan lebih banyak AI seperti Disagree Bot

Terlepas dari pengalaman positif saya menggunakan Disagree Bot, saya tahu bot tersebut tidak dilengkapi untuk menangani semua permintaan yang mungkin saya ajukan ke chatbot. “Semua mesin” seperti ChatGPT mampu menangani banyak tugas berbeda dan mengambil berbagai peran, seperti yang diinginkan oleh asisten peneliti ChatGPT, sebagai mesin pencari dan pembuat kode. Disagree Bot tidak dirancang untuk menangani pertanyaan semacam itu, tetapi bot ini memberi kita gambaran tentang bagaimana perilaku AI di masa depan.

AI penjilat sangat cocok untuk Anda, dengan tingkat semangat yang berlebihan. Seringkali AI yang kami gunakan tidak begitu jelas. Bisa dikatakan, mereka lebih merupakan pemandu sorak yang memberi semangat daripada memberi semangat. Tapi itu tidak berarti kita tidak terpengaruh oleh kecenderungan mereka untuk setuju dengan kita, baik itu kesulitan mendapatkan sudut pandang yang berlawanan atau masukan yang lebih kritis. Jika Anda menggunakan alat AI untuk bekerja, Anda ingin kesalahan dalam pekerjaan Anda menjadi nyata. Alat AI yang mirip terapi harus mampu melawan pola pikir yang tidak sehat atau berpotensi berbahaya. Model AI kami saat ini kesulitan menghadapi hal tersebut.

Disagree Bot adalah contoh bagus tentang bagaimana Anda dapat merancang alat AI yang berguna dan menarik sekaligus mengurangi kecenderungan AI yang menyenangkan atau menjilat. Harus ada keseimbangan; AI yang tidak setuju dengan Anda hanya karena bertentangan tidak akan membantu dalam jangka panjang. Namun membangun alat AI yang lebih mampu melawan Anda pada akhirnya akan membuat produk tersebut lebih berguna bagi kita, meskipun kita harus menghadapi produk tersebut dengan sikap yang tidak menyenangkan.

Tonton ini: Dampak Tersembunyi dari Booming Pusat Data AI

Tautan Sumber