Saya telah menggunakan asisten suara selama bertahun-tahun dan meskipun mereka sangat membantu, saya selalu merasa frustrasi ketika mereka memotong saya di tengah kalimat, atau sama sekali tidak memahami apa yang saya katakan. Saya tidak optimis saat memeriksa Mode Suara ChatGPT, dan saya sangat senang jika salah. Mode Suara bukan hanya saya yang berbicara dengan chatbot, ini terasa seperti percakapan autentik.

Ini menangkap jeda, gumaman pikiran, dan bahkan kata-kata pengisi seperti “uhhh” tanpa mengganggu alurnya. Baik saat saya sedang mengemudi, memasak, atau sekadar mencoba melakukan banyak tugas, saya dapat berbicara secara alami dan mendapatkan jawaban yang berguna tanpa mengangkat telepon. Ini tidak hanya lebih cepat daripada mengetik — ini terasa lebih mudah, lebih intuitif, dan jauh lebih efisien. Jika Anda belum mencobanya, inilah mengapa Mode Suara ChatGPT bisa menjadi cara favorit Anda untuk menggunakan AI.

Jangan lewatkan: Apa itu ObrolanGPT? Semua yang Perlu Anda Ketahui Tentang AI Chatbot

ChatGPT, dari OpenAI, bukan satu-satunya chatbot yang bebas genggam. Gemini Live dari Google menawarkan suasana “bicaralah tentang saya, dan saya akan terus mengikuti”. Claude dari Anthropic memiliki versi beta dari mode suaranya di aplikasi selulernya, lengkap dengan poin-poin di layar saat berbicara, dan asisten iOS dan Android dari Perplexity juga menjawab pertanyaan lisan dan meluncurkan aplikasi seperti OpenTable atau Uber sesuai perintah.


Jangan lewatkan konten teknologi dan ulasan berbasis laboratorium kami yang tidak memihak. Tambahkan CNET sebagai sumber Google pilihan.


Namun meski semua orang berlomba untuk menguasai percakapan AI real-time, ChatGPT tetap menjadi pilihan saya. Apa pun chatbot pilihan Anda, berhentilah mengetik dan cobalah opsi suara. Ini jauh lebih bermanfaat dari yang Anda kira.

(Pengungkapan: Ziff Davis, perusahaan induk CNET, pada bulan April mengajukan gugatan terhadap OpenAI, menuduhnya melanggar hak cipta Ziff Davis dalam pelatihan dan pengoperasian sistem AI-nya.)

Tonton ini: Fitur Viral ChatGPT: Mengubah Orang Menjadi Action Figure

Apa sebenarnya mode suara itu?

Obrolan suara (atau “percakapan suara”) adalah mode bebas genggam ChatGPT yang memungkinkan Anda berbicara dengan model AI dan mendengarnya berbicara kembali kepada Anda, tanpa perlu mengetik. Ada ikon suara yang dapat Anda temukan di aplikasi seluler, desktop, dan web di kanan bawah percakapan apa pun yang Anda lakukan. Jika Anda menekan tombol, Anda dapat mengucapkan pertanyaan Anda dengan lantang dan ChatGPT akan menyalinnya, memikirkannya, dan membalasnya. Segera setelah selesai berbicara, ia mulai mendengarkan lagi, menciptakan dialog bolak-balik yang alami.

Ingat saja: Mode suara berjalan pada model bahasa besar yang sama dengan ChatGPT biasa, sehingga masih dapat berhalusinasi atau salah memberikan fakta. Anda harus selalu memeriksa ulang segala sesuatu yang penting.

OpenAI menawarkan dua versi percakapan suara ini: Suara Standar (opsi default dan ringan gratis) dan Suara Tingkat Lanjut (hanya tersedia untuk pengguna berbayar).

Suara Standar terlebih dahulu mengonversi ucapan Anda menjadi teks dan memprosesnya dengan GPT-4o (dan GPT-4o mini), sehingga membutuhkan waktu lebih lama untuk membalas ucapan Anda. Sebaliknya, Advanced Voice menggunakan model multimodal asli, artinya ia “mendengar” Anda dan menghasilkan audio, sehingga percakapan menjadi lebih alami dan dilakukan dalam waktu nyata. Hal ini dapat menangkap isyarat selain kata-kata itu sendiri, seperti kecepatan Anda berbicara atau emosi dalam suara Anda, dan menyesuaikan diri dengan hal ini.

Catatan: Pengguna gratis dapat mengakses pratinjau harian Advanced Voice.

Mode Suara ChatGPT di telepon

kagum

Nelson Aguilar/CNET

7 alasan Anda harus mulai menggunakan fitur mode suara ChatGPT

1. Ini benar-benar bersifat percakapan
Tidak seperti mengetik, saat saya berbicara dengan ChatGPT, saya tidak mencari kata yang tepat atau spasi mundur setelah setiap kesalahan ketik. Saya hanya berbicara, seperti yang saya lakukan dengan teman atau anggota keluarga mana pun, diisi dengan “ummmmms” dan “suka” dan jeda canggung lainnya. Namun, mode suara bergulir dengan semua pemikiran saya yang setengah jadi, dan merespons dengan jawaban yang sepenuhnya lengkap atau pertanyaan untuk membantu saya mengasah apa yang saya butuhkan. Memberi dan menerima dengan mudah ini terasa jauh lebih alami daripada mengetik.

2. Anda dapat menggunakan ChatGPT secara handsfree
Tentu saja, saya masih perlu membuka aplikasi ChatGPT dan mengetuk tombol mode suara untuk memulai, namun setelah memulai, saya tidak perlu lagi menggunakan tangan untuk melanjutkan percakapan dengan chatbot AI. Saya bisa terjebak kemacetan dan bertukar pikiran tentang liburan yang ingin saya lakukan akhir tahun ini. Saya dapat bertanya tentang penerbangan, hotel, landmark, restoran, dan hal lainnya, tanpa menyentuh ponsel saya, dan percakapan tersebut disimpan dalam aplikasi, sehingga saya tidak perlu mengingat semua yang diceritakan ChatGPT kepada saya.

3. Cocok untuk mempelajari bahasa baru dengan terjemahan waktu nyata
Saya telah menyebutkan sebelumnya bahwa saya menggunakan mode suara untuk berlatih bahasa, yang merupakan keunggulan mode suara. Saya dapat berbicara dalam bahasa Inggris dan ChatGPT merespons dalam bahasa Polandia yang sempurna, lengkap dengan tips pengucapan. Cukup tanyakan pada mode suara, “Bisakah Anda membantu saya melatih (bahasa) saya” dan mode tersebut akan merespons dengan beberapa cara yang dapat membantu Anda, seperti pembuka percakapan, kosakata dasar, atau angka. Dan ia mengingat di mana Anda tinggalkan, sehingga Anda dapat mengambil pelajaran; tidak diperlukan Duolingo.

4. Dapatkan jawaban tentang hal-hal yang Anda lihat di dunia nyata
Fitur ini eksklusif untuk Advanced Voice, tapi ini mungkin fitur favorit saya dengan mode suara. Berkat kekuatan super multimodalnya, saya dapat menyalakan kamera ponsel atau mengambil video/foto dan meminta ChatGPT membantu saya. Misalnya, saya kesulitan mengenali lukisan yang saya temukan di toko barang bekas, dan pemiliknya tidak tahu dari mana asalnya. Saya membuka obrolan suara, menyalakan kamera dan menanyakan mode suara dari mana lukisan itu berasal. Dalam hitungan detik, ia bisa memberi tahu saya judul lukisannya, nama senimannya, dan kapan lukisan itu dilukis.

5. Ini adalah pilihan yang lebih baik bagi penyandang disabilitas tertentu
Bagi siapa pun yang memiliki gangguan penglihatan atau disleksia, berbicara pasti lebih baik daripada mengetik. Mode suara dapat menyalin ucapan Anda dan kemudian membacakan jawaban Anda dengan keras pada kecepatan apa pun yang Anda pilih (Anda dapat menyesuaikannya di pengaturan Anda atau meminta ChatGPT untuk memperlambat). Opsi handsfree juga membantu siapa pun yang memiliki tantangan keterampilan motorik, karena yang perlu Anda lakukan hanyalah satu ketukan untuk memulai dan satu ketukan lagi untuk berhenti, tanpa harus mengetik terlalu lama di keyboard.

6. Brainstorming lebih cepat
Kadang-kadang saya mendapat banyak ide, dan saya berpikir lebih cepat daripada kemampuan saya mengetik, jadi mode suara ChatGPT sangat cocok untuk melontarkan ide cerita, mencari tahu tata letak baru untuk ruang tamu saya, atau memutuskan makanan menarik untuk dimasak selama seminggu. Karena saya berpikir keras daripada menatap ponsel, ide-ide saya mengalir lebih mudah dan cepat, terutama dengan tindak lanjut instan ChatGPT. Ini membantu menjaga momentum tetap berjalan sampai saya mendapatkan ide bagus untuk apa pun yang saya pikirkan.

7. Ringkasan instan yang dapat Anda dengarkan
Masukkan PDF setebal 90 halaman ke dalam obrolan, seperti naskah film atau buku teks, minta ringkasan dan minta AI membacakannya untuk Anda saat Anda melipat cucian. Ini seperti mengubah dokumen apa pun (saya bahkan membuat halaman Wikipedia) menjadi podcast — sesuai permintaan.

Mode suara bukan hanya trik yang bagus; ini cara yang cepat dan alami untuk menggunakan ChatGPT. Baik Anda menerjemahkan rambu-rambu jalan, bertukar pikiran tentang ide, atau mengikuti berita dengan lantang, berbicara dengan ChatGPT tidak terasa seperti menggunakan chatbot dan lebih seperti berbincang dengan seorang pakar. Setelah Anda terbiasa berpikir keras, Anda mungkin tidak akan pernah kembali lagi ke keyboard Anda.

Tautan Sumber