Reddit menggugat perusahaan SerApi, OxyLabs, AWMProxy, dan Perplexity karena diduga mengambil datanya dari hasil pencarian dan menggunakannya tanpa lisensi, Waktu New York laporan. Gugatan baru ini menyusul tindakan hukum terhadap startup AI Anthropic, yang diduga menggunakan konten Reddit untuk melatih chatbot Claude-nya.

Pada tahun 2023, Reddit membebankan biaya kepada perusahaan yang mencari akses ke postingan dan konten lainnya dengan harapan menghasilkan uang dari data yang dapat digunakan untuk pelatihan AI. Perusahaan ini juga telah menandatangani kesepakatan lisensi dengan perusahaan seperti Google dan OpenAI, dan bahkan membangun mesin penjawab AI sendiri untuk memanfaatkan pengetahuan dalam postingan pengguna. Mengikis hasil pencarian untuk konten Reddit menghindari pembayaran tersebut, itulah sebabnya perusahaan mencari kerugian finansial dan perintah permanen yang mencegah perusahaan menjual materi Reddit yang sebelumnya dihapus.

Beberapa perusahaan yang menjadi fokus Reddit, seperti SerApi, OxyLabs, dan AWMProxy, bukanlah perusahaan yang terkenal, namun mereka semua menjadikan pengumpulan data dari hasil pencarian dan menjualnya sebagai bagian penting dari bisnis mereka. Dimasukkannya kebingungan dalam gugatan mungkin lebih jelas. Perusahaan AI ini membutuhkan data untuk melatih modelnya, dan telah ketahuan menyalin dan memuntahkan materi yang belum dibayar untuk mendapatkan lisensi. Hal ini juga termasuk dilaporkan mengabaikan protokol robots.txt, sebuah cara bagi situs web untuk berkomunikasi bahwa mereka tidak ingin materinya dihapus.

Per salinan gugatan tersebut diberikan kepada Engadget, Reddit telah mengirimkan perintah penghentian dan penghentian ke Perplexity yang memintanya untuk berhenti menyalin postingan tanpa lisensi. Perusahaan mengklaim tidak menggunakan data Reddit, tetapi juga terus mengutip platform tersebut sebagai jawaban dari chatbot-nya. Reddit mengatakan pihaknya dapat membuktikan Perplexity menggunakan konten Reddit yang digores dengan membuat “postingan percobaan” yang “hanya dapat dijelajahi oleh mesin pencari Google dan tidak dapat diakses di mana pun di internet.” Dalam beberapa jam, pertanyaan yang dibuat ke mesin penjawab Perplexity mampu mereproduksi konten postingan.

“Satu-satunya cara Perplexity dapat memperoleh konten Reddit tersebut dan kemudian menggunakannya dalam ‘mesin penjawab’ adalah jika Perplexity dan/atau rekan tergugatnya mengambil Google (hasil pencarian) untuk konten Reddit tersebut dan Perplexity kemudian dengan cepat memasukkan data tersebut ke dalam mesin penjawabnya,” klaim gugatan tersebut.

Saat dimintai komentar, Perplexity memberikan pernyataan berikut:

Kebingungan belum menerima gugatan tersebut, namun kami akan selalu memperjuangkan hak pengguna untuk mengakses pengetahuan publik secara bebas dan adil. Pendekatan kami tetap berprinsip dan bertanggung jawab karena kami memberikan jawaban faktual dengan AI yang akurat, dan kami tidak akan mentolerir ancaman terhadap keterbukaan dan kepentingan publik.

Gugatan baru ini sesuai dengan sikap agresif yang diambil Reddit dalam melindungi datanya, termasuk membatasi laju bot dan perayap web yang tidak dikenal pada tahun 2024, dan bahkan membatasi akses Mesin Wayback Arsip Internet ke situsnya pada bulan Agustus 2025. Perusahaan juga berupaya mendefinisikan istilah-istilah baru seputar cara situs web dirayapi dengan mengadopsi standar Lisensi Sangat Sederhana, yang menambahkan persyaratan lisensi ke robots.txt.

Tautan Sumber