Pengembang Perancis AI Mistral meluncurkan serangkaian model bahasa baru yang dirancang untuk menghadirkan kemampuan AI kelas atas kepada lebih banyak orang, di mana pun mereka berada, seberapa andal akses internet mereka, atau bahasa apa yang mereka gunakan.

Perusahaan pada hari Selasa mengumumkan model bahasa besar baru, yang disebut Mistral Large 3, yang ditujukan untuk penggunaan umum dan luas. Pikirkan ChatGPT atau Gemini. Model lainnya hadir dalam berbagai ukuran dan kemampuan dan dibuat untuk digunakan pada perangkat itu sendiri. Model yang lebih kecil ini dapat dijalankan di laptop, ponsel pintar, mobil, atau robot, dan dapat disetel untuk melakukan tugas tertentu.

Atlas AI

Semua model bersifat open source dan openweight, artinya pengembang yang menggunakannya dapat melihat cara kerjanya dan menyesuaikannya agar sesuai dengan kebutuhan mereka. “Kami sangat yakin hal ini akan membuat AI dapat diakses oleh semua orang, pada dasarnya menempatkan AI di tangan mereka,” kata Guillaume Lample, salah satu pendiri dan kepala ilmuwan di Mistral AI, dalam sebuah wawancara.

Mistral AI, yang didirikan oleh mantan peneliti Google DeepMind dan Meta, tidak memiliki nama besar di AS dibandingkan pesaingnya seperti OpenAI dan Anthropic, tetapi lebih dikenal di Eropa. Seiring dengan model yang tersedia untuk peneliti dan perusahaan, ia menawarkan chatbot bernama Le Chat, yang juga tersedia melalui peramban atau di toko aplikasi.

Model AI dirancang untuk multibahasa

Lample mengatakan perusahaannya mempunyai tujuan dengan rangkaian model barunya untuk menyediakan kemampuan AI terdepan yang bersifat open source dan dapat diakses. Sebagian dari itu ada hubungannya dengan bahasa. Sebagian besar model AI yang populer di AS dibuat terutama untuk digunakan dalam bahasa Inggris, begitu pula alat pembandingan yang membandingkan kemampuan model. Meskipun model-model tersebut mampu bekerja dalam bahasa lain dan menerjemahkan, model-model tersebut mungkin tidak sebaik yang disarankan oleh tolok ukur ketika digunakan dalam bahasa non-Inggris, kata Lample.

Tonton ini: Bisakah AI Mengembangkan Kecanduan Judi? Perang Browser Berbahan Bakar AI, dan Masa Depan Pekerjaan Dengan Jason Hiner dari ZDNET | Teknologi Hari Ini

Mistral AI ingin model barunya berfungsi lebih baik bagi penutur semua bahasa, sehingga meningkatkan jumlah data pelatihan non-Inggris sebanding dengan data bahasa Inggris. “Saya pikir orang-orang biasanya tidak terlalu memaksakan kemampuan multibahasa karena jika mereka melakukannya, kinerja mereka juga akan sedikit menurun pada tolok ukur populer yang dilihat semua orang,” kata Lample. “Jadi jika Anda ingin benar-benar membuat model Anda bersinar pada tolok ukur populer, Anda harus mengorbankan (kinerja) multibahasa. Dan sebaliknya, jika Anda ingin model Anda benar-benar bagus dalam multibahasa, pada dasarnya Anda harus menyerah pada tolok ukur populer.”

Berbagai ukuran untuk berbagai kegunaan

Selain model Mistral Large 3 untuk keperluan umum, dengan total 675 miliar parameter, ada tiga model lebih kecil yang disebut Ministral 3 — parameter 3 miliar, 8 miliar, dan 14 miliar — yang masing-masing hadir dalam tiga variasi, dengan total sembilan. (Parameter adalah bobot atau fungsi yang memberi tahu model cara menangani data masukannya. Model yang lebih besar akan lebih baik dan lebih mampu, namun model tersebut juga memerlukan daya komputasi yang lebih besar dan bekerja lebih lambat.)

Tiga jenis model yang lebih kecil dipecah sebagai berikut: satu model dasar yang dapat diubah dan disesuaikan oleh pengguna, satu lagi disempurnakan oleh Mistral agar berkinerja baik, dan satu lagi dibuat berdasarkan pertimbangan yang menghabiskan lebih banyak waktu untuk mengulangi dan memproses kueri untuk mendapatkan jawaban yang lebih baik.

Baca selengkapnya: Esensi AI: 29 Cara Membuat Gen AI Bekerja untuk Anda, Menurut Pakar Kami

Model yang lebih kecil sangat penting karena banyak pengguna AI menginginkan sesuatu yang dapat melakukan satu atau dua tugas dengan baik dan efisien dibandingkan model umum yang besar dan mahal, menurut Lample. Pengembang dapat menyesuaikan model ini untuk pekerjaan spesifik tersebut, dan seseorang atau perusahaan dapat menghostingnya di server mereka sendiri, sehingga menghemat biaya menjalankannya di pusat data di suatu tempat.

Model yang lebih kecil juga dapat beroperasi pada perangkat tertentu. Yang kecil bisa dijalankan di ponsel cerdas Anda, yang sedikit lebih besar bisa dijalankan di laptop Anda. Hal ini memberikan manfaat bagi privasi dan keamanan — data Anda tidak pernah keluar dari perangkat — serta penghematan biaya dan energi.

Model kecil yang berjalan pada perangkat itu sendiri juga tidak memerlukan akses internet untuk berfungsi, yang merupakan hal penting ketika Anda memikirkan tentang AI yang digunakan dalam hal-hal seperti robot dan mobil, di mana mengandalkan Wi-Fi yang dapat diandalkan agar segala sesuatunya berfungsi dengan baik tidaklah demikian.

Tautan Sumber