Rumah Teknologi Mistral Rilis Devstral, model AI agen open-source yang mengungguli GPT-4.1 Mini

Mistral Rilis Devstral, model AI agen open-source yang mengungguli GPT-4.1 Mini

37
0
Mistral Releases Devstral, an Open-Source Agentic Coding AI Model That Outperforms GPT-4.1 Mini

Mistral merilis model intelijen buatan (AI) yang berfokus pada pengkodean baru pada hari Rabu. Dijuluki Devstral, ini adalah agen pengkodean sumber terbuka yang dapat melakukan tugas pengembangan perangkat lunak. Perusahaan AI yang berbasis di Paris mengatakan bahwa, tidak seperti agen rekayasa perangkat lunak terbuka lainnya (SWE), model ini dapat menyelesaikan masalah rekayasa perangkat lunak dunia nyata dan menulis kode kontekstual dalam basis kode. Perusahaan mengklaim bahwa model AI berada di peringkat atas tolok ukur yang diverifikasi SWE berdasarkan tes internal. Khususnya, Mistral membangun model AI bekerja sama dengan semua tangan AI.

Agen pengkodean Devstral Mistral diklaim menawarkan kemampuan pengkodean praktis

Di ruang redaksi posperusahaan AI Prancis mengumumkan pengkodean dan merinci kemampuannya. Dalam sebulan terakhir, pemain AI utama telah fokus pada membawa agen pengkodean bertenaga AI ke pasar. Openai memperkenalkan Codex, Microsoft meluncurkan agen pengkodean GitHub Copilot, dan Google membuat Jules tersedia sebagai beta publik. Sekarang, Mistral juga bergabung dengan perusahaan -perusahaan ini dengan Devstral.

Mistral mengatakan bahwa sementara model bahasa besar open-source yang ada (LLM) mampu melakukan tugas pengkodean terisolasi seperti menulis fungsi mandiri atau penyelesaian kode, mereka berjuang ketika menulis kode kontekstual dalam basis kode besar. Perusahaan menambahkan bahwa ini mengarah pada masalah ketika agen AI harus mengidentifikasi hubungan antara komponen yang berbeda dan juga mengidentifikasi bug halus.

Perusahaan percaya bahwa Devstral memecahkan masalah ini dengan kemampuannya untuk mengontekstualisasikan tugas pengkodean dengan database dan kerangka kerja yang ada. Berdasarkan pengujian internal, mencetak 46,8 persen pada patokan yang diverifikasi SWE, peringkat di posisi teratas. Ini juga mengungguli model sumber terbuka yang lebih besar seperti Qwen 3 dan Deepseek V3, serta model kepemilikan seperti Openai’s GPT-4.1-Mini dan Antropik Claude 3.5 Haiku.

Datang ke arsitektur, Devstral disesuaikan dari model Mistral-Small-3.1 AI dan memiliki jendela konteks hingga 1.28.000 token. Ini adalah model teks saja karena datang tanpa encoder penglihatan yang dilengkapi dalam small-3.1. Khususnya, Devstral dapat menggunakan alat untuk menjelajahi basis kode, mengedit beberapa file, dan menyalakan agen SWE lainnya.

Mistral mengatakan bahwa Devstral adalah model ringan yang dapat berjalan pada GPU NVIDIA RTX 4090 tunggal atau Mac dengan 32GB RAM. Karena ini, dapat digunakan secara lokal dan dijalankan sepenuhnya di perangkat. Mereka yang ingin mengunduh model dapat mengaksesnya Wajah memeluk, OllamaKaggle, Studio Tidak Merasa, dan LM. Ini tersedia dengan lisensi APACHE 2.0 permisif yang memungkinkan penggunaan akademik dan komersial.

Selain itu, ini juga dapat digunakan sebagai Antarmuka Pemrograman Aplikasi (API). Mistral telah mendaftarkan agen AI dengan nama Devstral-Small-2505, dan harganya $ 0,1 (sekitar Rs. 8,6) per juta token input dan $ 0,3 (kira-kira Rs. 25) per juta token output.

Tautan sumber