Ahli robotik Eropa saat ini merilis model kecerdasan buatan sumber terbuka yang kuat yang bertindak sebagai otak bagi robot industri—membantu mereka memahami dan memanipulasi berbagai hal dengan ketangkasan baru.

Model baru, TOMBAK-1dikembangkan oleh para peneliti di Institut Ilmu Komputer, Kecerdasan Buatan dan Teknologi (INSAIT) di Bulgaria. Hal ini dapat membantu peneliti dan startup lain membangun dan bereksperimen dengan perangkat keras yang lebih cerdas untuk pabrik dan gudang.

Sama seperti model bahasa sumber terbuka yang memungkinkan para peneliti dan perusahaan bereksperimen dengan AI generatif, Martin Vechev, ilmuwan komputer di INSIAT dan ETH Zurich, mengatakan SPEAR-1 seharusnya membantu para robotika untuk bereksperimen dan melakukan iterasi dengan cepat. “Model berbobot terbuka sangat penting untuk memajukan AI,” kata Vechev kepada WIRED sebelum peluncurannya.

SPEAR-1 berbeda dari model pondasi robot yang ada karena model ini menggabungkan data 3D ke dalam campuran pelatihannya. Hal ini memberi model pemahaman yang lebih baik tentang dunia fisik, sehingga lebih mudah untuk memahami bagaimana objek bergerak melalui ruang fisik.

Model landasan robot umumnya dibangun di atas model bahasa visi (VLM) yang memiliki pemahaman luas namun terbatas tentang dunia fisik karena pelatihan cenderung berasal dari gambar 2D berlabel. “Pendekatan kami mengatasi ketidaksesuaian antara ruang 3D tempat robot beroperasi dan pengetahuan tentang VLM yang membentuk inti model fondasi robot,” kata Vechev.

SPEAR-1 kira-kira sama kemampuannya dengan model pondasi komersial yang dirancang untuk mengoperasikan robot, jika diukur di RoboArena, sebuah patokan yang menguji kemampuan model untuk membuat robot melakukan hal-hal seperti memeras botol saus tomat, menutup laci, dan menjepit potongan kertas menjadi satu.

Perlombaan untuk membuat robot lebih pintar sudah terjadi miliaran dolar menungganginya. Potensi komersial dari robot yang umumnya berkemampuan tinggi telah melahirkan startup-startup yang memiliki pendanaan besar, termasuk Memisahkan Dan Generalis di samping itu Kecerdasan Fisik. SPEAR-1 hampir sama bagusnya dengan Pi-0,5 dari Physical Intelligence, sebuah startup bernilai miliaran dolar yang didirikan oleh tim peneliti robotika terkemuka.

SPEAR-1 menunjukkan bahwa upaya untuk membuat robot yang lebih cerdas mungkin melibatkan model tertutup seperti OpenAI, Google, dan Anthropic, serta varian sumber terbuka seperti Llama, DeepSeek, dan Qwen.

Namun, kecerdasan robot masih dalam tahap awal. Model AI dapat dilatih untuk mengoperasikan lengan robot sehingga dapat dengan andal mengambil objek tertentu dari meja. Namun dalam praktiknya, model tersebut perlu dilatih ulang dari awal jika menggunakan jenis lengan robot yang berbeda atau jika objek atau lingkungan diubah.

Tautan Sumber