Dalam dorongan strategis untuk memperkuat pijakannya di ruang AI generatif, Meta merilis design pertama dari AI Collection open-source terbaru, Llama 4, pada hari Sabtu.

Dalam sebuah video clip Instagram, chief executive officer Meta Mark Zuckerberg membagikan ambisi AI yang berani perusahaan: “Tujuan kami adalah untuk membangun AI terkemuka di dunia, open source it, dan membuatnya dapat diakses secara global … Saya sudah mengatakan untuk sementara waktu itu AI akan memimpin jalan, dan dengan Llama 4, kita mulai melihat itu terjadi.”

Dua version awal- Llama 4 Precursor dan Llama 4 Maverick-Are sekarang tersedia untuk diunduh melalui situs web Llama dan memeluk wajah. Model -model ini juga berfungsi sebagai fondasi untuk Meta AI, asisten online perusahaan yang sekarang diintegrasikan di WhatsApp, Instagram, Carrier, dan Internet.

Selain itu, Meta memperkenalkan Llama 4 Leviathan, menggambarkannya sebagai salah satu version bahasa besar yang paling cerdas (LLM), dan versi fading kuat yang pernah mereka kembangkan. Ini dimaksudkan untuk membantu melatih dan memandu version masa depan.

Peluncuran ini juga menandai penggunaan meta dari kerangka kerja campuran (MOE). MOE membagi model menjadi komponen khusus yang dapat difokuskan pada bidang-bidang seperti fisika, puisi, biologi, atau pemrograman. Selama tugas apa word play here, hanya modul ahli yang paling relevan yang diaktifkan, meningkatkan efisiensi dan mengurangi biaya untuk pelatihan dan inferensi.

Sorotan version

Llama 4 Precursor dibangun dengan 17 miliar specification dan 16 pakar, menawarkan jendela konteks 10 juta token. Dirancang untuk beroperasi pada GPU tunggal, ini mencerminkan tren terhadap model ringan dan berkinerja tinggi yang mirip dengan rilis Gemma 3 terbaru Google.

Llama 4 Maverick, juga pada 17 miliar criterion tetapi dengan 128 ahli, dimaksudkan sebagai model tujuan umum untuk berbagai kasus penggunaan asisten. Meta menggambarkannya sebagai “pekerja keras” yang dapat diandalkan yang mampu menangani obrolan, penalaran, dan tugas electronic lainnya.

Meta Klaim Maverick mengungguli GPT- 4 O Openai dan Google Gemini 2.0 berkedip di beberapa tolok ukur, termasuk pembuatan kode, penalaran, pemahaman multibahasa, analisis gambar, dan menangani konteks yang panjang. Ini juga menyaingi Deepseek v 3 1, design yang jauh lebih besar, dalam kinerja di seluruh pengkodean dan tugas berbasis logika.

Awal tahun ini, Deepseek mengklaim modelnya dapat mencocokkan mereka dari perusahaan -perusahaan AS terkemuka, mendorong kekhawatiran atas peningkatan persaingan global di AI. Namun, eksekutif Meta dan Google telah meremehkan dampaknya.

Apa selanjutnya: raksasa dan seterusnya

Masih dalam pengembangan, version raksasa LLAMA 4 diharapkan menampilkan 288 miliar specification aktif, 16 ahli, dan hampir 2 triliun overall criterion. Meta mengatakan itu mengungguli GPT- 4 5, Claude Sonnet 3 7, dan Gemini 2.0 Pro dalam tes terkait batang.

Zuckerberg juga menggoda penalaran llama 4, sebuah model yang difokuskan secara khusus pada tugas pemecahan masalah dan analitik yang kompleks. Rincian lebih lanjut diharapkan dalam beberapa minggu mendatang.

“Ini hanyalah awal lineup Llama 4,” tulis Meta dalam sebuah posting blog. “Kami percaya sistem AI paling canggih harus mampu mengambil tindakan umum, terlibat dalam percakapan alami, dan mengatasi masalah yang belum pernah mereka temui sebelumnya.”

Meningkatkan

Meta mengungkapkan bahwa unduhan model Llama melampaui satu miliar hanya dua minggu sebelum peluncuran Llama 4 dari 650 juta pada bulan Desember 2024

Kembali pada bulan Januari, Zuckerberg mengumumkan pengeluaran infrastruktur AI perusahaan untuk tahun 2025 akan berkisar antara $ 60 miliar dan $ 65 miliar, yang mencakup investasi di web server, pusat information, dan sumber daya lain yang diperlukan untuk mendukung upaya AI yang berkembang Meta.


Tautan Sumber