Google Unveils Video-Generation Model Veo 3 and Image Generation Model Imagen 4 at Google I/O 2025

Google meluncurkan generasi berikutnya dari model citra dan video generasi videonya (AI) version pada hari Selasa di acara I/O 2025 Dijuluki Imagen 4 dan VEO 3, design AI multimodal ini tiba dengan kemampuan baru dan peningkatan pendahulunya. Sementara Imagen 4 menampilkan waktu pembuatan yang lebih cepat dan providing teks yang lebih baik, VEO 3 mendapatkan kemampuan pembuatan sound asli dan dapat mengintegrasikan suara latar belakang dan dialog dalam video yang dihasilkan. Bersamaan dengan version baru, raksasa teknologi ini juga meluncurkan aplikasi pembuatan movie bertenaga AI baru yang dijuluki aliran.

Apa yang baru dengan Imagen 4 dan Veo 3

Di sebuah Publishing Blog raksasa teknologi berbasis Hill View merinci version AI generasi dan video clip baru. Imagen 4 datang hampir setahun setelah pendahulunya dirilis. Pada bulan Desember 2024, Google juga merilis VEO 2 dan memperbarui Imagen 3 dengan kemampuan baru.

Sekarang, dengan Imagen 4, perusahaan berfokus pada kecepatan generasi dan akurasi design. Mirip dengan generasi sebelumnya, version Imagen terbaru juga mendukung teks dan gambar sebagai input. Gambar yang dihasilkan menyaksikan peningkatan dalam menambahkan information halus seperti kain rumit, tetesan air, dan bulu hewan dalam gambar. Ini juga dapat menghasilkan gambar jauh lebih cepat daripada pendahulunya.

Google mengatakan Imagen 4 juga dapat menghasilkan gambar yang lebih baik dalam fotorealisme dan gaya abstrak. Ini menghasilkan output dalam berbagai rasio aspek dan resolusi hingga 2 K. Selain itu, perusahaan telah melakukan perbaikan dalam rendering teks dengan berfokus pada ejaan kata -kata serta tipografi. Design ini sekarang lebih sadar konteks tentang penempatan teks, pilihan ukuran font, serta membuat pilihan kreatif tentang gaya font style.

Imagen 4 saat ini tersedia di aplikasi Gemini, Kocok, Vertex AI (untuk perusahaan), dan di seluruh aplikasi ruang kerja seperti dokumen, slide, video clip, dan banyak lagi. Tidak jelas apakah Google berencana untuk memperluas version ke semua pengguna Gemini atau hanya pelanggan yang dibayar. Akhir tahun ini, perusahaan juga berencana untuk meluncurkan versi model AI yang dapat menghasilkan gambar 10 x lebih cepat dari Imagen 3

Datang ke Veo 3, design pembuatan video terbaru Google sekarang hadir dengan pembuatan audio asli, dan dapat menggabungkan suara ambient, kebisingan latar belakang, dan dialog dalam video clip. Dalam trial yang ditampilkan di acara I/O 2025, dua karakter animasi dapat berbicara satu sama lain dengan suara yang jelas dan terdengar alami.

Terlepas dari ini, VEO 3 juga membawa peningkatan kepatuhan yang cepat, fisika dunia nyata, dan sinkronisasi bibir yang akurat. Saat ini tersedia untuk pelanggan Google AI Ultra di AS melalui aplikasi Gemini dan aplikasi yang dijuluki aplikasi yang baru diperkenalkan. Perusahaan dapat mengaksesnya melalui platform AI Vertex.

Flow adalah alat pembuatan film bertenaga AI yang memanfaatkan model Gemini, Imagen, dan VEO. Pengguna dapat menggambarkan klip video menggunakan petunjuk bahasa alami, dan aplikasi ini dapat menghasilkan video clip sepanjang delapan detik. Aplikasi ini dikatakan memiliki kepatuhan yang cepat, dan dapat menghasilkan bingkai pemeran, lokasi, objek, dan gaya yang konsisten. Ini tersedia untuk pelanggan Google AI Pro dan Ultra Strategy di AS.

Tautan sumber