Baidu dilaporkan merilis version video clip generasi video clip buatan baru (AI) pada hari Rabu. Sesuai laporan, version AI musestreamer juga dapat mengintegrasikan audio Tiongkok dalam video yang dihasilkan, menjadikannya model kedua setelah Google VEO 3 Raksasa teknologi mengklaim itu sebagai design AI pertama di dunia dengan dukungan generasi sound Cina asli. Bersamaan dengan pengenalan Version Bahasa Besar (LLM), perusahaan dilaporkan juga meluncurkan platform pembuatan konten video baru yang dijuluki Huixiang. Khususnya, musestreamer maupun Huixiang saat ini tidak tersedia di luar Cina.
Musestreamer Baidu dilaporkan dapat menghasilkan audio Cina
Model dunia generasi video AI telah berevolusi secara signifikan dalam dua tahun terakhir. Kami telah pindah dari model yang berjuang untuk menghasilkan orang dengan sejumlah jari yang tetap ke LLMS yang sekarang dapat secara akurat menggambarkan fisika dan gerakan yang realistis. Namun, satu area yang sebagian besar pemain AI menahan diri dari masuk adalah video clip yang juga mendukung audio secara asli.
Di Google I/O 2025, raksasa teknologi menjadi perusahaan pertama yang menawarkan kemampuan ini dengan VEO 3, yang segera menjadi pembicaraan kota, meninggalkan saingan terbesarnya, Openai’s Sora, di belakang. Raksasa teknologi yang berbasis di Mountain Sight baru-baru ini memperluas VEO 3 di semua 154 negara di mana aplikasi Gemini tersedia, menyoroti dorongan agresif perusahaan untuk alat ini.
Namun, menurut teknologi di Asia laporan ( melalui Pangkalan AI), raksasa teknologi Cina Baidu juga telah memasuki balapan dengan model AI Musestream. Dikatakan untuk menghasilkan video dengan sound Cina, dan satu -satunya design dengan kemampuan untuk melakukannya. Khususnya, VEO 3 hanya dapat menghasilkan sound dalam bahasa Inggris.
Musestreamer dilaporkan tidak hanya menghasilkan dialog yang disinkronkan dengan video, tetapi juga dapat menambahkan efek suara dan suara ambien dalam video clip. Baidu dikatakan telah mengklaim bahwa version tersebut mencapai skor 89, 38 persen pada patokan VBENCH I 2 V, peringkat di atas. Raksasa teknologi ini melempar LLM sebagai alat pembuatan konten untuk konsumen.
Bersamaan dengan model AI, Baidu dilaporkan juga meluncurkan system konten video clip baru yang dijuluki Huixiang. Huixiang dikatakan berfungsi sebagai front-end untuk design AI, di mana pengguna dapat berbagi petunjuk dan menghasilkan video clip. System saat ini mendukung generasi video sepanjang 10 detik pada resolusi 1080 p, laporan tersebut menyatakan. Sebagai perbandingan, VEO 3 hanya dapat menghasilkan video clip selama delapan detik. Tidak ada kejelasan atas rasio aspek default video, dan jika pengguna dapat menghasilkan video clip dalam rasio aspek yang berbeda.