ElevenLabs mengumumkan perluasan bahasa model intelijen buatan terbaru (AI) teks-ke-speech (TTS) minggu lalu. Dengan ekspansi ini, design AI sekarang mendukung 41 bahasa baru, mengambil jumlah complete menjadi 70 bahasa yang didukung. Startup AI yang berbasis di New york city City mengatakan bahwa dengan ekspansi ini, model ini sekarang dapat diakses hingga 90 persen dari populasi global. Khususnya, perusahaan merilis design Eleven V 3 (Alpha) pada 8 Juni, dan menyebutnya sebagai “model TTS paling ekspresif.”
Sebelas v 3 sekarang mendukung 70 bahasa
Di sebuah pos Di X (sebelumnya dikenal sebagai Twitter), pegangan resmi ElevenLabs mengumumkan bahwa model AI terbaru mereka, Eleven V 3, sekarang mendukung 41 bahasa tambahan. Dengan pembaruan ini, version dapat secara indigenous menghasilkan audio dari skrip teks dalam total 70 bahasa. Beberapa bahasa yang baru ditambahkan termasuk bahasa Arab, Assam, Bengali, Bulgaria, Catalan, Gujarati, Latvia, Melayu, Malayalam, Marathi, Nepali, Swahili, Tamil, dan Telugu.
Perusahaan menyarankan agar mereka yang ingin menghasilkan teks dalam salah satu bahasa baru harus merekam klon suara instan (IVC) saat memilih bahasa. Selain itu, ElevenLabs juga menambahkan suara perpustakaan suara untuk bahasa baru dalam beberapa minggu mendatang.
Eleven V 3 adalah penerus model V 2 dan V 2 5 TTS multibahasa. Version AI terbaru dukungan Tag sound inline seperti bisikan, bersemangat, mendesah, dan banyak lagi. Menambahkan tag sound memungkinkan version untuk menambahkan nuansa emosional ekspresif, isyarat non-verbal, dan pengiriman dramatis ke generasi sound.
Ini juga mendukung intraksi multi-speaker dengan gangguan, mondar-mandir alami, dan dialog yang tumpang tindih. Selain itu, perusahaan mengatakan model ini lebih baik menangani elemen seperti stres, irama, dan kesadaran kontekstual. Eleven V 3 tersedia melalui situs web perusahaan dan aplikasi seluler. Saat ini tidak tersedia sebagai Antarmuka Pemrograman Aplikasi (API).
Pada bulan April, ElevenLabs memperkenalkan fitur agen baru yang berfokus pada perusahaan. Bagian dari AI percakapan perusahaan, ini memungkinkan dua agen AI untuk berkomunikasi dan berbagi percakapan. Fitur ini menciptakan sistem di mana satu agen AI dapat menyerahkan percakapan kepada agen lain yang lebih khusus, bersama dengan data percakapan.