Amazon merilis BASE TTS, model text-to-speech terbesar yang pernah ada

Penulis：Eve Cole Waktu Pembaruan：2025-02-02 06:16:01

Tim AGI Amazon baru-baru ini merilis BASE TTS, model text-to-speech dengan 98 miliar parameter yang dilatih menggunakan 100.000 jam perekaman data. Peluncuran model ini menandai kemajuan signifikan dalam teknologi text-to-speech. Sejumlah besar parameter dan data pelatihan yang sangat besar diharapkan dapat secara signifikan meningkatkan kealamian dan antropomorfisme sintesis ucapan serta memberikan pengalaman suara yang lebih baik kepada pengguna. Tujuan tim adalah menerapkan model ini pada aplikasi pembelajaran untuk lebih meningkatkan kualitas suara manusia dalam aplikasi text-to-speech.

Tim Amazon AGI merilis BASE TTS, model text-to-speech terbesar yang pernah ada, dengan 98 miliar parameter dan dilatih menggunakan 100.000 jam perekaman data. Tim berencana menggunakan model ini dalam aplikasi pembelajaran untuk meningkatkan kualitas suara manusia dalam aplikasi text-to-speech.

Pelepasan model BASE TTS menunjukkan kekuatan Amazon dalam bidang kecerdasan buatan dan visinya untuk teknologi suara masa depan. Di masa depan, kami berharap BASE TTS dapat berperan di lebih banyak bidang dan memberikan layanan yang lebih nyaman dan lebih baik kepada pengguna.