Teknologi StreamVoice yang diluncurkan bersama oleh Northwestern Polytechnical University dan ByteDance dibuat khusus untuk skenario media streaming dan mencapai konversi suara zero-shot berdasarkan model bahasa. Teknologi ini mendobrak keterbatasan konversi suara tradisional dan menghadirkan kemungkinan baru pada aplikasi streaming. Intinya adalah menggunakan model bahasa untuk konversi ucapan, dan untuk meningkatkan akurasi dan efisiensi model dengan terus meningkatkan data pelatihan, sehingga dapat lebih memenuhi persyaratan media streaming yang real-time dan berkualitas tinggi. Di masa depan, teknologi ini diharapkan dapat memainkan peran penting dalam lebih banyak aplikasi streaming.
Universitas Politeknik Northwestern Tiongkok dan ByteDance bersama-sama meluncurkan teknologi StreamVoice, yang didasarkan pada desain model bahasa dan mewujudkan konversi suara zero-shot. Teknologi ini dirancang khusus untuk skenario media streaming. Teknologi ini menghadirkan kemampuan streaming dan berencana untuk meningkatkan kemampuan pemodelannya dengan meningkatkan data pelatihan.
Sebagai pencapaian inovatif, teknologi StreamVoice menunjukkan perkembangan pesat dan kekuatan teknologi Tiongkok di bidang kecerdasan buatan. Kami menantikan penerapan teknologi StreamVoice yang lebih luas di masa depan, memberikan pengalaman streaming yang lebih nyaman dan efisien kepada pengguna.