เทคโนโลยี StreamVoice เปิดตัวร่วมกันโดย Northwestern Polytechnical University และ ByteDance ได้รับการออกแบบมาเพื่อการสตรีมสื่อโดยเฉพาะ และบรรลุการแปลงเสียงแบบ Zero-shot ตามโมเดลภาษา เทคโนโลยีนี้ทลายข้อจำกัดของการแปลงเสียงแบบเดิม และนำความเป็นไปได้ใหม่ๆ มาสู่แอปพลิเคชันสตรีมมิ่ง แกนหลักคือการใช้โมเดลภาษาสำหรับการแปลงคำพูด และเพื่อปรับปรุงความแม่นยำและประสิทธิภาพของโมเดลโดยการเพิ่มข้อมูลการฝึกอบรมอย่างต่อเนื่อง เพื่อตอบสนองความต้องการแบบเรียลไทม์และคุณภาพสูงของสื่อสตรีมมิ่งได้ดียิ่งขึ้น ในอนาคตเทคโนโลยีนี้คาดว่าจะมีบทบาทสำคัญในแอพพลิเคชั่นสตรีมมิ่งมากขึ้น
Northwestern Polytechnical University ของจีนและ ByteDance ร่วมกันเปิดตัวเทคโนโลยี StreamVoice ซึ่งใช้การออกแบบโมเดลภาษาและทำให้เกิดการแปลงเสียงแบบ Zero-Shot ซึ่งได้รับการออกแบบมาเป็นพิเศษสำหรับสถานการณ์สื่อสตรีมมิ่ง เทคโนโลยีนี้นำความสามารถในการสตรีมและแผนการปรับปรุงความสามารถในการสร้างโมเดลโดยการเพิ่มข้อมูลการฝึกอบรม
ในฐานะความสำเร็จด้านนวัตกรรม เทคโนโลยี StreamVoice แสดงให้เห็นถึงการพัฒนาอย่างรวดเร็วและความแข็งแกร่งทางเทคโนโลยีของจีนในด้านปัญญาประดิษฐ์ เราหวังว่าจะมีการประยุกต์ใช้เทคโนโลยี StreamVoice ในวงกว้างขึ้นในอนาคต ซึ่งจะทำให้ผู้ใช้ได้รับประสบการณ์การสตรีมที่สะดวกและมีประสิทธิภาพมากขึ้น