تم إطلاق تقنية StreamVoice بشكل مشترك من قبل جامعة Northwestern Polytechnical وByteDance، وهي مصممة خصيصًا لسيناريوهات الوسائط المتدفقة وتحقق تحويلًا صوتيًا بدون لقطة استنادًا إلى نماذج اللغة. تخترق هذه التقنية قيود تحويل الصوت التقليدي وتجلب إمكانيات جديدة لتطبيقات البث. جوهرها هو استخدام نماذج اللغة لتحويل الكلام، وتحسين دقة وكفاءة النموذج من خلال زيادة بيانات التدريب بشكل مستمر، وذلك لتلبية متطلبات الوقت الحقيقي وعالية الجودة لتدفق الوسائط بشكل أفضل. ومن المتوقع أن تلعب هذه التكنولوجيا دورًا مهمًا في المستقبل في المزيد من تطبيقات البث.
أطلقت جامعة نورث وسترن للفنون التطبيقية في الصين وByteDance بشكل مشترك تقنية StreamVoice، التي تعتمد على تصميم نموذج اللغة وتحقق تحويل الصوت بدون لقطة، وهي مصممة خصيصًا لسيناريوهات الوسائط المتدفقة. توفر التكنولوجيا إمكانات البث وخططًا لتحسين قدرات النمذجة من خلال زيادة بيانات التدريب.
وباعتبارها إنجازًا مبتكرًا، تُظهر تقنية StreamVoice التطور السريع للصين والقوة التكنولوجية في مجال الذكاء الاصطناعي. ونحن نتطلع إلى تطبيقات أوسع لتقنية StreamVoice في المستقبل، مما يوفر للمستخدمين تجربة بث أكثر ملاءمة وكفاءة.