A tecnologia StreamVoice lançada em conjunto pela Northwestern Polytechnical University e ByteDance é feita sob medida para cenários de streaming de mídia e alcança conversão de voz instantânea com base em modelos de linguagem. Esta tecnologia rompe as limitações da conversão de voz tradicional e traz novas possibilidades para aplicações de streaming. Seu núcleo é usar modelos de linguagem para conversão de fala e melhorar a precisão e eficiência do modelo aumentando continuamente os dados de treinamento, de modo a atender melhor aos requisitos de alta qualidade e em tempo real da mídia de streaming. No futuro, espera-se que esta tecnologia desempenhe um papel importante em mais aplicações de streaming.
A Universidade Politécnica do Noroeste da China e a ByteDance lançaram em conjunto a tecnologia StreamVoice, que é baseada no design do modelo de linguagem e realiza conversão de voz de disparo zero. Ela é especialmente projetada para cenários de streaming de mídia. A tecnologia traz recursos de streaming e planeja melhorar seus recursos de modelagem aumentando os dados de treinamento.
Como uma conquista inovadora, a tecnologia StreamVoice demonstra o rápido desenvolvimento e a força tecnológica da China no campo da inteligência artificial. Esperamos aplicações mais amplas da tecnologia StreamVoice no futuro, trazendo aos usuários uma experiência de streaming mais conveniente e eficiente.