A 7ª Sound Expo dá início e lança uma série de aplicativos de IA

Autor：Eve Cole Data da Última Atualização：2024-11-16 18:24:02

Em 24 de outubro, a 7ª World Sound Expo e o 2024 iFlytek Global 1024 Developer Festival foram inaugurados em Hefei, o presidente da iFlytek, Liu Qingfeng, anunciou o boletim de aplicativos de modelo grande iFlytek Spark e lançou o iFlytek Spark 4.0 Turbo e aplicativos e produtos relacionados que capacitam a subsistência das pessoas. . No mesmo dia, foi lançada oficialmente a plataforma doméstica de computação inteligente de ultragrande escala "Feixing 2", construída em conjunto pela iFlytek, Huawei e Hefei Big Data Asset Operation Co., Ltd. Liu Qingfeng apresentou que a equipe conjunta de três partes superou muitas "doenças difíceis" no ano passado e resolveu mais de 500 problemas básicos de software e hardware e problemas de adaptação de modelo. No futuro, "Feixing 2" trará novos modelos e novos. algoritmos. Adaptação contínua e desenvolvimento em escala de clusters de computação inteligentes. No local, o humano digital superantropomórfico criado pela iFlytek fez sua estreia, realizando interação multimodal de voz, vídeo, imagem e texto, e apoiando os usuários na criação de seu próprio humano digital personalizado com edição e definição simples em segundo plano. Você pode gerar rapidamente sua própria imagem de desenho animado. Vale a pena mencionar que no campo do reconhecimento de voz, a tecnologia de reconhecimento de voz de alto ruído e campo distante da iFlytek expandiu ainda mais suas vantagens. Em termos de capacidades multilíngues, pela primeira vez, alcançou a cobertura total de mais de 200 dialetos em cidades de nível municipal em todo o país, em termos de capacidades multilíngues, lançou o grande modelo multilíngue Spark; pela primeira vez, que além de chinês e inglês, pode suportar russo, japonês, árabe, francês, etc. 8 idiomas. No local, a Huawei e a iFlytek lançaram conjuntamente uma tecnologia inovadora - a função de reparo de som, que utiliza poderosos recursos de processamento de voz em tempo real. Quando os usuários pronunciam palavras, sua fala é analisada em tempo real, reparada e otimizada para melhorar a inteligibilidade e a clareza da pronúncia, ajudando as pessoas com deficiência de fala a obter uma comunicação mais fluida.