Arranca la 7ma Sound Expo y lanza una serie de aplicaciones de IA

Autor：Eve Cole Fecha de actualización：2024-11-16 18:24:02

El 24 de octubre, se inauguraron en Hefei la séptima World Sound Expo y el iFlytek Global 1024 Developer Festival, el presidente de iFlytek, Liu Qingfeng, anunció la boleta de calificaciones de aplicaciones de modelo grande de iFlytek Spark y lanzó iFlytek Spark 4.0 Turbo y aplicaciones y productos relacionados que potencian el sustento de las personas. . El mismo día, se lanzó oficialmente la plataforma informática inteligente nacional de gran escala "Feixing 2", construida conjuntamente por iFlytek, Huawei y Hefei Big Data Asset Operation Co., Ltd. Liu Qingfeng presentó que el equipo conjunto tripartito superó muchas "enfermedades difíciles" durante el año pasado y resolvió más de 500 problemas básicos de software y hardware y problemas de adaptación de modelos. En el futuro, "Feixing 2" traerá nuevos modelos y novedades. Algoritmos. Adaptación continua y desarrollo a escala de clusters de computación inteligente. En la escena, el humano digital súper antropomórfico creado por iFlytek hizo su debut, realizando una interacción multimodal de voz, video, imagen y texto, y ayudando a los usuarios a crear su propio humano digital personalizado con edición y definición simples en segundo plano. Puedes generar rápidamente tu propia imagen de dibujos animados. Vale la pena mencionar que en el campo del reconocimiento de voz, la tecnología de reconocimiento de voz de escenas de alto ruido y campo lejano de iFlytek ha ampliado aún más sus ventajas. En términos de capacidades multilingües, por primera vez ha logrado una cobertura completa de más de 200 dialectos en ciudades a nivel de prefectura de todo el país; en términos de capacidades multilingües, ha lanzado el modelo grande multilingüe Spark; por primera vez, que además de chino e inglés, admite 8 idiomas en ruso, japonés, árabe, francés, etc. En el lugar, Huawei e iFlytek lanzaron conjuntamente una tecnología innovadora: la función de reparación de sonido, que utiliza potentes capacidades de procesamiento de voz en tiempo real. Cuando los usuarios pronuncian palabras, su discurso se analiza en tiempo real y se repara y optimiza para mejorar la inteligibilidad y claridad de la pronunciación para ayudar a las personas con problemas del habla a lograr una comunicación más fluida.