iFlytek a officiellement lancé le modèle vocal d'interprétation simultanée à grande échelle Xinghuo, marquant le lancement officiel du premier modèle chinois à grande échelle doté de capacités d'interprétation vocale simultanée de bout en bout. Ce modèle a été appliqué à iFlytek Translator, obtenant presque aucun retard dans l'interprétation vocale simultanée de l'anglais vers le chinois, améliorant considérablement la vitesse et la précision de la traduction, et convient à une variété de scénarios de communication internationale, tels que les voyages à l'étranger et les expositions internationales. Sa technologie de base consiste à prendre en charge le contrôle inverse de la longueur de la traduction et à améliorer le naturel et la fluidité de la traduction grâce à la technologie de synthèse vocale en streaming. Les performances de ce modèle surpassent les technologies d'interprétation telles que Google Gemini 2.0 et OpenAI GPT-4o, et peuvent atteindre un délai d'interprétation simultanée de moins de 5 secondes au plus rapide, atteignant le niveau des traducteurs experts humains.
Aujourd'hui, iFlytek a officiellement lancé son nouveau modèle vocal à grande échelle d'interprétation simultanée Spark, marquant le lancement officiel du premier modèle national à grande échelle doté de capacités d'interprétation vocale simultanée de bout en bout. Par rapport à la technologie de traduction précédente d'iFlytek, cette technologie innovante a considérablement amélioré l'effet de traduction dans tous les scénarios et a considérablement réduit le temps de réponse de bout en bout.
La sortie du modèle vocal d'interprétation simultanée Xinghuo offre aux utilisateurs une expérience d'interprétation simultanée plus fluide et plus précise. Dans la démonstration iFlytek, le traducteur iFlytek équipé d'un modèle vocal d'interprétation simultanée Spark à grande échelle n'a obtenu presque aucun retard dans l'interprétation simultanée vocale anglais-chinois, ce qui est très approprié pour une utilisation dans des scénarios tels que les voyages à l'étranger et les expositions internationales. Cette optimisation améliore non seulement considérablement la vitesse de rendu des sous-titres traduits, mais garantit également l'exactitude de la traduction chinois-anglais.
Il est entendu que le grand modèle de parole d'interprétation simultanée Xinghuo prend en charge le contrôle inverse de la longueur de la traduction pendant le processus de traduction de bout en bout de la parole au texte, il peut effectuer une segmentation des groupes de signification, une compréhension du contexte et une réorganisation des informations en continu. Dans le même temps, la technologie de synthèse vocale en continu peut également prendre en charge la connexion prosodique des groupes de signification et l'ajustement adaptatif de la vitesse de parole, améliorant ainsi le naturel et la fluidité de la traduction.
Dans les scénarios de communication internationale, qu'il s'agisse de dialogue quotidien, de communication commerciale ou de traduction industrielle et d'autres besoins difficiles d'interprétation simultanée, le grand modèle vocal d'interprétation simultanée Xinghuo a démontré d'excellentes performances. L'exhaustivité de son contenu, l'exactitude de ses informations et la qualité de son langage sont tous au premier niveau du secteur et ont surpassé les technologies de traduction telles que Google Gemini2.0 et OpenAI GPT-4o. Le délai d'interprétation simultanée le plus rapide possible est de 5 secondes, atteignant le niveau des traducteurs experts humains.
La sortie du modèle vocal d'interprétation simultanée Spark à grande échelle d'iFlytek représente non seulement une avancée majeure dans la technologie nationale de traduction par l'IA, mais indique également que la communication internationale sera plus pratique et plus efficace à l'avenir.
L'émergence du modèle vocal d'interprétation simultanée Xinghuo marque une nouvelle étape dans la technologie de traduction de l'IA. À l'avenir, il servira mieux les échanges et la coopération internationaux et favorisera l'efficacité et la commodité de la communication mondiale. Les progrès technologiques continueront d’améliorer la vie des gens et d’offrir davantage de possibilités au monde.