iFlytek официально выпустила крупномасштабную голосовую модель синхронного перевода Xinghuo, ознаменовав официальный запуск первой в Китае крупномасштабной модели со сквозными возможностями синхронного перевода. Эта модель была применена в iFlytek Translator, обеспечивая практически полное отсутствие задержек при синхронном переводе речи с английского на китайский, значительно повышая скорость и точность перевода и подходит для различных сценариев международного общения, таких как зарубежные поездки и международные выставки. Его основная технология заключается в поддержке обратного контроля длины перевода и повышении естественности и плавности перевода с помощью технологии потокового синтеза речи. Производительность этой модели превосходит такие технологии устного перевода, как Google Gemini 2.0 и OpenAI GPT-4o, и может обеспечить задержку одновременного перевода не более 5 секунд, достигая уровня экспертов-переводчиков.
Сегодня iFlytek официально представила свою недавно разработанную крупномасштабную голосовую модель синхронного перевода Spark, ознаменовав официальный запуск первой отечественной крупномасштабной модели со сквозными возможностями голосового синхронного перевода. По сравнению с предыдущей технологией перевода iFlytek эта инновационная технология значительно улучшила эффект перевода во всех сценариях и значительно сократила время сквозного ответа.
Выпуск голосовой модели синхронного перевода Xinghuo обеспечивает пользователям более плавный и точный синхронный перевод. В демонстрации iFlytek переводчик iFlytek, оснащенный крупномасштабной голосовой моделью синхронного перевода Spark, практически не достигал задержки при синхронном переводе англо-китайского голоса, что очень подходит для использования в таких сценариях, как зарубежные поездки и международные выставки. Такая оптимизация не только значительно повышает скорость рендеринга переведенных субтитров, но и обеспечивает точность китайско-английского перевода.
Понятно, что большая модель синхронного перевода речи Xinghuo поддерживает обратный контроль длины перевода. В процессе сквозного перевода речи в текст она может выполнять сегментацию смысловых групп, понимание контекста и реорганизацию информации в потоковом режиме. В то же время технология потокового синтеза речи также может поддерживать просодическую связь смысловых групп и адаптивную регулировку скорости речи, что еще больше повышает естественность и беглость перевода.
В сценариях международного общения, будь то ежедневный диалог, деловое общение или отраслевой перевод, а также другие сложные задачи синхронного перевода, большая голосовая модель синхронного перевода Xinghuo продемонстрировала отличную производительность. Полнота контента, точность информации и качество языка находятся на ведущем уровне в отрасли и превосходят такие технологии перевода, как Google Gemini2.0 и OpenAI GPT-4o. Максимально возможная задержка синхронного перевода составляет не более 5 секунд, что соответствует уровню специалистов-переводчиков.
Выпуск крупномасштабной голосовой модели синхронного перевода Spark от iFlytek не только представляет собой крупный прорыв в отечественной технологии искусственного перевода, но также указывает на то, что международное общение в будущем станет более удобным и эффективным.
Появление голосовой модели синхронного перевода Xinghuo знаменует собой новую веху в технологии искусственного перевода. В будущем она будет лучше служить международному обмену и сотрудничеству, а также будет способствовать эффективности и удобству глобального общения. Достижения в области технологий будут и дальше улучшать жизнь людей и приносить миру больше возможностей.