Последнюю серию моделей перевода речи Seamless Communication, выпущенную компанией Meta, можно назвать крупным прорывом в области перевода речи. В эту серию входят четыре модели, которые поддерживают перевод речи в реальном времени почти на сотню языков с задержкой всего около 2 секунд и могут с высокой степенью восстановления тона, скорости и других деталей исходной речи, делая эффект перевода реалистичным и естественным. . Шаг Meta не только демонстрирует ее лидирующие позиции в области искусственного интеллекта, но и приносит беспрецедентное удобство для глобального общения.
Недавно компания Meta выпустила новую модель перевода речи, серию Seamless Communication, которая включает в себя 4 модели и поддерживает перевод речи в реальном времени почти на 100 языков с контролем задержки около 2 секунд. Модель может воспроизводить сложные функции, такие как паузы, тон и скорость речи исходной речи, что делает перевод более реалистичным. Неавторегрессивная архитектура используется для поддержки трансляции длинных последовательностей. Кроме того, Meta открыла исходный код модели и крупнейшего речевого корпуса объемом 585 000 часов, а также добавила такие функции, как нанесение водяных знаков на звук и снижение токсичности перевода, чтобы предотвратить злоупотребление моделью.
Модель с открытым исходным кодом и массивный корпус Meta будут в значительной степени способствовать развитию технологий перевода речи и глобальному обмену информацией. В то же время ее меры по борьбе со злоупотреблениями также отражают чувство ответственности при применении технологий. Мы с нетерпением ждем, когда серия «Бесшовная коммуникация» преподнесет еще больше сюрпризов в будущем.