Мета недавно объявила о сотрудничестве с ЮНЕСКО для запуска программы партнерства по языковым технологиям, направленной на содействие развитию искусственного интеллекта (ИИ). Программа сосредоточена специально на языках этнических меньшинств и направлена на поддержку будущих технологий ИИ с открытым исходным кодом, собирая голосовые записи и текстовые записи.
Meta недавно объявила о новой программе партнерства с технологиями языка в партнерстве с ЮНЕСКО для сбора голосовых записей и текстовых записей на нескольких языках, чтобы стимулировать будущий открытый и доступный искусственный интеллект (ИИ). Эта программа посвящена языкам меньшинств, которые упускаются из виду в цифровой среде.
Согласно Meta, программа надеется привлечь партнеров, предоставив более 10 часов голосовых записей и их транскрипции, богатые письменные тексты и коллекцию переведенных предложений. Мета надеется интегрировать эти языки в свою модель распознавания речи и перевода искусственного интеллекта посредством совместных усилий с его партнерами, и результаты, которые в конечном итоге будут опубликованы в открытом исходном коде.
На данный момент подтвержденные партнеры включают региональное правительство Нунавута в Северной Канаде, где некоторые жители региона используют язык, называемый инуитом. Мета сказала в своем блоге: «Наши усилия сосредоточены специально на недостаточно обслуживаемых языках для поддержки работы ЮНЕСКО. ”
Чтобы дополнить этот план, Meta также выпустит контрольный эталон перевода с открытым исходным кодом, предназначенный для оценки производительности моделей языкового перевода. Разработанный лингвистами, этот эталон поддерживает семь языков и доступен и вносится вклад через платформу для развития искусственного интеллекта.
Мета рассматривает обе инициативы как благотворительные действия, но компания также выиграет от модернизации своих моделей распознавания голоса и перевода. Meta продолжает расширять количество языков, поддерживаемых его помощником ИИ, Meta AI и тестами, например, функциями голосового перевода на барабанах в Instagram, позволяя создателям дублировать и автоматически синхронизировать свои голоса.
Хотя усилия Meta в области обработки языка заслуживают внимания, компания получила большую критику за обработку неанглийского содержания. Отчеты показывают, что, когда Facebook обрабатывает дезинформацию Covid-19 на итальянском и испанском языке, почти 70% контента без опознавательных знаков, в то время как английский контент составляет всего 29%. Кроме того, просочившиеся документы показывают, что арабское содержание часто неправильно маркируется как ненавистническая речь. Мета сказал, что предпринимаются шаги для улучшения его технологии перевода и аудита контента для решения этих проблем.
Эта мета -программа не только способствует разработке технологии ИИ, но также вносит важный вклад в защиту глобального языкового разнообразия.