Meta는 최근 유네스코와의 협력을 발표하여 인공 지능 (AI)의 개발 홍보를 목표로하는 언어 기술 파트너 프로그램을 시작했습니다. 이 프로그램은 특히 소수 민족 언어에 중점을두고 있으며 음성 녹음 및 텍스트 레코드를 수집하여 미래의 오픈 소스 AI 기술을 지원하는 것을 목표로합니다.
Meta는 최근 유네스코와 파트너십을 통해 새로운 언어 기술 파트너십 프로그램을 발표하여 향후 개방적이고 이용 가능한 인공 지능 (AI)을 유도하기 위해 여러 언어로 음성 녹음 및 텍스트 레코드를 수집했습니다. 이 프로그램은 디지털 환경에서 간과되는 소수 언어에 중점을 둡니다.
Meta에 따르면이 프로그램은 파트너를 유치하여 10 시간 이상의 음성 녹음과 전사, 풍부한 서면 텍스트 및 번역 된 문장 모음을 제공하기를 희망합니다. 메타는 파트너와의 공동 노력과 결국 오픈 소스로 출시 될 결과를 통해 이러한 언어를 AI 음성 인식 및 번역 모델에 통합하기를 희망합니다.
현재 확인 된 파트너에는 캐나다 북부의 Nunavut 지역 정부가 포함되어 있으며,이 지역 주민들은 이누이트라는 언어를 사용합니다. 메타는 블로그에서 다음과 같이 말했습니다.“우리의 노력은 유네스코의 작업을 지원하기 위해 소외된 언어에 중점을 둡니다. '
이 계획을 보완하기 위해 Meta는 언어 번역 모델의 성능을 평가하도록 설계된 오픈 소스 기계 번역 벤치 마크를 출시 할 것입니다. 언어 학자들이 설계 한이 벤치 마크는 7 개 언어를 지원하며 AI 개발 플랫폼 포옹을 통해 접근 가능하고 기여합니다.
메타는 두 이니셔티브를 자선 행동으로보고 있지만 회사는 음성 인식 및 번역 모델을 업그레이드함으로써 혜택을받을 것입니다. Meta는 AI 어시스턴트, Meta AI 및 테스트가 지원하는 언어 수를 계속 확장하여 Instagram Reels의 음성 변환 기능을 사용하여 제작자가 음성을 더빙하고 자동으로 동기화 할 수 있습니다.
언어 처리에 대한 Meta의 노력은주의를 기울여야하지만, 회사는 영어가 아닌 컨텐츠 처리에 대한 많은 비판을 받았습니다. 보고서에 따르면 Facebook은 이탈리아어와 스페인어로 Covid-19 Disinformation을 처리 할 때 콘텐츠의 거의 70%가 표시되지 않으며 영어 콘텐츠는 29%에 불과합니다. 또한 유출 된 문서에 따르면 아랍어 콘텐츠는 종종 증오 연설로 잘못 표시됩니다. Meta는 이러한 문제를 해결하기 위해 번역 및 컨텐츠 감사 기술을 개선하기위한 단계가 진행되고 있다고 말했다.
이 메타 프로그램은 AI 기술의 개발을 촉진 할뿐만 아니라 글로벌 언어 다양성의 보호에 중요한 기여를합니다.