メタは最近、ユネスコとのコラボレーションを発表し、人工知能(AI)の開発を促進することを目的とした言語テクノロジーパートナープログラムを開始しました。このプログラムは、特に少数民族の言語に焦点を当てており、音声録音とテキストレコードを収集することにより、将来のオープンソースAIテクノロジーをサポートすることを目的としています。
メタは最近、ユネスコと協力して新しい言語技術パートナーシッププログラムを発表し、将来のオープンで利用可能な人工知能(AI)を推進するために、音声録音とテキストレコードを複数の言語で収集しました。このプログラムは、デジタル環境で見落とされている少数言語に焦点を当てています。
メタによると、このプログラムはパートナーを引き付け、10時間以上の音声録音とその転写、豊富な書面によるテキスト、翻訳された文章のコレクションを提供したいと考えています。 Metaは、パートナーとの共同努力、および最終的にオープンソースでリリースされる結果を通じて、これらの言語をAIの音声認識と翻訳モデルに統合したいと考えています。
現在、確認されたパートナーには、カナダ北部のNunavut地域政府が含まれています。この地域では、この地域の住民がイヌイットと呼ばれる言語を使用しています。メタはブログで次のように述べています。「ユネスコの仕事をサポートするために、私たちの取り組みは、特にサービスの行き届いていない言語に焦点を当てています。 」
この計画を補完するために、Metaは言語翻訳モデルのパフォーマンスを評価するために設計されたオープンソースマシン翻訳ベンチマークもリリースします。言語学者によって設計されたこのベンチマークは、7つの言語をサポートし、アクセス可能で、AI開発プラットフォームを介して貢献しています。
Metaは両方のイニシアチブを慈善活動と見なしていますが、同社は音声認識と翻訳モデルをアップグレードすることからも恩恵を受けるでしょう。 METAは、AIアシスタント、Meta AI、およびテストなど、Instagramリールの音声翻訳の特徴によってサポートされている言語の数を拡大し続けており、作成者が声をダブして自動的に同期できるようにします。
言語処理におけるメタの努力は注目に値しますが、同社は英語以外のコンテンツの処理に対して多くの批判を受けています。レポートによると、Facebookがイタリア語とスペイン語でCovid-19の偽情報を処理すると、コンテンツのほぼ70%がマークされていませんが、英語のコンテンツはわずか29%です。さらに、リークされた文書は、アラビア語の内容がしばしばヘイトスピーチと誤ってラベル付けされていることを示しています。メタは、これらの課題に対処するために、翻訳およびコンテンツ監査技術を改善するための措置が講じられていると述べました。
このメタプログラムは、AIテクノロジーの開発を促進するだけでなく、グローバルな言語の多様性の保護にも重要な貢献をしています。