A Meta anunciou recentemente uma colaboração com a UNESCO para lançar um programa de parceiros de tecnologia de idiomas destinado a promover o desenvolvimento da inteligência artificial (IA). O programa se concentra especificamente em idiomas das minorias étnicas e visa apoiar futuras tecnologias de IA de código aberto, coletando gravações de voz e registros de texto.
A Meta anunciou recentemente um novo programa de parceria de tecnologia de idiomas em parceria com a UNESCO para coletar gravações de voz e registros de texto em vários idiomas para impulsionar futuras Inteligência Artificial Aberta e Disponível (IA). Este programa se concentra em idiomas minoritários que são esquecidos no ambiente digital.
De acordo com a Meta, o programa espera atrair parceiros, fornecendo mais de 10 horas de gravações de voz e suas transcrições, textos escritos ricos e uma coleção de frases traduzidas. A Meta espera integrar esses idiomas em seu modelo de reconhecimento e tradução de fala da IA por meio de esforços conjuntos com seus parceiros e os resultados que serão divulgados em código aberto.
A partir de agora, os parceiros confirmados incluem o governo regional de Nunavut, no norte do Canadá, onde alguns moradores da região usam um idioma chamado inuit. A Meta disse em seu blog: “Nossos esforços se concentram especificamente em idiomas carentes para apoiar o trabalho da UNESCO. ”
Para complementar esse plano, a Meta também lançará um benchmark de tradução de máquina de código aberto projetado para avaliar o desempenho dos modelos de tradução de idiomas. Projetado por linguistas, este benchmark suporta sete idiomas e é acessível e contribuído por meio da plataforma de desenvolvimento da IA abraçando o rosto.
A Meta vê as duas iniciativas como ações de caridade, mas a empresa também se beneficiará da atualização de seus modelos de reconhecimento de voz e tradução. A Meta continua a expandir o número de idiomas suportados por seu assistente de IA, Meta AI e testes, por exemplo, os recursos da tradução de voz nos bobinas do Instagram, permitindo que os criadores durem e sincronizem automaticamente suas vozes.
Embora os esforços da Meta no processamento da linguagem mereçam atenção, a empresa recebeu muitas críticas pelo processamento de conteúdo não inglês. Os relatórios mostram que, quando o Facebook lida com a desinformação da CoVID-19 em italiano e espanhol, quase 70% do conteúdo não está marcado, enquanto o conteúdo em inglês é de apenas 29%. Além disso, documentos vazados mostram que o conteúdo do árabe é frequentemente rotulado como discurso de ódio. A Meta disse que as medidas estão sendo tomadas para melhorar sua tecnologia de tradução e auditoria de conteúdo para enfrentar esses desafios.
Este meta -programa não apenas promove o desenvolvimento da tecnologia de IA, mas também faz uma contribuição importante para a proteção da diversidade global da linguagem.