O editor do Downcodes soube que um modelo de linguagem de 7 bilhões de parâmetros chamado Teuken-7B foi lançado na plataforma Hugging Face, suportando todos os 24 idiomas oficiais da UE. O modelo foi desenvolvido pelo projeto de pesquisa OpenGPT-X da UE e está disponível aos usuários como código aberto. Ao contrário da maioria dos modelos de linguagem de IA centrados no inglês, o Teuken-7B foi construído do zero, com cerca de metade dos seus dados de treino provenientes de línguas europeias não inglesas, dando-lhe uma vantagem significativa no tratamento de múltiplas línguas europeias.
Teuken-7B, um modelo de linguagem com 7 mil milhões de parâmetros, está agora disponível no Hugging Face e suporta todas as 24 línguas oficiais da UE. O modelo foi desenvolvido pelo projeto de pesquisa OpenGPT-X da UE e está disponível aos usuários como um projeto de código aberto. Ao contrário da maioria dos modelos de linguagem de IA centrados no inglês, o Teuken-7B foi construído do zero, com cerca de metade dos seus dados de treinamento provenientes de línguas europeias não inglesas.
Nota sobre a fonte da imagem: A imagem é gerada por IA e é autorizada pelo provedor de serviços Midjourney
A equipe de desenvolvimento afirma que o Teuken-7B tem um bom desempenho em todos os idiomas nos quais foi treinado e sua confiabilidade é particularmente impressionante ao lidar com idiomas diferentes do inglês. Para medir o desempenho dos modelos linguísticos em línguas europeias, a equipa do projeto também criou uma nova classificação europeia LLM, superando os métodos de teste padrão anteriores que se baseavam principalmente no inglês.
Este lançamento marca um avanço significativo no impulso da Europa para modelos de IA multilíngues, ao mesmo tempo que fornece aos desenvolvedores uma ferramenta poderosa e diversificada para apoiar aplicações e pesquisas em vários idiomas.
O lançamento de código aberto do Teuken-7B traz novas possibilidades ao campo da IA multilíngue e reflete os esforços ativos da Europa na investigação independente e no desenvolvimento de tecnologia de IA. Seus excelentes recursos de processamento multilíngue proporcionarão mais conveniência aos desenvolvedores globais e promoverão o desenvolvimento vigoroso de aplicativos multilíngues. Espera-se que o Teuken-7B possa desempenhar um papel em mais campos no futuro.