El editor de Downcodes se enteró de que se lanzó un modelo de lenguaje de 7 mil millones de parámetros llamado Teuken-7B en la plataforma Hugging Face, que admite los 24 idiomas oficiales de la UE. El modelo fue desarrollado por el proyecto de investigación EU OpenGPT-X y está disponible para los usuarios como código abierto. A diferencia de la mayoría de los modelos de lenguaje de IA centrados en el inglés, Teuken-7B se construyó desde cero y aproximadamente la mitad de sus datos de entrenamiento provienen de idiomas europeos distintos del inglés, lo que le brinda una ventaja significativa en el manejo de múltiples idiomas europeos.
Teuken-7B, un modelo de lenguaje con 7 mil millones de parámetros, ahora está disponible en Hugging Face y es compatible con los 24 idiomas oficiales de la UE. El modelo fue desarrollado por el proyecto de investigación EU OpenGPT-X y está disponible para los usuarios como un proyecto de código abierto. A diferencia de la mayoría de los modelos de lenguaje de IA centrados en el inglés, Teuken-7B se construyó desde cero y aproximadamente la mitad de sus datos de entrenamiento provienen de idiomas europeos distintos del inglés.
Nota sobre la fuente de la imagen: la imagen es generada por IA y la imagen está autorizada por el proveedor de servicios Midjourney
El equipo de desarrollo dice que Teuken-7B funciona bien en todos los idiomas en los que fue entrenado y su confiabilidad es particularmente impresionante cuando se trata de idiomas distintos del inglés. Para medir el rendimiento de los modelos lingüísticos en lenguas europeas, el equipo del proyecto también creó una nueva clasificación europea de LLM, superando los métodos de prueba estándar anteriores que se basaban principalmente en el inglés.
Este lanzamiento marca un importante paso adelante en el impulso de Europa por modelos de IA multilingües, al tiempo que proporciona a los desarrolladores una herramienta potente y diversa para respaldar aplicaciones e investigaciones en varios idiomas.
El lanzamiento de código abierto de Teuken-7B aporta nuevas posibilidades al campo de la IA multilingüe y refleja los esfuerzos activos de Europa en la investigación y el desarrollo independientes de la tecnología de IA. Sus excelentes capacidades de procesamiento en varios idiomas brindarán más comodidad a los desarrolladores globales y promoverán el desarrollo vigoroso de aplicaciones en varios idiomas. Se espera que Teuken-7B pueda desempeñar un papel en más campos en el futuro.