Редактор Downcodes узнал, что на платформе Hugging Face была выпущена языковая модель с 7 миллиардами параметров под названием Teuken-7B, поддерживающая все 24 официальных языка ЕС. Модель была разработана исследовательским проектом ЕС OpenGPT-X и доступна пользователям с открытым исходным кодом. В отличие от большинства языковых моделей искусственного интеллекта, ориентированных на английский язык, Teuken-7B был создан с нуля, и примерно половина обучающих данных поступает из неанглоязычных европейских языков, что дает ему значительное преимущество при работе с несколькими европейскими языками.
Teuken-7B, языковая модель с 7 миллиардами параметров, теперь доступна на Hugging Face и поддерживает все 24 официальных языка ЕС. Модель была разработана исследовательским проектом ЕС OpenGPT-X и доступна пользователям как проект с открытым исходным кодом. В отличие от большинства языковых моделей искусственного интеллекта, ориентированных на английский язык, Teuken-7B был создан с нуля, и около половины обучающих данных поступило из неанглоязычных европейских языков.
Примечание к источнику изображения: изображение генерируется искусственным интеллектом и разрешено поставщиком услуг Midjourney.
Команда разработчиков утверждает, что Teuken-7B хорошо работает на всех языках, на которых он обучался, и его надежность особенно впечатляет при работе с неанглийскими языками. Чтобы измерить эффективность языковых моделей на европейских языках, команда проекта также создала новый европейский рейтинг LLM, превосходящий предыдущие стандартные методы тестирования, которые в основном основывались на английском языке.
Этот выпуск знаменует собой значительный шаг вперед в стремлении Европы к многоязычным моделям искусственного интеллекта, а также предоставляет разработчикам мощный и разнообразный инструмент для поддержки межъязыковых приложений и исследований.
Выпуск Teuken-7B с открытым исходным кодом открывает новые возможности в области многоязычного искусственного интеллекта и отражает активные усилия Европы в независимых исследованиях и разработках технологий искусственного интеллекта. Его превосходные возможности многоязычной обработки обеспечат больше удобства разработчикам по всему миру и будут способствовать активной разработке межъязыковых приложений. Ожидается, что Teuken-7B сможет сыграть роль в большем количестве областей в будущем.