Большая модель KwaiYii, китайское название KwaiYii — большая модель Kuaiyi, представляет собой большую модель прогнозирования Kuaishou, которая недавно начала внутреннее тестирование. Пользователи, которые хотят испытать ее на ранней стадии, могут подать заявку на квалификацию внутреннего тестирования. К тому времени пользователи смогут войти в большую модель KwaiYii. испытать больше контента.
Команда Kuaishou AI продолжит работу над большой моделью «Ruyi». С одной стороны, она продолжит оптимизировать производительность модели и развивать мультимодальные возможности, с другой стороны, она также будет способствовать внедрению большего количества C-стороны. и бизнес-сценарии стороны B. Была представлена большая модель KwaiYii, разработанная компанией Kuaishou, занявшая первое место в рейтинге CMMLU Chinese.
KwaiYii — это серия крупномасштабных языковых моделей (LLM), независимо разработанных командой Kuaishou AI с нуля. В настоящее время она включает модели с несколькими размерами параметров и охватывает предварительно обученные модели (KwaiYii-Base), диалоговую модель (KwaiYii-Chat). . Здесь мы представляем модель KwaiYii-13B серии масштаба 13B. Ее основные характеристики включают в себя.
Предварительно обученная модель KwaiYii-13B-Base обладает превосходными общими техническими базовыми возможностями и достигла ультрасовременного эффекта при том же размере модели по большинству авторитетных китайских/английских тестов. Например, предварительно обученная модель KwaiYii-13B-Base в настоящее время находится на лидирующем уровне модели того же размера по MMLU, CMMLU, C-Eval, HumanEval и другим тестам.
Диалоговая модель KwaiYii-13B-Chat обладает отличными возможностями понимания и генерации языка, поддерживая широкий спектр задач, таких как создание контента, консультации по информации, математическая логика, написание кода, многораундовые разговоры и т. д. Результаты оценки человеком показывают, что KwaiYii-13B-Chat 13B-Chat превосходит основные модели с открытым исходным кодом и близок к тому же уровню, что и ChatGPT (3.5), в создании контента, информационных консультациях и решении математических задач.