Le grand modèle KwaiYii, le nom chinois de KwaiYii est le grand modèle Kuaiyi, est un grand modèle de prédiction Kuaishou qui a récemment commencé les tests internes. Les utilisateurs qui souhaitent en faire l'expérience plus tôt peuvent postuler pour des qualifications de tests internes. D'ici là, les utilisateurs peuvent accéder au grand modèle KwaiYii. découvrez plus de contenu.
L'équipe Kuaishou AI continuera d'itérer le grand modèle « Ruyi », d'une part, elle continuera à optimiser les performances du modèle et à développer des capacités multimodales, d'autre part, elle favorisera également la mise en œuvre de davantage de C-side. et des scénarios commerciaux côté B. Le grand modèle « KwaiYii » développé par Kuaishou a été dévoilé, se classant premier dans la liste chinoise CMMLU.
KwaiYii est une série de modèles de langage à grande échelle (LLM) développés indépendamment par l'équipe Kuaishou AI à partir de zéro. Il comprend actuellement des modèles de plusieurs tailles de paramètres et couvre des modèles pré-entraînés (KwaiYii -Base), un modèle de dialogue (KwaiYii-Chat). . Nous présentons ici le modèle de la série à l'échelle 13B KwaiYii-13B. Ses principales caractéristiques comprennent.
Le modèle pré-entraîné KwaiYii-13B-Base possède d'excellentes capacités de base techniques générales et a atteint un effet de pointe sous la même taille de modèle sur la plupart des références chinoises/anglaises faisant autorité. Par exemple, le modèle pré-entraîné KwaiYii-13B-Base est actuellement au premier niveau de la même taille de modèle sur MMLU, CMMLU, C-Eval, HumanEval et d'autres benchmarks.
Le modèle de dialogue KwaiYii-13B-Chat possède d'excellentes capacités de compréhension et de génération du langage, prenant en charge un large éventail de tâches telles que la création de contenu, la consultation d'informations, la logique mathématique, l'écriture de code, les conversations à plusieurs tours, etc. Les résultats de l'évaluation humaine montrent que KwaiYii- 13B-Chat dépasse les modèles open source traditionnels et est proche du même niveau que ChatGPT (3.5) en matière de création de contenu, de consultation d'informations et de résolution de problèmes mathématiques.