Ruiyi Big Model, Ruiyi Big Model est un grand modèle de prédiction officiellement lancé par Kuaishou. Récemment, il a commencé les tests internes. Les utilisateurs intéressés peuvent avoir l'opportunité d'en faire l'expérience plus tôt via l'adresse de test interne. Pour plus de contenu sur Ruiyi Big Model, veuillez. continuez à prêter attention à cet article.
Le grand modèle de langage « KwaiYii » auto-développé par Kuaishou a commencé les tests internes et fournit aux équipes commerciales des API standard et des solutions de coopération de projet personnalisées.
Dans le dernier classement du CMMLU axé sur le chinois, le 13B KwaiYii-13B de Kuaiyi s'est classé premier en cinq coups et en zéro tir. Il est fort en sciences humaines, dans les sujets spécifiques au chinois, etc., avec un score moyen de plus de 61 points.
KwaiYii est une série de modèles de langage à grande échelle (LLM) développés indépendamment par l'équipe Kuaishou AI à partir de zéro. Il comprend actuellement des modèles de plusieurs tailles de paramètres et couvre des modèles pré-entraînés (KwaiYii -Base), un modèle de dialogue (KwaiYii-Chat). . Nous présentons ici le modèle de la série à l'échelle 13B KwaiYii-13B. Ses principales caractéristiques comprennent.
Le modèle pré-entraîné KwaiYii-13B-Base possède d'excellentes capacités de base techniques générales et a atteint un effet de pointe sous la même taille de modèle sur la plupart des références chinoises/anglaises faisant autorité. Par exemple, le modèle pré-entraîné KwaiYii-13B-Base est actuellement au premier niveau de la même taille de modèle sur MMLU, CMMLU, C-Eval, HumanEval et d'autres benchmarks.
Le modèle de dialogue KwaiYii-13B-Chat possède d'excellentes capacités de compréhension et de génération du langage, prenant en charge un large éventail de tâches telles que la création de contenu, la consultation d'informations, la logique mathématique, l'écriture de code, les conversations à plusieurs tours, etc. Les résultats de l'évaluation humaine montrent que KwaiYii- 13B-Chat dépasse les modèles open source traditionnels et est proche du même niveau que ChatGPT (3.5) en matière de création de contenu, de consultation d'informations et de résolution de problèmes mathématiques.