Ruiyi Big Model, Ruiyi Big Model es un gran modelo de predicción lanzado oficialmente por Kuaishou. Los usuarios interesados pueden tener la oportunidad de experimentarlo temprano a través de la dirección de prueba interna. Para obtener más contenido sobre Ruiyi Big Model. Continúe prestando atención a este artículo.
El modelo de lenguaje grande de desarrollo propio de Kuaishou, "KwaiYii", ha iniciado pruebas internas y proporciona a los equipos comerciales API estándar y soluciones de cooperación de proyectos personalizadas.
En las últimas clasificaciones de CMMLU orientadas a China, el 13B KwaiYii-13B de Kuaiyi ocupó el primer lugar tanto en cinco disparos como en cero disparos. Es fuerte en humanidades, temas específicos de chino, etc., con una puntuación promedio de más de 61 puntos.
KwaiYii es una serie de modelos de lenguaje a gran escala (LLM) desarrollados de forma independiente por el equipo de Kuaishou AI desde cero. Actualmente incluye modelos de múltiples tamaños de parámetros y cubre modelos previamente entrenados (KwaiYii-Base) y modelos de diálogo (KwaiYii-Chat). . Aquí presentamos el modelo de la serie a escala 13B KwaiYii-13B. Sus características principales incluyen.
El modelo preentrenado KwaiYii-13B-Base tiene excelentes capacidades de base técnica general y ha logrado un efecto de vanguardia con el mismo tamaño de modelo en la mayoría de los puntos de referencia chinos/ingleses autorizados. Por ejemplo, el modelo preentrenado KwaiYii-13B-Base se encuentra actualmente en el nivel líder del mismo tamaño de modelo en MMLU, CMMLU, C-Eval, HumanEval y otros puntos de referencia.
El modelo de diálogo KwaiYii-13B-Chat tiene excelentes capacidades de generación y comprensión del lenguaje, y admite una amplia gama de tareas como creación de contenido, consulta de información, lógica matemática, escritura de códigos, conversaciones de múltiples rondas, etc. Los resultados de la evaluación humana muestran que KwaiYii- 13B-Chat supera los modelos convencionales de código abierto y está cerca del mismo nivel que ChatGPT (3.5) en creación de contenido, consulta de información y resolución de problemas matemáticos.