El modelo grande de KwaiYii, el nombre chino de KwaiYii es modelo grande de Kuaiyi, es un modelo de predicción grande de Kuaishou que recientemente comenzó a realizar pruebas internas. Los usuarios que quieran experimentarlo temprano pueden solicitar calificaciones de prueba internas. Para entonces, los usuarios pueden ingresar al modelo grande de KwaiYii. experimentar más contenido.
El equipo de Kuaishou AI continuará iterando el modelo grande "Ruyi". Por un lado, continuará optimizando el rendimiento del modelo y desarrollando capacidades multimodales. Por otro lado, también promoverá la implementación de más aspectos del lado C. y escenarios empresariales del lado B. Se presentó el modelo grande de desarrollo propio de Kuaishou, "KwaiYii", que ocupa el primer lugar en el ranking chino CMMLU.
KwaiYii es una serie de modelos de lenguaje a gran escala (LLM) desarrollados de forma independiente por el equipo de Kuaishou AI desde cero. Actualmente incluye modelos de múltiples tamaños de parámetros y cubre modelos previamente entrenados (KwaiYii-Base) y modelos de diálogo (KwaiYii-Chat). . Aquí presentamos el modelo de la serie a escala 13B KwaiYii-13B. Sus características principales incluyen.
El modelo preentrenado KwaiYii-13B-Base tiene excelentes capacidades de base técnica general y ha logrado un efecto de vanguardia con el mismo tamaño de modelo en la mayoría de los puntos de referencia chinos/ingleses autorizados. Por ejemplo, el modelo preentrenado KwaiYii-13B-Base se encuentra actualmente en el nivel líder del mismo tamaño de modelo en MMLU, CMMLU, C-Eval, HumanEval y otros puntos de referencia.
El modelo de diálogo KwaiYii-13B-Chat tiene excelentes capacidades de generación y comprensión del lenguaje, y admite una amplia gama de tareas como creación de contenido, consulta de información, lógica matemática, escritura de códigos, conversaciones de múltiples rondas, etc. Los resultados de la evaluación humana muestran que KwaiYii- 13B-Chat supera los modelos convencionales de código abierto y está cerca del mismo nivel que ChatGPT (3.5) en creación de contenido, consulta de información y resolución de problemas matemáticos.