En el campo del procesamiento del lenguaje natural, los modelos de lenguaje preentrenados se han convertido en una tecnología básica muy importante. Este almacén recopila principalmente algunos modelos de preentrenamiento chino de alta calidad, modelos multimodales chinos y modelos de lenguaje grande chino. Actualmente son públicos en Internet y otros contenidos (gracias al tipo que compartió los recursos) y continuarán actualizándose...
Para descargar el modelo de almacén de HuggingFace en China, se recomienda utilizar la dirección espejo de HuggingFace: https://hf-mirror.com/
Registro de cambios
Modelo grande básico general.
Cimentación vertical modelo grande
Modelo de diálogo universal
Modelo de diálogo vertical
Modelo grande de diálogo multimodal.
Punto de referencia de evaluación de modelos grandes
Modelo de experiencia en línea
Plataforma de biblioteca de modelos de código abierto
Biblioteca de conjuntos de datos de código abierto
Conjunto de datos de instrucciones en chino de código abierto
Incrustar
Otro-Impresionante
备注
ND: Decodificador no causal o Prefijo LM
CD: Decodificador causal
ED: Codificador-Decodificador
Modelos básicos a gran escala: en la tabla solo se enumeran los modelos
大于7B
parámetros.
Modelo | tamaño | tiempo | idioma | campo | descargar | Dirección del proyecto | Institución/Individuo | Arquitectura | literatura | Observación |
---|---|---|---|---|---|---|---|---|---|---|
XVERSE-MoE | 255B/A36B | 2024-09 | chino e ingles | Universal | ?AF | XVERSO-MoE-A36B | xverse-ai | Ministerio de Educación | ||
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | chino e ingles | Universal | ?AF | Qwen2.5 | QwenLM | CD | Blog | |
Tele-FLM | 52B/102B/1TB | 2024-07 | Plurilingüe | Universal | [?HF] | / | CofeAI | CD | Informe técnico de Tele-FLM | |
metal-llama-3.1 | 8/70/405B | 2024-07 | Plurilingüe | Universal | [?HF] | llama3 | metal-llama | CD | ||
internolm2.5-Base | 7B | 2024-07 | chino e ingles | Universal | [?HF] | PasanteLM | PasanteLM | CD | Informe Técnico | |
MAP-NEO-Base | 2/7B | 2024-06 | chino e ingles | Universal | ?AF | MAPA-NEO | proyección-de-arte-multimodal | CD | Papel | |
Nemotrón-4-Base | 340B | 2024-06 | Plurilingüe | Universal | ?AF | / | Nvidia | CD | informe técnico. | |
Base de índice | 1,9 mil millones | 2024-06 | chino e ingles | Universal | ?AF | Índice-1.9B | bilibili | CD | Informe | |
Base Qwen2 | 0,5/2/5/7/72B | 2024-06 | Plurilingüe | Universal | ?AF | Qwen2 | QwenLM | CD | Blog | |
GLM-4-Base | 9B | 2024-06 | Plurilingüe | Universal | ?AF | GLM-4 | RUDM | / | ||
Yi-1.5-Base | 9/6/34B | 2024-05 | chino e ingles | Universal | ?AF | Yi-1.5 | 01-ai | CD | Papel | |
DeepSeek-V2-Base | A21B/236B | 2024-05 | chino e ingles | Universal | ?AF | DeepSeek-V2 | búsqueda profunda-ai | MOE | Papel | |
Llama-3-Base | 8/70B | 2024-04 | Plurilingüe | Universal | ?AF | llama3 | Metallama | CD | ||
Base de Zhinao | 7B | 2024-04 | chino e ingles | Universal | ?HF? | / | Tecnología Qihoo | CD | ||
XVERSE-MoE | A4.2B/25.8B | 2024-04 | chino e ingles | Universal | ?AF | XVERSE-MoE-A4.2B | xverse-ai | Ministerio de Educación | ||
SoftTiger-Base | 13/70B | 2024-04 | chino e ingles | Universal | ?AF | tigrebot | investigación del tigre | CD | ||
MartilloLLM | 1.4b | 2024-04 | chino e ingles | Universal | ?AF | MartilloLLM | Martillo de datos | |||
Base Mengzi3 | 13B | 2024-04 | chino e ingles | Universal | ?AF | menzi3 | Lancha | CD | ||
Base de brisa | 7B | 2024-02 | chino e ingles | Universal | ?AF | / | Investigación de MediaTek | |||
TorreBase | 7/13B | 2024-02 | Plurilingüe | Universal | [?HF] | / | Unbabel | CD | ||
Qwen1.5-Base | 0,5/1,8/4 7/14/32/72/110B | 2024-02 | chino e ingles | Universal | [?HF] | Qwen1.5 | Qwen | / | Blog | |
LongAlign-Base | 7/6/13B | 2024-02 | chino e ingles | Universal | [?HF] | alineación larga | RUDM | / | Papel | |
Base-Mixtral-Chino | 8x7B | 2024-02 | chino e ingles | Universal | [Baidu] [?HF] | Chino-Mixtral | Yiming Cui | MOE | ||
iFlytekSpark-Base | 13B | 2024-01 | chino e ingles | Universal | espora mental | / | iFlytek | CD | ||
Base de Orión | 14B | 2024-01 | Plurilingüe | Universal | [?HF] | Orión | OrionStarAI | CD | Papel | TRAPO Complemento |
YaYi2-Base | 30B | 2023-12 | Plurilingüe | Universal | [?HF] | YAYI2 | investigación-wengué | CD | Papel | |
Aquila2-Base | 34/7/70B | 2023-12 | chino e ingles | Universal | [?HF] | Aquila2 | BanderaAI | CD | ||
Base Alaya | 7B | 2023-12 | chino e ingles | Universal | [?HF] | alaya | Lienzo de datos | CD | ||
Base Qwen | 1.8/7 14/72B | 2023-12 | chino e ingles | Universal | [?HF] | Qwen | Nube de Alibaba | CD | Informe en papel Informe2 | |
Base DeepSeek | 7/67B | 2023-11 | chino e ingles | Universal | [?HF] | DeepSeek-LLM | búsqueda profunda-ai | CD | ||
Yuan-2.0 | 2/51 102B | 2023-11 | chino e ingles | Universal | Baidu [?HF] | Yuan-2.0 | IEIT-Yuan | CD | ||
Base Alaya | 7B | 2023-11 | chino e ingles | Universal | [?HF] | alaya | DatosCanvasIO | CD | ||
Base Yi | 9/6/34B | 2023-11 | chino e ingles | Universal | [?HF] | yi | 01.AI | CD | ||
Base XVERSE | 7/13 65B | 2023-11 | Plurilingüe | Universal | [?HF] | XVERSO | Tecnología Yuanxiang | CD | ||
Base Nanbeige | 16B | 2023-11 | chino e ingles | Universal | [?HF] | Nanbeige | Laboratorio LLM de Nanbeige | CD | ||
LingoBallena | 8B | 2023-11 | chino e ingles | Universal | [?HF] | LingoWhale-8B | DeepLang AI | CD | ||
base de skywork | 13B | 2023-10 | Chino | Universal | [?HF] | Skywork | SkyworkAI | CD | Papel | |
Base LM azul | 7B | 2023-11 | chino e ingles | Universal | [?HF] | AzulLM | laboratorio de IA vivo | CD | ||
Chatglm3-base | 6B | 2023-10 | chino e ingles | Universal | [?HF] | ChatGLM3 | RUDM | DAKOTA DEL NORTE | ||
Ziya2-Base | 13B | 2023-10 | chino e ingles | Universal | [?HF] | Fengshenbang-LM | Instituto IDEA | CD | ||
OpenBA-LM | 15B | 2023-09 | chino e ingles | Universal | [?HF] | OpenBA | Grupo OpenNLG | DE | Papel | |
TigerBot-Base-70B | 80B | 2023-09 | Plurilingüe | Universal | [?HF] | tigrebot | Tecnología Hubo | CD | Papel | |
FLM | 101B | 2023-09 | chino e ingles | Universal | [?HF] | / | CofeAI | CD | ||
halcón | 7/40 180B | 2023-09 | Plurilingüe | Universal | [?HF] | / | Instituto de Innovación Tecnológica | CD | ||
Baichuan2 | 7/13B | 2023-09 | Chino | Universal | [?HF] | Baichuan2 | Inteligencia de Baichuan | CD | ||
Chino-LLaMA-2-16K | 7/13B | 2023-08 | chino e ingles | Universal | [?HF] | Chino-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | chino e ingles | Universal | [?HF] | YuLan-Chat | Universidad Renmin de China | CD | ||
Aquila-Base-33B | 33B | 2023-08 | chino e ingles | Universal | HACER | Águila | BanderaAI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | Plurilingüe | Universal | [?HF] | tigrebot | Tecnología Hubo | CD | ||
Linly-Chino-LLaMA-2 | 7/13B | 2023-07 | chino e ingles | Universal | [?HF] | lily | Instituto de Visión por Computadora de la Universidad de Shenzhen | CD | ||
Chino-LLaMA-2 | 7B | 2023-07 | chino e ingles | Universal | [?HF] | Chino-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
base de Jiang | 13B | 2023-07 | Chino | Universal | [?HF] | / | Sin conocer la sabiduría | CD | ||
wx | 7/13B | 2023-07 | Chino | Universal | [?HF] | / | Número nacional de la ballena azul | CD | ||
llama2 | 7/13 70B | 2023-07 | Plurilingüe | Universal | [?HF] | llama | Meta | CD | Papel | |
PoliLM | 13B | 2023-07 | Plurilingüe | Universal | [?HF] | PoliLM | Academia Bodhidharma | CD | Papel | |
Baichuan-13B | 13B | 2023-07 | Chino | Universal | [?HF] | Baichuan-13B | Inteligencia de Baichuan | CD | ||
tigrebot | 7B | 2023-07 | Plurilingüe | Universal | [?HF] | tigrebot | Tecnología Hubo | CD | ||
PasanteLM-base | 7/20B | 2023-07 | Chino | Universal | [?HF] | PasanteLM | Laboratorio de Inteligencia Artificial de Shanghai | CD | informe | |
MPT | 7/30B | 2023-06 | Plurilingüe | Universal | [?HF] | fundición-llm | mosaicoml | CD | ||
Baichuan | 7B | 2023-06 | chino e ingles | Universal | [?HF] | baichuan-7B | Inteligencia de Baichuan | CD | ||
halcón chino | 7B | 2023-06 | chino e ingles | Universal | [?HF] | lily | Instituto de Visión por Computadora de la Universidad de Shenzhen | CD | Blog | |
ÁtomoGPT | 13B | 2023-06 | chino e ingles | Universal | [?HF] | / | eco atómico | CD | ||
Águila | 7B | 2023-06 | chino e ingles | Universal | [?HF] | Águila | BanderaAI | CD | ||
Chino-LLaMA | 33B | 2023-06 | chino e ingles | Universal | [?HF] | China-LLaMA-Alpaca | Yiming Cui | CD | ||
tigrebot | 7B | 2023-06 | Plurilingüe | Universal | [?HF] | tigrebot | Tecnología Hubo | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | chino e ingles | Universal | [?HF] | pandallmo | dientes de león | CD | ||
Panda | 7/13B | 2023-05 | chino e ingles | Universal | [?HF] | pandallmo | dientes de león | CD | ||
OpenLLaMA | 13B | 2023-05 | chino e ingles | Universal | [?HF] | lily | Instituto de Visión por Computadora de la Universidad de Shenzhen | CD | ||
BiLLa-LLM | 7B | 2023-05 | chino e ingles | Universal | [?HF] | ikB | Li Zhongli | CD | ||
Ziya-LLaMA-Recompensa | 7B | 2023-05 | chino e ingles | Universal | [?HF] | Fengshenbang-LM | Instituto IDEA | CD | ||
YuYan | 11B | 2023-04 | Chino | Universal | [?HF] | / | NetEase Fuxi | CD | Papel | |
Chino-LLaMA | 13/7/33B | 2023-04 | Chino | Universal | [?HF] | lily | Instituto de Visión por Computadora de la Universidad de Shenzhen | CD | Blog | |
AbiertoChinoLLaMA | 7B | 2023-04 | chino e ingles | Universal | [?HF] | AbiertoChinoLLaMA | OpenLMLab | CD | ||
MUSGO-003 | 16B | 2023-04 | chino e ingles | Universal | [?HF] | MUSGO | Universidad de Fudan | CD | ||
BBT-2-Texto | 13B | 2023-04 | Chino | Universal | Aplicar | BBT-FinCUGE-Aplicaciones | supersimetría | CD | Papel | |
BBT-2-Texto | 12B | 2023-04 | Chino | Universal | Aplicar | BBT-FinCUGE-Aplicaciones | supersimetría | CD | Papel | |
Chino-LLaMA | 13B | 2023-04 | chino e ingles | Universal | [?HF] | China-LLaMA-Alpaca | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | Plurilingüe | Universal | [?HF] | ul2 | DE | Papel | ||
CPM-abeja | 10B | 2023-01 | chino e ingles | Universal | [?HF] | CPM-abeja | OpenBMB | CD | ||
FLORACIÓN | 176B | 2022-11 | Plurilingüe | Universal | [?HF] | Megatron-DeepSpeed | Gran Ciencia | CD | Papel | |
BLOOMZ | 176B | 2022-11 | Plurilingüe | Universal | [?HF] | Megatron-DeepSpeed | Gran Ciencia | CD | Papel | |
flan-t5-xxl | 11B | 2022-11 | Plurilingüe | Universal | [?HF] | t5x | DE | papel | ||
CPM-Ant+ | 10B | 2022-10 | chino e ingles | Universal | BMB | CPM en vivo | OpenBMB | CD | blog | |
GLM | 130B | 2022-10 | chino e ingles | Universal | Aplicar | GLM-130B | Universidad de Tsinghua | DAKOTA DEL NORTE | papel | |
CPM-hormiga | 10B | 2022-09 | Chino | Universal | [?HF] | CPM en vivo | OpenBMB | CD | blog | |
GLM | 10B | 2022-09 | Chino | Universal | [?HF] | GLM | Universidad de Tsinghua | DAKOTA DEL NORTE | papel | |
Fuente 1.0 | 245B | 2021-09 | Chino | Universal | API | Yian-1.0 | ola | CD | papel | |
CPM-2 | 10/11/ 200B | 2021-06 | Chino | Universal | Aplicar | CPM | Instituto de Investigación Zhiyuan | DE | papel | |
PanGu-Alfa | 13/200B | 2021-05 | Chino | Universal | [?HF] | PanGu-Alfa | Laboratorio Pengcheng | CD | papel | |
ENCHUFAR | 27B | 2021-04 | Chino | Universal | Aplicar | aliciamente | Alibaba | DE | ||
GPT-3 | 13/30B | 2021-04 | Chino | Universal | HACER | GPT-3 | Academia Bodhidharma | CD |
[Volver al inicio]
Modelos básicos de código abierto en varios campos verticales.
Modelo | tamaño | tiempo | idioma | campo | descargar | Dirección del proyecto | Institución/Individuo | Arquitectura | literatura | Observación |
---|---|---|---|---|---|---|---|---|---|---|
Qwen-2.5 | 1,5/7B | 2024-09 | chino e ingles | código | ?AF | Qwen2.5 | QwenLM | CD | Blog | |
Qwen-2.5 | 1,5/7/72B | 2024-09 | chino e ingles | matemáticas | ?AF | Qwen2.5 | QwenLM | CD | Blog | |
Tongyi-Finanzas-Base | 14B | 2023-11 | Chino | finanzas | ModeloScope | Finanzas Tongyi-14B | Modelo financiero de Tongyi | CD | ||
ChiMed-GPT | 13B | 2023-10 | Chino | médico | [?HF] | ChiMed-GPT | Universidad de Ciencia y Tecnología de China | CD | Papel | |
base CodeShell | 7B | 2023-10 | chino e ingles | código | [?HF] | código shell | SabiduríaConcha | CD | ||
Base WiNGPT | 7B | 2023-09 | Chino | medicamento | [?HF] | AlaPT2 | Investigación ganadora sobre IA en salud | CD | ||
xuanyuan | 70B | 2023-09 | Chino | finanzas | [?HF] | xuanyuan | Du Xiaoman | CD | Informe | |
CódigoLLAma | 7/13/ 34B | 2023-08 | Plurilingüe | código | [?HF] | codellama | Metainvestigación | CD | Papel | |
base-educhat-002 | 7/13B | 2023-06 | chino e ingles | educar | [?HF] | EducaChat | Universidad Normal del Este de China | CD | ||
AquilaCode-NV | 7B | 2023-06 | chino e ingles | código | [?HF] | Águila | BanderaAI | CD | ||
AquilaCode-TS | 7B | 2023-06 | chino e ingles | código | [?HF] | Águila | BanderaAI | CD | ||
LeyWGPT | 7B | 2023-05 | chino e ingles | ley | [?HF] | LeyGPT | Canción de Pengxiao | CD | ||
CódigoGeeX | 13B | 2022-06 | Plurilingüe | código | Aplicar | CódigoGeeX | Universidad de Tsinghua | CD | blog |
[Volver al inicio]
Modelo de lenguaje grande con capacidades como respuesta a preguntas y diálogo.
Modelo | tamaño | tiempo | idioma | campo | descargar | Dirección del proyecto | Institución/Individuo | Arquitectura | literatura |
---|---|---|---|---|---|---|---|---|---|
Athene-V2-Chat | 72B | 2024-11 | chino e ingles | Universal | ?AF | / | Nexusflujo | CD | Blog |
Agente Athene-V2 | 72B | 2024-11 | chino e ingles | llamada de herramienta | ?AF | / | Nexusflujo | CD | Blog |
Hunyuan-grande | A52/389B | 2024-11 | chino e ingles | Universal | ?AF | Tencent-Hunyuan-grande | Tencent | Ministerio de Educación | Papel |
Aya-Expansión | 8/32B | 2024-10 | Plurilingüe | Universal | ?AF | / | Coherir para la IA | CD | |
Granito 3.0 | 1/2/3/8B | 2024-10 | Plurilingüe | Universal | ?AF | modelos-de-lenguaje-granito-3.0 | granito-ibm | CD | Papel |
Granito 3.0-MoE | 1B/3B/A400M | 2024-10 | Plurilingüe | Universal | ?AF | modelos-de-lenguaje-granito-3.0 | granito-ibm | Ministerio de Educación | Papel |
TeleChat2 | 115B | 2024-09 | chino e ingles | Universal | ?Modelo alcance | TeleChat2 | Tele-IA | CD | |
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | chino e ingles | Universal | ?AF | Qwen2.5 | QwenLM | CD | Blog |
XVERSE-MoE | 255B/A36B | 2024-09 | chino e ingles | Universal | ?AF | XVERSO-MoE-A36B | xverse-ai | Ministerio de Educación | |
DeepSeek-V2.5 | 236B/A21B | 2024-09 | chino e ingles | Universal | ?AF | DeepSeek-V2 | búsqueda profunda-ai | MOE | Papel |
MiniCPM3 | 4B | 2024-09 | chino e ingles | Universal | ?AF | MiniCPM | OpenBMB | CD | Papel MiniCPM |
Comando C4AI R+ 08-2024 | 104B | 2024-08 | Plurilingüe | Universal | ?AF | / | CohereForAI | CD | |
JIUTIAN-Chat | 39/A13B | 2024-07 | chino e ingles | Universal | ?EM | / | China Mobile JiuTian-AI | MOE | |
metal-llama-3.1 | 8/70/405B | 2024-07 | Plurilingüe | Universal | [?HF] | llama3 | metal-llama | CD | |
internolm2.5-chat | 7B | 2024-07 | chino e ingles | Universal | [?HF] | PasanteLM | PasanteLM | CD | Informe Técnico |
Mistral-grande-insructo-2407 | 123B | 2024-07 | Plurilingüe | Universal | ?AF | / | Mistral AI | publicación de blog | |
DeepSeek-V2-Chat-0628 | 236B | 2024-07 | chino e ingles | Universal | ?AF | DeepSeek-V2 | búsqueda profunda-ai | MOE | Papel |
C4ai-comando-r-plus | 104B | 2024-07 | Plurilingüe | Universal | ?AF | / | CohereForAI | CD | |
gemma-2-chat | 9/27B | 2024-06 | Plurilingüe | Universal | ?AF | / | CD | ||
MAP-NEO-Chat | 2/7B | 2024-06 | chino e ingles | Universal | ?AF | MAPA-NEO | proyección-de-arte-multimodal | CD | Papel |
GEB-Chat | 1.3B | 2024-06 | chino e ingles | Universal | ?AF | / | GEB-AGI | CD | Papel |
Nemotron-4-Chat | 340B | 2024-06 | Plurilingüe | Universal | ?AF | / | Nvidia | CD | informe técnico. |
Índice-Chat | 1,9 mil millones | 2024-06 | chino e ingles | Universal | ?AF | Índice-1.9B | bilibili | CD | Informe |
Qwen2-MoE | 57B/A14B | 2024-06 | Plurilingüe | Universal | ?AF | Qwen2 | QwenLM | Ministerio de Educación | Blog |
Qwen2-Chat | 0,5/2/5/7/72B | 2024-06 | Plurilingüe | Universal | ?AF | Qwen2 | QwenLM | CD | Blog |
GLM-4-Chat | 9B | 2024-06 | Plurilingüe | Universal | ?AF | GLM-4 | RUDM | / | |
Skywork-MoE | 16/A22B/146B | 2024-06 | chino e ingles | Universal | ?AF | Skywork-MoE | SkyworkAI | Ministerio de Educación | Informe técnico |
Yuan2.0 | 40/A3.7B | 2024-05 | chino e ingles | Universal | ?AF | Yuan2.0-M32 | IEIT-Yuan | MOE | Papel |
Chat de estrellas | 52B | 2024-05 | chino e ingles | Universal | ?AF | TeleChat-52B | Tele-IA | CD | |
Ling Long | 317M | 2024-05 | chino e ingles | Universal | ?AF | linglong | nkcs-iclab | CD | |
Marinero | 14B | 2024-05 | 7 idiomas | Universal | ?AF | marinero-llm | vela-sg | CD | Papel |
Nanbeige2 | 8/16B | 2024-05 | chino e ingles | Universal | ?AF | Nanbeige | Nanbeige | CD | |
Yi-1.5-Chat | 9/6/34B | 2024-05 | chino e ingles | Universal | ?AF | Yi-1.5 | 01-ai | CD | Papel |
DeepSeek-V2-Chat | A21B/236B | 2024-05 | chino e ingles | Universal | ?AF | DeepSeek-V2 | búsqueda profunda-ai | MOE | Papel |
XVERSE-MoE | A4.2B/25.8B | 2024-05 | chino e ingles | Universal | ?AF | XVERSO-MoE-A4.2B | xverse-ai | MOE | |
llama3-zh | 8/70B | 2024-04 | chino e ingles | Universal | ?AF | / | / | CD | llama3 lista china |
Llama3-Chino-Chat | 8B | 2024-04 | chino e ingles | Universal | ?AF | / | Shenzhi Wang | CD | |
Llama-3-Chat | 8/70B | 2024-04 | Plurilingüe | Universal | ?AF | llama3 | Metallama | CD | |
Zhinao-Chat | 7B | 2024-04 | chino e ingles | Universal | ?HF? | / | Tecnología Qihoo | CD | |
MiniCPM-MoE | 8x2B | 2024-04 | chino e ingles | Universal | ?AF | MiniCPM | OpenBMB | Ministerio de Educación | |
Nanbeige2-Chat | 8B | 2024-04 | chino e ingles | Universal | ?AF | Nanbeige | Laboratorio LLM de Nanbeige | CD | |
Marinero | 7B | 2024-04 | Plurilingüe | Universal | ?AF | marinero-llm | Laboratorio de IA marina | CD | Papel |
Mengzi3-Chat | 13B | 2024-04 | chino e ingles | Universal | ?AF | menzi3 | Lancha | CD | |
Qwen-MoE | 2,7 mil millones | 2024-03 | chino e ingles | Universal | ?AF | Qwen1.5 | Qwen | Ministerio de Educación | Blog |
Comando-R | 35B | 2024-03 | Plurilingüe | Universal | ?AF | / | CohereForAI | CD | |
Brisa-Instruir | 7B | 2024-02 | chino e ingles | Universal | ?AF | / | Investigación de MediaTek | ||
aya-101 | 13B | 2024-02 | Plurilingüe | Universal | ?AF | / | Coherir para la IA | CD | Papel |
QuímicaLLM | 7B | 2024-02 | Plurilingüe | Universal | ?AF | / | AI4Chem | CD | Papel |
TorreInstruir | 7/13B | 2024-02 | Plurilingüe | Universal | [?HF] | / | Unbabel | CD | |
Qwen1.5-Chat | 0,5/1,8/4/ 7/14/32/72/110B | 2024-02 | chino e ingles | Universal | [?HF] | Qwen1.5 | Qwen | / | Blog |
MiniCPM | 2B | 2024-02 | chino e ingles | Universal | [?HF] ModeloScope | MiniCPM | OpenBMB | / | Informe |
LongAlign-Chat | 7/06/13B | 2024-02 | chino e ingles | Universal | [?HF] | alineación larga | RUDM | / | Papel |
Chat-Chino-Mixtral | 8x7B | 2024-02 | chino e ingles | Universal | [Baidu] [?HF] | Chino-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Chat | 13B | 2024-01 | chino e ingles | Universal | espora mental | / | iFlytek | CD | |
rwkv-5-mundo | 0.1/1/ 3/7B | 2023-01 | Plurilingüe | Universal | [?HF] | RWKV-LM | BlinkDL | URL | |
Orion-Chat | 14B | 2024-01 | Plurilingüe | Universal | [?HF] | Orión | OrionStarAI | CD | Papel |
internolm2-chat | 7/20B | 2024-01 | chino e ingles | Universal | [?HF] | PasanteLM | PasanteLM | CD | Informe |
Chino-Mixtral | 8x7B | 2023-01 | chino e ingles | Universal | [?HF] | / | HIT-SCIR | CD-MOE | |
Telechat | 7/12B | 2024-01 | chino e ingles | Universal | [?HF] | Telechatx | Tele-IA | CD | Informe |
kagentlms | 7/13B | 2024-01 | chino e ingles | Universal | [?HF] | KwaiAgentes | KwaiKEG | ||
YaYi2-Chat | 30B | 2023-12 | Plurilingüe | Universal | [?HF] | YAYI2 | investigación-wengué | CD | Papel |
SUS-Chat | 34/72B | 2023-12 | chino e ingles | Universal | [?HF] | SUS-Chat | SUSTech-IDEA | CD | |
Aquila2-Chat | 34/7/70B | 2023-12 | chino e ingles | Universal | [?HF] | Aquila2 | BanderaAI | CD | |
Alaya-Chat | 7B | 2023-12 | chino e ingles | Universal | [?HF] | alaya | Lienzo de datos | CD | |
Qwen-Chat | 1.8/7/ 14/72B | 2023-12 | chino e ingles | Universal | [?HF] | Qwen | Nube de Alibaba | CD | Informe en papel Informe2 |
Chat DeepSeek | 7/67B | 2023-11 | chino e ingles | Universal | [?HF] | DeepSeek-LLM | búsqueda profunda-ai | CD | |
Yi-Chat | 6/34B | 2023-11 | chino e ingles | Universal | [?HF] | yi | 01.AI | CD | |
Alaya-Chat | 7B | 2023-11 | chino e ingles | Universal | [?HF] | alaya | DatosCanvasIO | CD | |
OrionStar-Yi-Chat | 34B | 2023-11 | chino e ingles | Universal | [?HF] | OrionStar-Yi-34B-Chat | OrionStarAI | CD | |
Nanbeige-Chat | 16B | 2023-11 | chino e ingles | Universal | [?HF] | Nanbeige | Laboratorio LLM de Nanbeige | CD | |
OpenChat 3.5 | 7B | 2023-11 | chino e ingles | Universal | [?HF] | chat abierto | Chat abierto | CD | Papel |
XVERSE-Chat | 7/13B | 2023-11 | Plurilingüe | Universal | [?HF] | XVERSO | Tecnología Yuanxiang | CD | |
AndesGPT | 7B | 2023-11 | Chino | Universal | [?HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Chat | 13B | 2023-11 | Plurilingüe | Universal | [?HF] | SeaLLM | SeaLLM | CD | |
AzulLM | 7B | 2023-11 | chino e ingles | Universal | [?HF] | AzulLM | laboratorio de IA vivo | CD | |
chat-skywork | 13B | 2023-10 | Chino | Universal | [?HF] | Skywork | SkyworkAI | CD | Papel |
Céfiro | 7B | 2023-10 | Plurilingüe | Universal | [?HF] | manual de alineación | Abrazando la cara H4 | CD | Papel |
Mistral | 7B | 2023-10 | Plurilingüe | Universal | [?HF] | mistral-src | Mistral AI | CD | Papel |
chatglm3 | 6B | 2023-10 | chino e ingles | Universal | [?HF] | ChatGLM3 | RUDM | DAKOTA DEL NORTE | |
Zhiyin-chat | 7B | 2023-10 | chino e ingles | Universal | [?HF] | Zhiyin | Instituto de Acústica, Academia de Ciencias de China | CD | |
Ziya2-Chat | 13B | 2023-10 | chino e ingles | Universal | [?HF] | Fengshenbang-LM | Instituto IDEA | CD | |
Buitre | 40/180B | 2023-10 | Plurilingüe | Universal | [?HF] | / | VILM-AI | HACER | |
Buitre | 3/7/ 40/180B | 2023-09 | Plurilingüe | Universal | [?HF] | / | VILM | CD | |