No campo do processamento de linguagem natural, os modelos de linguagem pré-treinados (Modelos de Linguagem Pré-treinados) tornaram-se uma tecnologia básica muito importante. Este armazém coleta principalmente alguns modelos de pré-treinamento chineses de alta qualidade, modelos multimodais chineses e modelos de linguagem chinesa de grande porte. são atualmente públicos na Internet e outros conteúdos (graças ao cara que compartilhou os recursos), e continuarão sendo atualizados...
Para baixar o modelo de armazém HuggingFace na China, é recomendado usar o endereço do espelho HuggingFace: https://hf-mirror.com/
Registro de alterações
Modelo grande básico geral
Modelo grande de fundação vertical
Modelo de diálogo universal
Modelo de diálogo vertical
Modelo grande de diálogo multimodal
Referência de avaliação de modelo grande
Modelo de experiência online
Plataforma de biblioteca de modelos de código aberto
Biblioteca de conjuntos de dados de código aberto
Conjunto de dados de instruções chinesas de código aberto
Incorporação
Outro incrível
备注
ND: Decodificador Não Causal ou Prefixo LM
CD: Decodificador Causal
ED: Codificador-Decodificador
Modelos básicos de grande escala: Somente modelos
大于7B
parâmetros estão listados na tabela.
Modelo | tamanho | tempo | linguagem | campo | download | Endereço do projeto | Instituição/Indivíduo | Arquitetura | literatura | Observação |
---|---|---|---|---|---|---|---|---|---|---|
XVERSE-MoE | 255B/A36B | 2024-09 | Chinês e Inglês | Universal | ?HF | XVERSE-MoE-A36B | xverse-ai | Ministério da Educação | ||
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | Chinês e Inglês | Universal | ?HF | Qwen2.5 | QwenLM | CD | Blogue | |
Tele-FLM | 52B/102B/1TB | 2024-07 | Multilíngue | Universal | [?HF] | / | CofeAI | CD | Relatório Técnico Tele-FLM | |
metal-lhama-3.1 | 8/70/405B | 2024-07 | Multilíngue | Universal | [?HF] | lhama3 | metal-lhama | CD | ||
internolm2.5-Base | 7B | 2024-07 | Chinês e Inglês | Universal | [?HF] | EstagiárioLM | EstagiárioLM | CD | Relatório Técnico | |
MAP-NEO-Base | 2/7B | 2024-06 | Chinês e Inglês | Universal | ?HF | MAPA-NEO | projeção de arte multimodal | CD | Papel | |
Nemotron-4-Base | 340B | 2024-06 | Multilíngue | Universal | ?HF | / | NVIDIA | CD | relatório técnico. | |
Base de índice | 1,9B | 2024-06 | Chinês e Inglês | Universal | ?HF | Índice-1.9B | bilibili | CD | Relatório | |
Base Qwen2 | 0,5/2/5/7/72B | 2024-06 | Multilíngue | Universal | ?HF | Qwen2 | QwenLM | CD | Blogue | |
Base GLM-4 | 9B | 2024-06 | Multilíngue | Universal | ?HF | GLM-4 | THUDM | / | ||
Yi-1.5-Base | 09/06/34B | 2024-05 | Chinês e Inglês | Universal | ?HF | Yi-1,5 | 01-ai | CD | Papel | |
DeepSeek-V2-Base | A21B/236B | 2024-05 | Chinês e Inglês | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papel | |
Lhama-3-Base | 8/70B | 2024-04 | Multilíngue | Universal | ?HF | lhama3 | Meta Lhama | CD | ||
Base Zhinao | 7B | 2024-04 | Chinês e Inglês | Universal | ?HF? | / | Tecnologia Qihoo | CD | ||
XVERSE-MoE | A4.2B/25.8B | 2024-04 | Chinês e Inglês | Universal | ?HF | XVERSE-MoE-A4.2B | xverse-ai | Ministério da Educação | ||
Base SoftTiger | 13/70B | 2024-04 | Chinês e Inglês | Universal | ?HF | TigerBot | TigerResearch | CD | ||
MarteloLLM | 1.4b | 2024-04 | Chinês e Inglês | Universal | ?HF | MarteloLLM | DataHammer | |||
Base Mengzi3 | 13B | 2024-04 | Chinês e Inglês | Universal | ?HF | Mengzi3 | Langboat | CD | ||
Base Brisa | 7B | 2024-02 | Chinês e Inglês | Universal | ?HF | / | Pesquisa MediaTek | |||
TorreBase | 7/13B | 2024-02 | Multilíngue | Universal | [?HF] | / | Inbabel | CD | ||
Qwen1.5-Base | 0,5/1,8/4 14/07/32/72/110B | 2024-02 | Chinês e Inglês | Universal | [?HF] | Qwen1.5 | Qwen | / | Blogue | |
LongAlign-Base | 07/06/13B | 2024-02 | Chinês e Inglês | Universal | [?HF] | LongAlign | THUDM | / | Papel | |
Base Mixtral Chinesa | 8x7B | 2024-02 | Chinês e Inglês | Universal | [Baidu] [?HF] | Chinês-Mixtral | Yiming Cui | MOE | ||
Base iFlytekSpark | 13B | 2024-01 | Chinês e Inglês | Universal | esporo mental | / | iFlytek | CD | ||
Base Orion | 14B | 2024-01 | Multilíngue | Universal | [?HF] | Órion | OrionStar AI | CD | Papel | pano Plug-in |
YaYi2-Base | 30B | 2023-12 | Multilíngue | Universal | [?HF] | YAYI2 | pesquisa wengué | CD | Papel | |
Aquila2-Base | 34/07/70B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Aquila2 | Bandeira AI | CD | ||
Base Alaya | 7B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Alaya | DataCanvas | CD | ||
Base Qwen | 1,8/7 14/72B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Qwen | Nuvem Alibaba | CD | Relatório de relatório em papel2 | |
Base DeepSeek | 7/67B | 2023-11 | Chinês e Inglês | Universal | [?HF] | DeepSeek-LLM | deepseek-ai | CD | ||
Yuan-2,0 | 2/51 102B | 2023-11 | Chinês e Inglês | Universal | Baidu [?HF] | Yuan-2,0 | IEIT-Yuan | CD | ||
Base Alaya | 7B | 2023-11 | Chinês e Inglês | Universal | [?HF] | Alaya | DataCanvasIO | CD | ||
Base Yi | 09/06/34B | 2023-11 | Chinês e Inglês | Universal | [?HF] | Sim | 01.AI | CD | ||
Base XVERSE | 13/07 65B | 2023-11 | Multilíngue | Universal | [?HF] | XVERSO | Tecnologia Yuan Xiang | CD | ||
Base Nanbeige | 16B | 2023-11 | Chinês e Inglês | Universal | [?HF] | Nanbeige | Laboratório Nanbeige LLM | CD | ||
LingoWhale | 8B | 2023-11 | Chinês e Inglês | Universal | [?HF] | LingoWhale-8B | DeepLang IA | CD | ||
Base Skywork | 13B | 2023-10 | chinês | Universal | [?HF] | Skywork | Skywork AI | CD | Papel | |
Base BlueLM | 7B | 2023-11 | Chinês e Inglês | Universal | [?HF] | AzulLM | Laboratório de IA vivo | CD | ||
Chatglm3-base | 6B | 2023-10 | Chinês e Inglês | Universal | [?HF] | Bate-papoGLM3 | THUDM | DE | ||
Base Ziya2 | 13B | 2023-10 | Chinês e Inglês | Universal | [?HF] | Fengshenbang-LM | Instituto IDÉIA | CD | ||
OpenBA-LM | 15B | 2023-09 | Chinês e Inglês | Universal | [?HF] | OpenBA | Grupo OpenNLG | DE | Papel | |
TigerBot-Base-70B | 80B | 2023-09 | Multilíngue | Universal | [?HF] | TigerBot | Tecnologia Hubo | CD | Papel | |
FLM | 101B | 2023-09 | Chinês e Inglês | Universal | [?HF] | / | CofeAI | CD | ||
falcão | 7/40 180B | 2023-09 | Multilíngue | Universal | [?HF] | / | Instituto de Inovação Tecnológica | CD | ||
Baichuan2 | 7/13B | 2023-09 | chinês | Universal | [?HF] | Baichuan2 | Inteligência Baichuan | CD | ||
Chinês-LLaMA-2-16K | 7/13B | 2023-08 | Chinês e Inglês | Universal | [?HF] | Chinês-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | Chinês e Inglês | Universal | [?HF] | YuLan-Chat | Universidade Renmin da China | CD | ||
Aquila-Base-33B | 33B | 2023-08 | Chinês e Inglês | Universal | PENDÊNCIA | Áquila | Bandeira AI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | Multilíngue | Universal | [?HF] | TigerBot | Tecnologia Hubo | CD | ||
Linly-Chinês-LLaMA-2 | 7/13B | 2023-07 | Chinês e Inglês | Universal | [?HF] | Linly | Instituto de Visão Computacional da Universidade de Shenzhen | CD | ||
Chinês-LLaMA-2 | 7B | 2023-07 | Chinês e Inglês | Universal | [?HF] | Chinês-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
Base de Jiang | 13B | 2023-07 | chinês | Universal | [?HF] | / | Não conhecendo a sabedoria | CD | ||
wx | 7/13B | 2023-07 | chinês | Universal | [?HF] | / | Número nacional da baleia azul | CD | ||
Lhama2 | 13/07 70B | 2023-07 | Multilíngue | Universal | [?HF] | lhama | meta | CD | Papel | |
PoliLM | 13B | 2023-07 | Multilíngue | Universal | [?HF] | PoliLM | Academia Bodhidharma | CD | Papel | |
Baichuan-13B | 13B | 2023-07 | chinês | Universal | [?HF] | Baichuan-13B | Inteligência Baichuan | CD | ||
TigerBot | 7B | 2023-07 | Multilíngue | Universal | [?HF] | TigerBot | Tecnologia Hubo | CD | ||
EstagiárioLM-base | 7/20B | 2023-07 | chinês | Universal | [?HF] | EstagiárioLM | Laboratório de Inteligência Artificial de Xangai | CD | relatório | |
MPT | 7/30B | 2023-06 | Multilíngue | Universal | [?HF] | fundição lm | MosaicML | CD | ||
Baichuan | 7B | 2023-06 | Chinês e Inglês | Universal | [?HF] | baichuan-7B | Inteligência Baichuan | CD | ||
Falcão Chinês | 7B | 2023-06 | Chinês e Inglês | Universal | [?HF] | Linly | Instituto de Visão Computacional da Universidade de Shenzhen | CD | Blogue | |
AtomGPT | 13B | 2023-06 | Chinês e Inglês | Universal | [?HF] | / | eco atômico | CD | ||
Áquila | 7B | 2023-06 | Chinês e Inglês | Universal | [?HF] | Áquila | Bandeira AI | CD | ||
Chinês-LLaMA | 33B | 2023-06 | Chinês e Inglês | Universal | [?HF] | Chinês-LLaMA-Alpaca | Yiming Cui | CD | ||
TigerBot | 7B | 2023-06 | Multilíngue | Universal | [?HF] | TigerBot | Tecnologia Hubo | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | Chinês e Inglês | Universal | [?HF] | Pandallm | dente-de-leão | CD | ||
Panda | 7/13B | 2023-05 | Chinês e Inglês | Universal | [?HF] | Pandallm | dente-de-leão | CD | ||
OpenLLaMA | 13B | 2023-05 | Chinês e Inglês | Universal | [?HF] | Linly | Instituto de Visão Computacional da Universidade de Shenzhen | CD | ||
BiLLa-LLM | 7B | 2023-05 | Chinês e Inglês | Universal | [?HF] | ikB | Zhongli Li | CD | ||
Ziya-LLaMA-Recompensa | 7B | 2023-05 | Chinês e Inglês | Universal | [?HF] | Fengshenbang-LM | Instituto IDÉIA | CD | ||
Yu Yan | 11B | 2023-04 | chinês | Universal | [?HF] | / | NetEase Fuxi | CD | Papel | |
Chinês-LLaMA | 13/07/33B | 2023-04 | chinês | Universal | [?HF] | Linly | Instituto de Visão Computacional da Universidade de Shenzhen | CD | Blogue | |
OpenChinêsLLaMA | 7B | 2023-04 | Chinês e Inglês | Universal | [?HF] | OpenChinêsLLaMA | OpenLMLab | CD | ||
MUSGO-003 | 16B | 2023-04 | Chinês e Inglês | Universal | [?HF] | MUSGO | Universidade Fudan | CD | ||
BBT-2-Texto | 13B | 2023-04 | chinês | Universal | Aplicar | Aplicativos BBT-FinCUGE | supersimetria | CD | Papel | |
BBT-2-Texto | 12B | 2023-04 | chinês | Universal | Aplicar | Aplicativos BBT-FinCUGE | supersimetria | CD | Papel | |
Chinês-LLaMA | 13B | 2023-04 | Chinês e Inglês | Universal | [?HF] | Chinês-LLaMA-Alpaca | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | Multilíngue | Universal | [?HF] | ul2 | DE | Papel | ||
CPM-Bee | 10B | 2023-01 | Chinês e Inglês | Universal | [?HF] | CPM-Bee | OpenBMB | CD | ||
FLORESCER | 176B | 2022-11 | Multilíngue | Universal | [?HF] | Megatron-DeepSpeed | Grande Ciência | CD | Papel | |
FLORZ | 176B | 2022-11 | Multilíngue | Universal | [?HF] | Megatron-DeepSpeed | Grande Ciência | CD | Papel | |
flan-t5-xxl | 11B | 2022-11 | Multilíngue | Universal | [?HF] | t5x | DE | papel | ||
CPM-Ant+ | 10B | 2022-10 | Chinês e Inglês | Universal | BMB | CPM-Ao Vivo | OpenBMB | CD | blog | |
GLM | 130B | 2022-10 | Chinês e Inglês | Universal | Aplicar | GLM-130B | Universidade Tsinghua | DE | papel | |
CPM-Formiga | 10B | 2022-09 | chinês | Universal | [?HF] | CPM-Ao vivo | OpenBMB | CD | blog | |
GLM | 10B | 2022-09 | chinês | Universal | [?HF] | GLM | Universidade Tsinghua | DE | papel | |
Fonte 1.0 | 245B | 2021-09 | chinês | Universal | API | Yian-1.0 | aceno | CD | papel | |
CPM-2 | 11/10/ 200B | 2021-06 | chinês | Universal | Aplicar | CPM | Instituto de Pesquisa Zhiyuan | DE | papel | |
PanGu-Alfa | 13/200B | 2021-05 | chinês | Universal | [?HF] | PanGu-Alfa | Laboratório Pengcheng | CD | papel | |
PLUGUE | 27B | 2021-04 | chinês | Universal | Aplicar | AliceMind | Alibaba | DE | ||
GPT-3 | 13/30B | 2021-04 | chinês | Universal | PENDÊNCIA | GPT-3 | Academia Bodhidharma | CD |
[Voltar ao início]
Modelos básicos de código aberto em vários campos verticais
Modelo | tamanho | tempo | linguagem | campo | download | Endereço do projeto | Instituição/Indivíduo | Arquitetura | literatura | Observação |
---|---|---|---|---|---|---|---|---|---|---|
Qwen-2.5 | 1,5/7B | 2024-09 | Chinês e Inglês | código | ?HF | Qwen2.5 | QwenLM | CD | Blogue | |
Qwen-2.5 | 1,5/7/72B | 2024-09 | Chinês e Inglês | matemática | ?HF | Qwen2.5 | QwenLM | CD | Blogue | |
Base Financeira de Tongyi | 14B | 2023-11 | chinês | financiar | ModelScope | Finanças Tongyi-14B | Modelo financeiro Tongyi | CD | ||
ChiMed-GPT | 13B | 2023-10 | chinês | médico | [?HF] | ChiMed-GPT | Universidade de Ciência e Tecnologia da China | CD | Papel | |
Base CodeShell | 7B | 2023-10 | Chinês e Inglês | código | [?HF] | shell de código | Sabedoria | CD | ||
Base WiNGPT | 7B | 2023-09 | chinês | medicamento | [?HF] | WiNGPT2 | Vencendo a pesquisa de IA em saúde | CD | ||
Xuanyuan | 70B | 2023-09 | chinês | financiar | [?HF] | Xuanyuan | Du Xiaoman | CD | Relatório | |
CódigoLLAma | 13/07/ 34B | 2023-08 | Multilíngue | código | [?HF] | codelama | Metapesquisa | CD | Papel | |
educat-base-002 | 7/13B | 2023-06 | Chinês e Inglês | educar | [?HF] | EducaChat | Universidade Normal do Leste da China | CD | ||
AquilaCode-NV | 7B | 2023-06 | Chinês e Inglês | código | [?HF] | Áquila | Bandeira AI | CD | ||
AquilaCode-TS | 7B | 2023-06 | Chinês e Inglês | código | [?HF] | Áquila | Bandeira AI | CD | ||
LeiWGPT | 7B | 2023-05 | Chinês e Inglês | lei | [?HF] | LeiGPT | Canção Pengxiao | CD | ||
CodeGeeX | 13B | 2022-06 | Multilíngue | código | Aplicar | CodeGeeX | Universidade Tsinghua | CD | blog |
[Voltar ao início]
Modelo de linguagem grande com recursos como resposta a perguntas e diálogo.
Modelo | tamanho | tempo | linguagem | campo | download | Endereço do projeto | Instituição/Indivíduo | Arquitetura | literatura |
---|---|---|---|---|---|---|---|---|---|
Athene-V2-Chat | 72B | 2024-11 | Chinês e Inglês | Universal | ?HF | / | Nexusfluxo | CD | Blogue |
Agente Athene-V2 | 72B | 2024-11 | Chinês e Inglês | Chamada de ferramenta | ?HF | / | Nexusfluxo | CD | Blogue |
Hunyuan-Grande | A52/389B | 2024-11 | Chinês e Inglês | Universal | ?HF | Tencent-Hunyuan-Grande | Tencent | Ministério da Educação | Papel |
Aya-Expansão | 8/32B | 2024-10 | Multilíngue | Universal | ?HF | / | Cohere para IA | CD | |
Granito 3.0 | 1/2/3/8B | 2024-10 | Multilíngue | Universal | ?HF | modelos de linguagem granito-3.0 | IBM-granito | CD | Papel |
Granito 3,0-MoE | 1B/3B/A400M | 2024-10 | Multilíngue | Universal | ?HF | modelos de linguagem granito-3.0 | IBM-granito | Ministério da Educação | Papel |
TeleChat2 | 115B | 2024-09 | Chinês e Inglês | Universal | ?ModelScope | TeleChat2 | Tele-AI | CD | |
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | Chinês e Inglês | Universal | ?HF | Qwen2.5 | QwenLM | CD | Blogue |
XVERSE-MoE | 255B/A36B | 2024-09 | Chinês e Inglês | Universal | ?HF | XVERSE-MoE-A36B | xverse-ai | Ministério da Educação | |
DeepSeek-V2.5 | 236B/A21B | 2024-09 | Chinês e Inglês | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papel |
MiniCPM3 | 4B | 2024-09 | Chinês e Inglês | Universal | ?HF | MiniCPM | OpenBMB | CD | Artigo MiniCPM |
Comando C4AI R+ 08-2024 | 104B | 2024-08 | Multilíngue | Universal | ?HF | / | CohereForAI | CD | |
JIUTIAN-Bate-papo | 39/A13B | 2024-07 | Chinês e Inglês | Universal | ?EM | / | China Mobile JiuTian-AI | MOE | |
metal-lhama-3.1 | 8/70/405B | 2024-07 | Multilíngue | Universal | [?HF] | lhama3 | metal-lhama | CD | |
estagiáriolm2.5-chat | 7B | 2024-07 | Chinês e Inglês | Universal | [?HF] | EstagiárioLM | EstagiárioLM | CD | Relatório Técnico |
Mistral-grande-insruct-2407 | 123B | 2024-07 | Multilíngue | Universal | ?HF | / | IA Mistral | postagem no blog | |
DeepSeek-V2-Chat-0628 | 236B | 2024-07 | Chinês e Inglês | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papel |
C4ai-command-r-plus | 104B | 2024-07 | Multilíngue | Universal | ?HF | / | CohereForAI | CD | |
Gemma-2-bate-papo | 27/09B | 2024-06 | Multilíngue | Universal | ?HF | / | CD | ||
MAP-NEO-Chat | 2/7B | 2024-06 | Chinês e Inglês | Universal | ?HF | MAPA-NEO | projeção de arte multimodal | CD | Papel |
GEB-Chat | 1,3B | 2024-06 | Chinês e Inglês | Universal | ?HF | / | GEB-AGI | CD | Papel |
Nemotron-4-Bate-papo | 340B | 2024-06 | Multilíngue | Universal | ?HF | / | NVIDIA | CD | relatório técnico. |
Índice-Chat | 1,9B | 2024-06 | Chinês e Inglês | Universal | ?HF | Índice-1.9B | bilibili | CD | Relatório |
Qwen2-MoE | 57B/A14B | 2024-06 | Multilíngue | Universal | ?HF | Qwen2 | QwenLM | Ministério da Educação | Blogue |
Qwen2-Chat | 0,5/2/5/7/72B | 2024-06 | Multilíngue | Universal | ?HF | Qwen2 | QwenLM | CD | Blogue |
GLM-4-Bate-papo | 9B | 2024-06 | Multilíngue | Universal | ?HF | GLM-4 | THUDM | / | |
Skywork-MoE | 16/A22B/146B | 2024-06 | Chinês e Inglês | Universal | ?HF | Skywork-MoE | SkyworkAI | Ministério da Educação | Relatório técnico |
Yuan 2,0 | 40/A3.7B | 2024-05 | Chinês e Inglês | Universal | ?HF | Yuan2.0-M32 | IEIT-Yuan | MOE | Papel |
Star-Chat | 52B | 2024-05 | Chinês e Inglês | Universal | ?HF | TeleChat-52B | Tele-IA | CD | |
Ling Long | 317 milhões | 2024-05 | Chinês e Inglês | Universal | ?HF | Linglong | nkcs-iclab | CD | |
Marinheiro | 14B | 2024-05 | 7 idiomas | Universal | ?HF | marinheiro-llm | vela-sg | CD | Papel |
Nanbeige2 | 8/16B | 2024-05 | Chinês e Inglês | Universal | ?HF | Nanbeige | Nanbeige | CD | |
Yi-1.5-Bate-papo | 09/06/34B | 2024-05 | Chinês e Inglês | Universal | ?HF | Yi-1,5 | 01-ai | CD | Papel |
Bate-papo DeepSeek-V2 | A21B/236B | 2024-05 | Chinês e Inglês | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papel |
XVERSE-MoE | A4.2B/25.8B | 2024-05 | Chinês e Inglês | Universal | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MOE | |
Lhama3-zh | 8/70B | 2024-04 | Chinês e Inglês | Universal | ?HF | / | / | CD | lista chinesa llama3 |
Llama3-Chinês-Chat | 8B | 2024-04 | Chinês e Inglês | Universal | ?HF | / | Shenzhi Wang | CD | |
Lhama-3-Chat | 8/70B | 2024-04 | Multilíngue | Universal | ?HF | lhama3 | Meta Lhama | CD | |
Zhinao-Chat | 7B | 2024-04 | Chinês e Inglês | Universal | ?HF? | / | Tecnologia Qihoo | CD | |
MiniCPM-MoE | 8x2B | 2024-04 | Chinês e Inglês | Universal | ?HF | MiniCPM | OpenBMB | Ministério da Educação | |
Nanbeige2-Chat | 8B | 2024-04 | Chinês e Inglês | Universal | ?HF | Nanbeige | Laboratório Nanbeige LLM | CD | |
Marinheiro | 7B | 2024-04 | Multilíngue | Universal | ?HF | marinheiro-llm | Laboratório de IA do Mar | CD | Papel |
Mengzi3-Chat | 13B | 2024-04 | Chinês e Inglês | Universal | ?HF | Mengzi3 | Langboat | CD | |
Qwen-MoE | 2,7B | 2024-03 | Chinês e Inglês | Universal | ?HF | Qwen1.5 | Qwen | Ministério da Educação | Blogue |
Comando-R | 35B | 2024-03 | Multilíngue | Universal | ?HF | / | CohereForAI | CD | |
Breeze-Instruir | 7B | 2024-02 | Chinês e Inglês | Universal | ?HF | / | Pesquisa MediaTek | ||
aya-101 | 13B | 2024-02 | Multilíngue | Universal | ?HF | / | Cohere para IA | CD | Papel |
QuímicaLLM | 7B | 2024-02 | Multilíngue | Universal | ?HF | / | AI4Chem | CD | Papel |
TorreInstruir | 7/13B | 2024-02 | Multilíngue | Universal | [?HF] | / | Inbabel | CD | |
Qwen1.5-Bate-papo | 0,5/1,8/4/ 14/07/32/72/110B | 2024-02 | Chinês e Inglês | Universal | [?HF] | Qwen1.5 | Qwen | / | Blogue |
MiniCPM | 2B | 2024-02 | Chinês e Inglês | Universal | [?HF] ModelScope | MiniCPM | OpenBMB | / | Relatório |
LongAlign-Chat | 07/06/13B | 2024-02 | Chinês e Inglês | Universal | [?HF] | LongAlign | THUDM | / | Papel |
Chat Chinês-Mixtral | 8x7B | 2024-02 | Chinês e Inglês | Universal | [Baidu] [?HF] | Chinês-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Chat | 13B | 2024-01 | Chinês e Inglês | Universal | esporo mental | / | iFlytek | CD | |
rwkv-5-mundo | 0,1/1/ 3/7B | 2023-01 | Multilíngue | Universal | [?HF] | RWKV-LM | BlinkDL | URL | |
Orion-Chat | 14B | 2024-01 | Multilíngue | Universal | [?HF] | Órion | OrionStarAI | CD | Papel |
internlm2-chat | 7/20B | 2024-01 | Chinês e Inglês | Universal | [?HF] | EstagiárioLM | EstagiárioLM | CD | Relatório |
Chinês-Mixtral | 8x7B | 2023-01 | Chinês e Inglês | Universal | [?HF] | / | HIT-SCIR | CD-MOE | |
Bate-papo por telefone | 7/12B | 2024-01 | Chinês e Inglês | Universal | [?HF] | Telechatx | Tele-IA | CD | Relatório |
kagentlms | 7/13B | 2024-01 | Chinês e Inglês | Universal | [?HF] | Agentes Kwai | KwaiKEG | ||
YaYi2-Chat | 30B | 2023-12 | Multilíngue | Universal | [?HF] | YAYI2 | pesquisa wengué | CD | Papel |
Bate-papo SUS | 34/72B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Bate-papo SUS | SUSTech-IDEA | CD | |
Aquila2-Chat | 34/07/70B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Aquila2 | Bandeira AI | CD | |
Alaya-Chat | 7B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Alaya | DataCanvas | CD | |
Qwen-Chat | 1,8/7/ 14/72B | 2023-12 | Chinês e Inglês | Universal | [?HF] | Qwen | Nuvem Alibaba | CD | Relatório de relatório em papel2 |
Bate-papo DeepSeek | 7/67B | 2023-11 | Chinês e Inglês | Universal | [?HF] | DeepSeek-LLM | deepseek-ai | CD | |
Yi-Chat | 6/34B | 2023-11 | Chinês e Inglês | Universal | [?HF] | Sim | 01.AI | CD | |
Alaya-Chat | 7B | 2023-11 | Chinês e Inglês | Universal | [?HF] | Alaya | DataCanvasIO | CD | |
OrionStar-Yi-Chat | 34B | 2023-11 | Chinês e Inglês | Universal | [?HF] | OrionStar-Yi-34B-Chat | OrionStarAI | CD | |
Bate-papo Nanbeige | 16B | 2023-11 | Chinês e Inglês | Universal | [?HF] | Nanbeige | Laboratório Nanbeige LLM | CD | |
OpenChat 3.5 | 7B | 2023-11 | Chinês e Inglês | Universal | [?HF] | bate-papo aberto | OpenChat | CD | Papel |
XVERSE-Chat | 7/13B | 2023-11 | Multilíngue | Universal | [?HF] | XVERSO | Tecnologia Yuan Xiang | CD | |
AndesGPT | 7B | 2023-11 | chinês | Universal | [?HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Chat | 13B | 2023-11 | Multilíngue | Universal | [?HF] | SeaLLMs | SeaLLMs | CD | |
AzulLM | 7B | 2023-11 | Chinês e Inglês | Universal | [?HF] | AzulLM | Laboratório de IA vivo | CD | |
Bate-papo Skywork | 13B | 2023-10 | chinês | Universal | [?HF] | Skywork | SkyworkAI | CD | Papel |
Zéfiro | 7B | 2023-10 | Multilíngue | Universal | [?HF] | manual de alinhamento | Abraçando o Rosto H4 | CD | Papel |
Mistral | 7B | 2023-10 | Multilíngue | Universal | [?HF] | mistral-src | IA Mistral | CD | Papel |
chatglm3 | 6B | 2023-10 | Chinês e Inglês | Universal | [?HF] | Bate-papoGLM3 | THUDM | DE | |
Bate-papo Zhiyin | 7B | 2023-10 | Chinês e Inglês | Universal | [?HF] | Zhiyin | Instituto de Acústica, Academia Chinesa de Ciências | CD | |
Ziya2-Chat | 13B | 2023-10 | Chinês e Inglês | Universal | [?HF] | Fengshenbang-LM | Instituto IDÉIA | CD | |
Abutre | 40/180B | 2023-10 | Multilíngue | Universal | [?HF] | / | VILM-AI | PENDÊNCIA | |
Abutre | 3/7/ 40/180B | 2023-09 | Multilíngue | Universal | [?HF] | / | VILM | CD | |