awesome pretrained chinese nlp models
1.0.0
在自然語言處理領域中,預訓練語言模型(Pretrained Language Models)已成為非常重要的基礎技術,本倉庫主要收集目前網路上公開的一些高品質中文預訓練模型、中文多模態模型、中文大語言模型等內容(感謝分享資源的大佬),並將持續更新...
國內下載HuggingFace倉庫模型推薦使用HuggingFace鏡像位址: https://hf-mirror.com/
更新日誌
一般基礎大模型
垂直基礎大模型
通用對話大模型
垂直對話大模型
多模態對話大模型
大模型評估基準
線上體驗大模型
開源模型庫平台
開源資料集庫
開源中文指令資料集
Embedding
Other-Awesome
备注
ND: Non-Causal Decoder or Prefix LM
CD: Causal Decoder
ED: Encoder-Decoder
大規模基礎模型:表格中只羅列出參數
大于7B
以上模型。
模型 | 大小 | 時間 | 語言 | 領域 | 下載 | 項目地址 | 機構/個人 | 架構 | 文獻 | 備註 |
---|---|---|---|---|---|---|---|---|---|---|
XVERSE-MoE | 255B/A36B | 2024-09 | 中英 | 一般 | ?HF | XVERSE-MoE-A36B | xverse-ai | MoE | ||
Qwen-2.5 | 0.5/1.5/3/7/14/32/72B | 2024-09 | 中英 | 一般 | ?HF | Qwen2.5 | QwenLM | CD | Blog | |
Tele-FLM | 52B/102B/1TB | 2024-07 | 多語 | 一般 | [?HF] | / | CofeAI | CD | Tele-FLM Technical Report | |
meta-llama-3.1 | 8/70/405B | 2024-07 | 多語 | 一般 | [?HF] | llama3 | meta-llama | CD | ||
internlm2.5-Base | 7B | 2024-07 | 中英 | 一般 | [?HF] | InternLM | InternLM | CD | Technical Report | |
MAP-NEO-Base | 2/7B | 2024-06 | 中英 | 一般 | ?HF | MAP-NEO | multimodal-art-projection | CD | Paper | |
Nemotron-4-Base | 340B | 2024-06 | 多語 | 一般 | ?HF | / | NVIDIA | CD | technical report. | |
Index-Base | 1.9B | 2024-06 | 中英 | 一般 | ?HF | Index-1.9B | bilibili | CD | Report | |
Qwen2-Base | 0.5/2/5/7/72B | 2024-06 | 多語 | 一般 | ?HF | Qwen2 | QwenLM | CD | Blog | |
GLM-4-Base | 9B | 2024-06 | 多語 | 一般 | ?HF | GLM-4 | THUDM | / | ||
Yi-1.5-Base | 6/9/34B | 2024-05 | 中英 | 一般 | ?HF | Yi-1.5 | 01-ai | CD | Paper | |
DeepSeek-V2-Base | A21B/236B | 2024-05 | 中英 | 一般 | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Paper | |
Llama-3-Base | 8/70B | 2024-04 | 多語 | 一般 | ?HF | llama3 | Meta Llama | CD | ||
Zhinao-Base | 7B | 2024-04 | 中英 | 一般 | ?HF ? | / | 奇虎科技 | CD | ||
XVERSE-MoE | A4.2B/25.8B | 2024-04 | 中英 | 一般 | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MoE | ||
SoftTiger-Base | 13/70B | 2024-04 | 中英 | 一般 | ?HF | TigerBot | TigerResearch | CD | ||
HammerLLM | 1.4b | 2024-04 | 中英 | 一般 | ?HF | HammerLLM | DataHammer | |||
Mengzi3-Base | 13B | 2024-04 | 中英 | 一般 | ?HF | Mengzi3 | Langboat | CD | ||
Breeze-Base | 7B | 2024-02 | 中英 | 一般 | ?HF | / | MediaTek Research | |||
TowerBase | 7/13B | 2024-02 | 多語 | 一般 | [?HF] | / | Unbabel | CD | ||
Qwen1.5-Base | 0.5/1.8/4 7/14/32/72/110B | 2024-02 | 中英 | 一般 | [?HF] | Qwen1.5 | Qwen | / | Blog | |
LongAlign-Base | 6/7/13B | 2024-02 | 中英 | 一般 | [?HF] | LongAlign | THUDM | / | Paper | |
Chinese-Mixtral-Base | 8x7B | 2024-02 | 中英 | 一般 | [Baidu] [?HF] | Chinese-Mixtral | Yiming Cui | MOE | ||
iFlytekSpark-Base | 13B | 2024-01 | 中英 | 一般 | mindspore | / | 科大訊飛 | CD | ||
Orion-Base | 14B | 2024-01 | 多語 | 一般 | [?HF] | Orion | OrionStarAI | CD | Paper | RAG Plugin |
YaYi2-Base | 30B | 2023-12 | 多語 | 一般 | [?HF] | YAYI2 | wenge-research | CD | Paper | |
Aquila2-Base | 7/34/70B | 2023-12 | 中英 | 一般 | [?HF] | Aquila2 | FlagAI | CD | ||
Alaya-Base | 7B | 2023-12 | 中英 | 一般 | [?HF] | Alaya | DataCanvas | CD | ||
Qwen-Base | 1.8/7 14/72B | 2023-12 | 中英 | 一般 | [?HF] | Qwen | 阿里雲 | CD | Paper Report Report2 | |
DeepSeek-Base | 7/67B | 2023-11 | 中英 | 一般 | [?HF] | DeepSeek-LLM | deepseek-ai | CD | ||
Yuan-2.0 | 2/51 102B | 2023-11 | 中英 | 一般 | baidu [?HF] | Yuan-2.0 | IEIT-Yuan | CD | ||
Alaya-Base | 7B | 2023-11 | 中英 | 一般 | [?HF] | Alaya | DataCanvasIO | CD | ||
Yi-Base | 6/9/34B | 2023-11 | 中英 | 一般 | [?HF] | Yi | 01.AI | CD | ||
XVERSE-Base | 7/13 65B | 2023-11 | 多語 | 一般 | [?HF] | XVERSE | 元象科技 | CD | ||
Nanbeige-Base | 16B | 2023-11 | 中英 | 一般 | [?HF] | Nanbeige | Nanbeige LLM Lab | CD | ||
LingoWhale | 8B | 2023-11 | 中英 | 一般 | [?HF] | LingoWhale-8B | DeepLang AI | CD | ||
Skywork-base | 13B | 2023-10 | 中文 | 一般 | [?HF] | Skywork | SkyworkAI | CD | Paper | |
BlueLM-Base | 7B | 2023-11 | 中英 | 一般 | [?HF] | BlueLM | vivo AI Lab | CD | ||
Chatglm3-base | 6B | 2023-10 | 中英 | 一般 | [?HF] | ChatGLM3 | THUDM | ND | ||
Ziya2-Base | 13B | 2023-10 | 中英 | 一般 | [?HF] | Fengshenbang-LM | IDEA研究院 | CD | ||
OpenBA-LM | 15B | 2023-09 | 中英 | 一般 | [?HF] | OpenBA | OpenNLG Group | ED | Paper | |
TigerBot-Base-70B | 80B | 2023-09 | 多語 | 一般 | [?HF] | TigerBot | 虎博科技 | CD | Paper | |
FLM | 101B | 2023-09 | 中英 | 一般 | [?HF] | / | CofeAI | CD | ||
falcon | 7/40 180B | 2023-09 | 多語 | 一般 | [?HF] | / | Technology Innovation Institute | CD | ||
Baichuan2 | 7/13B | 2023-09 | 中文 | 一般 | [?HF] | Baichuan2 | 百川智能 | CD | ||
Chinese-LLaMA-2-16K | 7/13B | 2023-08 | 中英 | 一般 | [?HF] | 中文-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | 中英 | 一般 | [?HF] | YuLan-Chat | 中國人民大學 | CD | ||
Aquila-Base-33B | 33B | 2023-08 | 中英 | 一般 | TODO | Aquila | FlagAI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | 多語 | 一般 | [?HF] | TigerBot | 虎博科技 | CD | ||
Linly-Chinese-LLaMA-2 | 7/13B | 2023-07 | 中英 | 一般 | [?HF] | Linly | 深圳大學電腦視覺研究所 | CD | ||
Chinese-LLaMA-2 | 7B | 2023-07 | 中英 | 一般 | [?HF] | 中文-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
Jiang-base | 13B | 2023-07 | 中文 | 一般 | [?HF] | / | 知未智能 | CD | ||
bwx | 7/13B | 2023-07 | 中文 | 一般 | [?HF] | / | 藍鯨國數 | CD | ||
Llama2 | 7/13 70B | 2023-07 | 多語 | 一般 | [?HF] | llama | Meta | CD | Paper | |
PolyLM | 13B | 2023-07 | 多語 | 一般 | [?HF] | PolyLM | 達摩院 | CD | Paper | |
Baichuan-13B | 13B | 2023-07 | 中文 | 一般 | [?HF] | Baichuan-13B | 百川智能 | CD | ||
TigerBot | 7B | 2023-07 | 多語 | 一般 | [?HF] | TigerBot | 虎博科技 | CD | ||
InternLM-base | 7/20B | 2023-07 | 中文 | 一般 | [?HF] | InternLM | 上海人工智慧實驗室 | CD | report | |
MPT | 7/30B | 2023-06 | 多語 | 一般 | [?HF] | llm-foundry | MosaicML | CD | ||
Baichuan | 7B | 2023-06 | 中英 | 一般 | [?HF] | baichuan-7B | 百川智能 | CD | ||
Chinese-Falcon | 7B | 2023-06 | 中英 | 一般 | [?HF] | Linly | 深圳大學電腦視覺研究所 | CD | Blog | |
AtomGPT | 13B | 2023-06 | 中英 | 一般 | [?HF] | / | 原子迴聲 | CD | ||
Aquila | 7B | 2023-06 | 中英 | 一般 | [?HF] | Aquila | FlagAI | CD | ||
Chinese-LLaMA | 33B | 2023-06 | 中英 | 一般 | [?HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | ||
TigerBot | 7B | 2023-06 | 多語 | 一般 | [?HF] | TigerBot | 虎博科技 | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | 中英 | 一般 | [?HF] | pandallm | dandelionsllm | CD | ||
Panda | 7/13B | 2023-05 | 中英 | 一般 | [?HF] | pandallm | dandelionsllm | CD | ||
OpenLLaMA | 13B | 2023-05 | 中英 | 一般 | [?HF] | Linly | 深圳大學電腦視覺研究所 | CD | ||
BiLLa-LLM | 7B | 2023-05 | 中英 | 一般 | [?HF] | BiLLa | Zhongli Li | CD | ||
Ziya-LLaMA-Reward | 7B | 2023-05 | 中英 | 一般 | [?HF] | Fengshenbang-LM | IDEA研究院 | CD | ||
YuYan | 11B | 2023-04 | 中文 | 一般 | [?HF] | / | 網易伏羲 | CD | Paper | |
Chinese-LLaMA | 7/13/33B | 2023-04 | 中文 | 一般 | [?HF] | Linly | 深圳大學電腦視覺研究所 | CD | Blog | |
OpenChineseLLaMA | 7B | 2023-04 | 中英 | 一般 | [?HF] | OpenChineseLLaMA | OpenLMLab | CD | ||
MOSS-003 | 16B | 2023-04 | 中英 | 一般 | [?HF] | MOSS | 復旦大學 | CD | ||
BBT-2-Text | 13B | 2023-04 | 中文 | 一般 | 申請 | BBT-FinCUGE-Applications | 超對稱 | CD | Paper | |
BBT-2-Text | 12B | 2023-04 | 中文 | 一般 | 申請 | BBT-FinCUGE-Applications | 超對稱 | CD | Paper | |
Chinese-LLaMA | 13B | 2023-04 | 中英 | 一般 | [?HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | 多語 | 一般 | [?HF] | ul2 | ED | Paper | ||
CPM-Bee | 10B | 2023-01 | 中英 | 一般 | [?HF] | CPM-Bee | OpenBMB | CD | ||
BLOOM | 176B | 2022-11 | 多語 | 一般 | [?HF] | Megatron-DeepSpeed | BigScience | CD | Paper | |
BLOOMZ | 176B | 2022-11 | 多語 | 一般 | [?HF] | Megatron-DeepSpeed | BigScience | CD | Paper | |
flan-t5-xxl | 11B | 2022-11 | 多語 | 一般 | [?HF] | t5x | ED | paper | ||
CPM-Ant+ | 10B | 2022-10 | 中英 | 一般 | BMB | CPM-Live | OpenBMB | CD | blog | |
GLM | 130B | 2022-10 | 中英 | 一般 | 申請 | GLM-130B | 清華大學 | ND | paper | |
CPM-Ant | 10B | 2022-09 | 中文 | 一般 | [?HF] | CPM-Live | OpenBMB | CD | blog | |
GLM | 10B | 2022-09 | 中文 | 一般 | [?HF] | GLM | 清華大學 | ND | paper | |
源1.0 | 245B | 2021-09 | 中文 | 一般 | API | Yian-1.0 | 浪潮 | CD | paper | |
CPM-2 | 10/11/ 200B | 2021-06 | 中文 | 一般 | 申請 | CPM | 智源研究院 | ED | paper | |
PanGu-Alpha | 13/200B | 2021-05 | 中文 | 一般 | [?HF] | PanGu-Alpha | 鵬城實驗室 | CD | paper | |
PLUG | 27B | 2021-04 | 中文 | 一般 | 申請 | AliceMind | 阿里巴巴 | ED | ||
GPT-3 | 13/30B | 2021-04 | 中文 | 一般 | TODO | GPT-3 | 達摩院 | CD |
[Back to Top]
各個垂直領域開源基礎模型
模型 | 大小 | 時間 | 語言 | 領域 | 下載 | 項目地址 | 機構/個人 | 架構 | 文獻 | 備註 |
---|---|---|---|---|---|---|---|---|---|---|
Qwen-2.5 | 1.5/7B | 2024-09 | 中英 | 程式碼 | ?HF | Qwen2.5 | QwenLM | CD | Blog | |
Qwen-2.5 | 1.5/7/72B | 2024-09 | 中英 | 數學 | ?HF | Qwen2.5 | QwenLM | CD | Blog | |
Tongyi-Finance-Base | 14B | 2023-11 | 中文 | 金融 | ModelScope | 通義金融-14B | 通義金融大模型 | CD | ||
ChiMed-GPT | 13B | 2023-10 | 中文 | 醫療 | [?HF] | ChiMed-GPT | 中國科學技術大學 | CD | Paper | |
CodeShell-base | 7B | 2023-10 | 中英 | 程式碼 | [?HF] | codeshell | WisdomShell | CD | ||
WiNGPT-base | 7B | 2023-09 | 中文 | 醫學 | [?HF] | WiNGPT2 | Winning Health AI Research | CD | ||
XuanYuan | 70B | 2023-09 | 中文 | 金融 | [?HF] | XuanYuan | 度小滿 | CD | Report | |
CodeLLAma | 7/13/ 34B | 2023-08 | 多語 | 程式碼 | [?HF] | codellama | Meta Research | CD | Paper | |
educhat-base-002 | 7/13B | 2023-06 | 中英 | 教育 | [?HF] | EduChat | 華東師範大學 | CD | ||
AquilaCode-NV | 7B | 2023-06 | 中英 | 程式碼 | [?HF] | Aquila | FlagAI | CD | ||
AquilaCode-TS | 7B | 2023-06 | 中英 | 程式碼 | [?HF] | Aquila | FlagAI | CD | ||
LaWGPT | 7B | 2023-05 | 中英 | 法律 | [?HF] | LawGPT | Pengxiao Song | CD | ||
CodeGeeX | 13B | 2022-06 | 多語 | 程式碼 | 申請 | CodeGeeX | 清華大學 | CD | blog |
[Back to Top]
具備問答和對話等功能的大型語言模式。
模型 | 大小 | 時間 | 語言 | 領域 | 下載 | 項目地址 | 機構/個人 | 架構 | 文獻 |
---|---|---|---|---|---|---|---|---|---|
Athene-V2-Chat | 72B | 2024-11 | 中英 | 一般 | ?HF | / | Nexusflow | CD | Blog |
Athene-V2-Agent | 72B | 2024-11 | 中英 | 工具調用 | ?HF | / | Nexusflow | CD | Blog |
Hunyuan-Large | A52/389B | 2024-11 | 中英 | 一般 | ?HF | Tencent-Hunyuan-Large | Tencent | MoE | Paper |
Aya-Expanse | 8/32B | 2024-10 | 多語 | 一般 | ?HF | / | Cohere For AI | CD | |
Granite 3.0 | 1/2/3/8B | 2024-10 | 多語 | 一般 | ?HF | granite-3.0-language-models | ibm-granite | CD | Paper |
Granite 3.0-MoE | 1B/3B/A400M | 2024-10 | 多語 | 一般 | ?HF | granite-3.0-language-models | ibm-granite | MoE | Paper |
TeleChat2 | 115B | 2024-09 | 中英 | 一般 | ? ModelScope | TeleChat2 | Tele-AI | CD | |
Qwen-2.5 | 0.5/1.5/3/7/14/32/72B | 2024-09 | 中英 | 一般 | ?HF | Qwen2.5 | QwenLM | CD | Blog |
XVERSE-MoE | 255B/A36B | 2024-09 | 中英 | 一般 | ?HF | XVERSE-MoE-A36B | xverse-ai | MoE | |
DeepSeek-V2.5 | 236B/A21B | 2024-09 | 中英 | 一般 | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Paper |
MiniCPM3 | 4B | 2024-09 | 中英 | 一般 | ?HF | MiniCPM | OpenBMB | CD | MiniCPM Paper |
C4AI Command R+ 08-2024 | 104B | 2024-08 | 多語 | 一般 | ?HF | / | CohereForAI | CD | |
JIUTIAN-Chat | 39/A13B | 2024-07 | 中英 | 一般 | ?MS | / | 中國移動JiuTian-AI | MOE | |
meta-llama-3.1 | 8/70/405B | 2024-07 | 多語 | 一般 | [?HF] | llama3 | meta-llama | CD | |
internlm2.5-chat | 7B | 2024-07 | 中英 | 一般 | [?HF] | InternLM | InternLM | CD | Technical Report |
Mistral-large-insruct-2407 | 123B | 2024-07 | 多語 | 一般 | ?HF | / | Mistral AI | blog post | |
DeepSeek-V2-Chat-0628 | 236B | 2024-07 | 中英 | 一般 | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Paper |
C4ai-command-r-plus | 104B | 2024-07 | 多語 | 一般 | ?HF | / | CohereForAI | CD | |
Gemma-2-chat | 9/27B | 2024-06 | 多語 | 一般 | ?HF | / | CD | ||
MAP-NEO-Chat | 2/7B | 2024-06 | 中英 | 一般 | ?HF | MAP-NEO | multimodal-art-projection | CD | Paper |
GEB-Chat | 1.3B | 2024-06 | 中英 | 一般 | ?HF | / | GEB-AGI | CD | Paper |
Nemotron-4-Chat | 340B | 2024-06 | 多語 | 一般 | ?HF | / | NVIDIA | CD | technical report. |
Index-Chat | 1.9B | 2024-06 | 中英 | 一般 | ?HF | Index-1.9B | bilibili | CD | Report |
Qwen2-MoE | 57B/A14B | 2024-06 | 多語 | 一般 | ?HF | Qwen2 | QwenLM | MoE | Blog |
Qwen2-Chat | 0.5/2/5/7/72B | 2024-06 | 多語 | 一般 | ?HF | Qwen2 | QwenLM | CD | Blog |
GLM-4-Chat | 9B | 2024-06 | 多語 | 一般 | ?HF | GLM-4 | THUDM | / | |
Skywork-MoE | 16/A22B/146B | 2024-06 | 中英 | 一般 | ?HF | Skywork-MoE | SkyworkAI | MoE | Tech Report |
Yuan2.0 | 40/A3.7B | 2024-05 | 中英 | 一般 | ?HF | Yuan2.0-M32 | IEIT-Yuan | MOE | Paper |
星辰-Chat | 52B | 2024-05 | 中英 | 一般 | ?HF | TeleChat-52B | Tele-AI | CD | |
LingLong | 317M | 2024-05 | 中英 | 一般 | ?HF | linglong | nkcs-iclab | CD | |
Sailor | 14B | 2024-05 | 7語 | 一般 | ?HF | sailor-llm | sail-sg | CD | Paper |
Nanbeige2 | 8/16B | 2024-05 | 中英 | 一般 | ?HF | Nanbeige | Nanbeige | CD | |
Yi-1.5-Chat | 6/9/34B | 2024-05 | 中英 | 一般 | ?HF | Yi-1.5 | 01-ai | CD | Paper |
DeepSeek-V2-Chat | A21B/236B | 2024-05 | 中英 | 一般 | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Paper |
XVERSE-MoE | A4.2B/25.8B | 2024-05 | 中英 | 一般 | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MOE | |
Llama3-zh | 8/70B | 2024-04 | 中英 | 一般 | ?HF | / | / | CD | llama3中文列表 |
Llama3-Chinese-Chat | 8B | 2024-04 | 中英 | 一般 | ?HF | / | Shenzhi Wang | CD | |
Llama-3-Chat | 8/70B | 2024-04 | 多語 | 一般 | ?HF | llama3 | Meta Llama | CD | |
Zhinao-Chat | 7B | 2024-04 | 中英 | 一般 | ?HF ? | / | 奇虎科技 | CD | |
MiniCPM-MoE | 8x2B | 2024-04 | 中英 | 一般 | ?HF | MiniCPM | OpenBMB | MoE | |
Nanbeige2-Chat | 8B | 2024-04 | 中英 | 一般 | ?HF | Nanbeige | Nanbeige LLM Lab | CD | |
Sailor | 7B | 2024-04 | 多語 | 一般 | ?HF | sailor-llm | Sea AI Lab | CD | Paper |
Mengzi3-Chat | 13B | 2024-04 | 中英 | 一般 | ?HF | Mengzi3 | Langboat | CD | |
Qwen-MoE | 2.7B | 2024-03 | 中英 | 一般 | ?HF | Qwen1.5 | Qwen | MoE | Blog |
Command-R | 35B | 2024-03 | 多語 | 一般 | ?HF | / | CohereForAI | CD | |
Breeze-Instruct | 7B | 2024-02 | 中英 | 一般 | ?HF | / | MediaTek Research | ||
aya-101 | 13B | 2024-02 | 多語 | 一般 | ?HF | / | Cohere For AI | CD | Paper |
ChemLLM | 7B | 2024-02 | 多語 | 一般 | ?HF | / | AI4Chem | CD | Paper |
TowerInstruct | 7/13B | 2024-02 | 多語 | 一般 | [?HF] | / | Unbabel | CD | |
Qwen1.5-Chat | 0.5/1.8/4/ 7/14/32/72/110B | 2024-02 | 中英 | 一般 | [?HF] | Qwen1.5 | Qwen | / | Blog |
MiniCPM | 2B | 2024-02 | 中英 | 一般 | [?HF] ModelScope | MiniCPM | OpenBMB | / | Report |
LongAlign-Chat | 6/7/13B | 2024-02 | 中英 | 一般 | [?HF] | LongAlign | THUDM | / | Paper |
Chinese-Mixtral-Chat | 8x7B | 2024-02 | 中英 | 一般 | [Baidu] [?HF] | Chinese-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Chat | 13B | 2024-01 | 中英 | 一般 | mindspore | / | 科大訊飛 | CD | |
rwkv-5-world | 0.1/1/ 3/7B | 2023-01 | 多語 | 一般 | [?HF] | RWKV-LM | BlinkDL | URL | |
Orion-Chat | 14B | 2024-01 | 多語 | 一般 | [?HF] | Orion | OrionStarAI | CD | Paper |
internlm2-chat | 7/20B | 2024-01 | 中英 | 一般 | [?HF] | InternLM | InternLM | CD | Report |
Chinese-Mixtral | 8x7B | 2023-01 | 中英 | 一般 | [?HF] | / | HIT-SCIR | CD-MOE | |
Telechat | 7/12B | 2024-01 | 中英 | 一般 | [?HF] | Telechatx | Tele-AI | CD | Report |
kagentlms | 7/13B | 2024-01 | 中英 | 一般 | [?HF] | KwaiAgents | KwaiKEG | ||
YaYi2-Chat | 30B | 2023-12 | 多語 | 一般 | [?HF] | YAYI2 | wenge-research | CD | Paper |
SUS-Chat | 34/72B | 2023-12 | 中英 | 一般 | [?HF] | SUS-Chat | SUSTech-IDEA | CD | |
Aquila2-Chat | 7/34/70B | 2023-12 | 中英 | 一般 | [?HF] | Aquila2 | FlagAI | CD | |
Alaya-Chat | 7B | 2023-12 | 中英 | 一般 | [?HF] | Alaya | DataCanvas | CD | |
Qwen-Chat | 1.8/7/ 14/72B | 2023-12 | 中英 | 一般 | [?HF] | Qwen | 阿里雲 | CD | Paper Report Report2 |
DeepSeek-Chat | 7/67B | 2023-11 | 中英 | 一般 | [?HF] | DeepSeek-LLM | deepseek-ai | CD | |
Yi-Chat | 6/34B | 2023-11 | 中英 | 一般 | [?HF] | Yi | 01.AI | CD | |
Alaya-Chat | 7B | 2023-11 | 中英 | 一般 | [?HF] | Alaya | DataCanvasIO | CD | |
OrionStar-Yi-Chat | 34B | 2023-11 | 中英 | 一般 | [?HF] | OrionStar-Yi-34B-Chat | OrionStarAI | CD | |
Nanbeige-Chat | 16B | 2023-11 | 中英 | 一般 | [?HF] | Nanbeige | Nanbeige LLM Lab | CD | |
OpenChat 3.5 | 7B | 2023-11 | 中英 | 一般 | [?HF] | openchat | OpenChat | CD | Paper |
XVERSE-Chat | 7/13B | 2023-11 | 多語 | 一般 | [?HF] | XVERSE | 元象科技 | CD | |
AndesGPT | 7B | 2023-11 | 中文 | 一般 | [?HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Chat | 13B | 2023-11 | 多語 | 一般 | [?HF] | SeaLLMs | SeaLLMs | CD | |
BlueLM | 7B | 2023-11 | 中英 | 一般 | [?HF] | BlueLM | vivo AI Lab | CD | |
Skywork-chat | 13B | 2023-10 | 中文 | 一般 | [?HF] | Skywork | SkyworkAI | CD | Paper |
Zephyr | 7B | 2023-10 | 多語 | 一般 | [?HF] | alignment-handbook | Hugging Face H4 | CD | Paper |
Mistral | 7B | 2023-10 | 多語 | 一般 | [?HF] | mistral-src | Mistral AI | CD | Paper |
chatglm3 | 6B | 2023-10 | 中英 | 一般 | [?HF] | ChatGLM3 | THUDM | ND | |
Zhiyin-chat | 7B | 2023-10 | 中英 | 一般 | [?HF] | Zhiyin | 中國科學院聲學所 | CD | |
Ziya2-Chat | 13B | 2023-10 | 中英 | 一般 | [?HF] | Fengshenbang-LM | IDEA研究院 | CD | |
Vulture | 40/180B | 2023-10 | 多語 | 一般 | [?HF] | / | VILM-AI | TODO | |
Vulture | 3/7/ 40/180B | 2023-09 | 多語 | 一般 | [?HF] | / | VILM | CD | |