Im Bereich der Verarbeitung natürlicher Sprache sind vorab trainierte Sprachmodelle zu einer sehr wichtigen Basistechnologie geworden. Dieses Lager sammelt hauptsächlich einige hochwertige chinesische vorab trainierte Modelle, chinesische multimodale Modelle und chinesische große Sprachmodelle sind derzeit im Internet und anderen Inhalten öffentlich (danke an den Mann, der die Ressourcen geteilt hat) und werden weiterhin aktualisiert ...
Um das HuggingFace-Lagermodell in China herunterzuladen, wird empfohlen, die HuggingFace-Spiegeladresse zu verwenden: https://hf-mirror.com/
Änderungsprotokoll
Allgemeines, großes Grundmodell
Vertikales Fundament, großes Modell
Universelles Dialogmodell
Vertikales Dialogmodell
Multimodaler Dialog großes Modell
Großer Modellbewertungs-Benchmark
Online-Erlebnismodell
Open-Source-Modellbibliotheksplattform
Open-Source-Datensatzbibliothek
Open-Source-Datensatz für chinesische Anweisungen
Einbetten
Andere-genial
备注
ND: Nicht-kausaler Decoder oder Präfix LM
CD: Kausaldecoder
ED: Encoder-Decoder
Große Basismodelle: In der Tabelle sind nur Modelle
大于7B
-Parametern aufgeführt.
Modell | Größe | Zeit | Sprache | Feld | herunterladen | Projektadresse | Institution/Einzelperson | Architektur | Literatur | Bemerkung |
---|---|---|---|---|---|---|---|---|---|---|
XVERSE-MoE | 255B/A36B | 2024-09 | Chinesisch und Englisch | Universal | ?HF | XVERSE-MoE-A36B | xverse-ai | MoE | ||
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | Chinesisch und Englisch | Universal | ?HF | Qwen2.5 | QwenLM | CD | Blog | |
Tele-FLM | 52B/102B/1TB | 2024-07 | Mehrsprachig | Universal | [?HF] | / | CofeAI | CD | Technischer Tele-FLM-Bericht | |
Meta-Lama-3.1 | 8/70/405B | 2024-07 | Mehrsprachig | Universal | [?HF] | Lama3 | Meta-Lama | CD | ||
internlm2.5-Basis | 7B | 2024-07 | Chinesisch und Englisch | Universal | [?HF] | InternLM | InternLM | CD | Technischer Bericht | |
MAP-NEO-Basis | 2/7B | 2024-06 | Chinesisch und Englisch | Universal | ?HF | MAP-NEO | multimodale Kunstprojektion | CD | Papier | |
Nemotron-4-Basis | 340B | 2024-06 | Mehrsprachig | Universal | ?HF | / | NVIDIA | CD | Technischer Bericht. | |
Indexbasis | 1,9B | 2024-06 | Chinesisch und Englisch | Universal | ?HF | Index-1,9B | bilibili | CD | Bericht | |
Qwen2-Basis | 0,5/2/5/7/72B | 2024-06 | Mehrsprachig | Universal | ?HF | Qwen2 | QwenLM | CD | Blog | |
GLM-4-Basis | 9B | 2024-06 | Mehrsprachig | Universal | ?HF | GLM-4 | THUDM | / | ||
Yi-1,5-Basis | 09.06.34B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | Yi-1,5 | 01-ai | CD | Papier | |
DeepSeek-V2-Basis | A21B/236B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papier | |
Lama-3-Basis | 8/70B | 2024-04 | Mehrsprachig | Universal | ?HF | Lama3 | Meta-Lama | CD | ||
Zhinao-Basis | 7B | 2024-04 | Chinesisch und Englisch | Universal | ?HF? | / | Qihoo-Technologie | CD | ||
XVERSE-MoE | A4.2B/25.8B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MoE | ||
SoftTiger-Basis | 13/70B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | TigerBot | TigerResearch | CD | ||
HammerLLM | 1.4b | 2024-04 | Chinesisch und Englisch | Universal | ?HF | HammerLLM | DataHammer | |||
Mengzi3-Basis | 13B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | Mengzi3 | Langboot | CD | ||
Breeze-Basis | 7B | 2024-02 | Chinesisch und Englisch | Universal | ?HF | / | MediaTek-Forschung | |||
TowerBase | 7/13B | 2024-02 | Mehrsprachig | Universal | [?HF] | / | Unbabel | CD | ||
Qwen1.5-Basis | 0,5/1,8/4 14.07.32/72/110B | 2024-02 | Chinesisch und Englisch | Universal | [?HF] | Qwen1.5 | Qwen | / | Blog | |
LongAlign-Base | 07.06.13B | 2024-02 | Chinesisch und Englisch | Universal | [?HF] | LongAlign | THUDM | / | Papier | |
Chinesische-Mixtral-Basis | 8x7B | 2024-02 | Chinesisch und Englisch | Universal | [Baidu] [?HF] | Chinesisch-Mixtral | Yiming Cui | MOE | ||
iFlytekSpark-Basis | 13B | 2024-01 | Chinesisch und Englisch | Universal | Geistesspore | / | iFlytek | CD | ||
Orion-Basis | 14B | 2024-01 | Mehrsprachig | Universal | [?HF] | Orion | OrionStarAI | CD | Papier | LAPPEN Plugin |
YaYi2-Basis | 30B | 2023-12 | Mehrsprachig | Universal | [?HF] | YAYI2 | Wenge-Forschung | CD | Papier | |
Aquila2-Basis | 34.07.70B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | Aquila2 | FlagAI | CD | ||
Alaya-Basis | 7B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | Alaya | DataCanvas | CD | ||
Qwen-Basis | 1,8/7 14/72B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | Qwen | Alibaba Cloud | CD | Papierbericht Bericht2 | |
DeepSeek-Basis | 7/67B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | DeepSeek-LLM | deepseek-ai | CD | ||
Yuan-2,0 | 2/51 102B | 2023-11 | Chinesisch und Englisch | Universal | Baidu [?HF] | Yuan-2,0 | IEIT-Yuan | CD | ||
Alaya-Basis | 7B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | Alaya | DataCanvasIO | CD | ||
Yi-Basis | 09.06.34B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | Yi | 01.AI | CD | ||
XVERSE-Basis | 7/13 65B | 2023-11 | Mehrsprachig | Universal | [?HF] | XVERSE | Yuanxiang-Technologie | CD | ||
Nanbeige-Basis | 16B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | Nanbeige | Nanbeige LLM Lab | CD | ||
LingoWhale | 8B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | LingoWhale-8B | DeepLang KI | CD | ||
Skywork-Basis | 13B | 2023-10 | chinesisch | Universal | [?HF] | Himmelswerk | SkyworkAI | CD | Papier | |
BlueLM-Basis | 7B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | BlueLM | vivo AI Lab | CD | ||
Chatglm3-Basis | 6B | 2023-10 | Chinesisch und Englisch | Universal | [?HF] | ChatGLM3 | THUDM | ND | ||
Ziya2-Basis | 13B | 2023-10 | Chinesisch und Englisch | Universal | [?HF] | Fengshenbang-LM | IDEA-Institut | CD | ||
OpenBA-LM | 15B | 2023-09 | Chinesisch und Englisch | Universal | [?HF] | OpenBA | OpenNLG-Gruppe | ED | Papier | |
TigerBot-Base-70B | 80B | 2023-09 | Mehrsprachig | Universal | [?HF] | TigerBot | Hubo-Technologie | CD | Papier | |
FLM | 101B | 2023-09 | Chinesisch und Englisch | Universal | [?HF] | / | CofeAI | CD | ||
Falke | 7/40 180B | 2023-09 | Mehrsprachig | Universal | [?HF] | / | Institut für Technologieinnovation | CD | ||
Baichuan2 | 7/13B | 2023-09 | chinesisch | Universal | [?HF] | Baichuan2 | Baichuan-Geheimdienst | CD | ||
Chinesisch-LLaMA-2-16K | 7/13B | 2023-08 | Chinesisch und Englisch | Universal | [?HF] | Chinesisch-LLaMA-Alpaka-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | Chinesisch und Englisch | Universal | [?HF] | YuLan-Chat | Renmin-Universität von China | CD | ||
Aquila-Base-33B | 33B | 2023-08 | Chinesisch und Englisch | Universal | TODO | Aquila | FlagAI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | Mehrsprachig | Universal | [?HF] | TigerBot | Hubo-Technologie | CD | ||
Linly-Chinese-LLaMA-2 | 7/13B | 2023-07 | Chinesisch und Englisch | Universal | [?HF] | Linly | Institut für Computer Vision der Universität Shenzhen | CD | ||
Chinesisch-LLaMA-2 | 7B | 2023-07 | Chinesisch und Englisch | Universal | [?HF] | Chinesisch-LLaMA-Alpaka-2 | Yiming Cui | CD | ||
Jiang-Basis | 13B | 2023-07 | chinesisch | Universal | [?HF] | / | Ich kenne die Weisheit nicht | CD | ||
wx | 7/13B | 2023-07 | chinesisch | Universal | [?HF] | / | Nationale Nummer des Blauwals | CD | ||
Lama2 | 7/13 70B | 2023-07 | Mehrsprachig | Universal | [?HF] | Lama | Meta | CD | Papier | |
PolyLM | 13B | 2023-07 | Mehrsprachig | Universal | [?HF] | PolyLM | Bodhidharma-Akademie | CD | Papier | |
Baichuan-13B | 13B | 2023-07 | chinesisch | Universal | [?HF] | Baichuan-13B | Baichuan-Geheimdienst | CD | ||
TigerBot | 7B | 2023-07 | Mehrsprachig | Universal | [?HF] | TigerBot | Hubo-Technologie | CD | ||
InternLM-Basis | 7/20B | 2023-07 | chinesisch | Universal | [?HF] | InternLM | Shanghai-Labor für künstliche Intelligenz | CD | Bericht | |
MPT | 7/30B | 2023-06 | Mehrsprachig | Universal | [?HF] | llm-Gießerei | MosaikML | CD | ||
Baichuan | 7B | 2023-06 | Chinesisch und Englisch | Universal | [?HF] | Baichuan-7B | Baichuan-Geheimdienst | CD | ||
Chinesischer Falke | 7B | 2023-06 | Chinesisch und Englisch | Universal | [?HF] | Linly | Institut für Computer Vision der Universität Shenzhen | CD | Blog | |
AtomGPT | 13B | 2023-06 | Chinesisch und Englisch | Universal | [?HF] | / | Atomecho | CD | ||
Aquila | 7B | 2023-06 | Chinesisch und Englisch | Universal | [?HF] | Aquila | FlagAI | CD | ||
Chinesisch-LLaMA | 33B | 2023-06 | Chinesisch und Englisch | Universal | [?HF] | Chinesisches LLaMA-Alpaka | Yiming Cui | CD | ||
TigerBot | 7B | 2023-06 | Mehrsprachig | Universal | [?HF] | TigerBot | Hubo-Technologie | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | Chinesisch und Englisch | Universal | [?HF] | pandallm | Löwenzahnllm | CD | ||
Panda | 7/13B | 2023-05 | Chinesisch und Englisch | Universal | [?HF] | pandallm | Löwenzahnllm | CD | ||
OpenLLaMA | 13B | 2023-05 | Chinesisch und Englisch | Universal | [?HF] | Linly | Institut für Computer Vision der Universität Shenzhen | CD | ||
BiLLa-LLM | 7B | 2023-05 | Chinesisch und Englisch | Universal | [?HF] | ikB | Zhongli Li | CD | ||
Ziya-LLaMA-Belohnung | 7B | 2023-05 | Chinesisch und Englisch | Universal | [?HF] | Fengshenbang-LM | IDEA-Institut | CD | ||
YuYan | 11B | 2023-04 | chinesisch | Universal | [?HF] | / | NetEase Fuxi | CD | Papier | |
Chinesisch-LLaMA | 13.07.33B | 2023-04 | chinesisch | Universal | [?HF] | Linly | Institut für Computer Vision der Universität Shenzhen | CD | Blog | |
OpenChineseLLaMA | 7B | 2023-04 | Chinesisch und Englisch | Universal | [?HF] | OpenChineseLLaMA | OpenLMLab | CD | ||
MOSS-003 | 16B | 2023-04 | Chinesisch und Englisch | Universal | [?HF] | MOOS | Fudan-Universität | CD | ||
BBT-2-Text | 13B | 2023-04 | chinesisch | Universal | Anwenden | BBT-FinCUGE-Anwendungen | Supersymmetrie | CD | Papier | |
BBT-2-Text | 12B | 2023-04 | chinesisch | Universal | Anwenden | BBT-FinCUGE-Anwendungen | Supersymmetrie | CD | Papier | |
Chinesisch-LLaMA | 13B | 2023-04 | Chinesisch und Englisch | Universal | [?HF] | Chinesisches LLaMA-Alpaka | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | Mehrsprachig | Universal | [?HF] | ul2 | ED | Papier | ||
CPM-Biene | 10B | 2023-01 | Chinesisch und Englisch | Universal | [?HF] | CPM-Biene | OpenBMB | CD | ||
BLÜHEN | 176B | 2022-11 | Mehrsprachig | Universal | [?HF] | Megatron-DeepSpeed | BigScience | CD | Papier | |
BLOOMZ | 176B | 2022-11 | Mehrsprachig | Universal | [?HF] | Megatron-DeepSpeed | BigScience | CD | Papier | |
flan-t5-xxl | 11B | 2022-11 | Mehrsprachig | Universal | [?HF] | t5x | ED | Papier | ||
CPM-Ant+ | 10B | 2022-10 | Chinesisch und Englisch | Universal | BMB | CPM-Live | OpenBMB | CD | Blog | |
GLM | 130B | 2022-10 | Chinesisch und Englisch | Universal | Anwenden | GLM-130B | Tsinghua-Universität | ND | Papier | |
CPM-Ant | 10B | 2022-09 | chinesisch | Universal | [?HF] | CPM-Live | OpenBMB | CD | Blog | |
GLM | 10B | 2022-09 | chinesisch | Universal | [?HF] | GLM | Tsinghua-Universität | ND | Papier | |
Quelle 1.0 | 245B | 2021-09 | chinesisch | Universal | API | Yian-1,0 | Welle | CD | Papier | |
CPM-2 | 11.10. 200B | 2021-06 | chinesisch | Universal | Anwenden | CPM | Zhiyuan-Forschungsinstitut | ED | Papier | |
PanGu-Alpha | 13/200B | 2021-05 | chinesisch | Universal | [?HF] | PanGu-Alpha | Pengcheng-Labor | CD | Papier | |
STECKER | 27B | 2021-04 | chinesisch | Universal | Anwenden | AliceMind | Alibaba | ED | ||
GPT-3 | 13/30B | 2021-04 | chinesisch | Universal | TODO | GPT-3 | Bodhidharma-Akademie | CD |
[Zurück nach oben]
Open-Source-Basismodelle in verschiedenen vertikalen Bereichen
Modell | Größe | Zeit | Sprache | Feld | herunterladen | Projektadresse | Institution/Einzelperson | Architektur | Literatur | Bemerkung |
---|---|---|---|---|---|---|---|---|---|---|
Qwen-2.5 | 1,5/7B | 2024-09 | Chinesisch und Englisch | Code | ?HF | Qwen2.5 | QwenLM | CD | Blog | |
Qwen-2.5 | 1,5/7/72B | 2024-09 | Chinesisch und Englisch | Mathe | ?HF | Qwen2.5 | QwenLM | CD | Blog | |
Tongyi-Finance-Base | 14B | 2023-11 | chinesisch | Finanzen | ModelScope | Tongyi Finance-14B | Tongyi-Finanzmodell | CD | ||
ChiMed-GPT | 13B | 2023-10 | chinesisch | medizinisch | [?HF] | ChiMed-GPT | Universität für Wissenschaft und Technologie Chinas | CD | Papier | |
CodeShell-Basis | 7B | 2023-10 | Chinesisch und Englisch | Code | [?HF] | Codeshell | WisdomShell | CD | ||
WiNGPT-Basis | 7B | 2023-09 | chinesisch | Medizin | [?HF] | WiNGPT2 | Erfolgreiche KI-Forschung im Gesundheitsbereich | CD | ||
Xuanyuan | 70B | 2023-09 | chinesisch | Finanzen | [?HF] | Xuanyuan | Du Xiaoman | CD | Bericht | |
CodeLLAma | 13.07./ 34B | 2023-08 | Mehrsprachig | Code | [?HF] | Codellama | Metaforschung | CD | Papier | |
educhat-base-002 | 7/13B | 2023-06 | Chinesisch und Englisch | erziehen | [?HF] | EduChat | Ostchinesische Normaluniversität | CD | ||
AquilaCode-NV | 7B | 2023-06 | Chinesisch und Englisch | Code | [?HF] | Aquila | FlagAI | CD | ||
AquilaCode-TS | 7B | 2023-06 | Chinesisch und Englisch | Code | [?HF] | Aquila | FlagAI | CD | ||
GesetzGPT | 7B | 2023-05 | Chinesisch und Englisch | Gesetz | [?HF] | RechtGPT | Pengxiao-Lied | CD | ||
CodeGeeX | 13B | 2022-06 | Mehrsprachig | Code | Anwenden | CodeGeeX | Tsinghua-Universität | CD | Blog |
[Zurück nach oben]
Großes Sprachmodell mit Funktionen wie Fragenbeantwortung und Dialog.
Modell | Größe | Zeit | Sprache | Feld | herunterladen | Projektadresse | Institution/Einzelperson | Architektur | Literatur |
---|---|---|---|---|---|---|---|---|---|
Athene-V2-Chat | 72B | 2024-11 | Chinesisch und Englisch | Universal | ?HF | / | Nexusflow | CD | Blog |
Athene-V2-Agent | 72B | 2024-11 | Chinesisch und Englisch | Werkzeugaufruf | ?HF | / | Nexusflow | CD | Blog |
Hunyuan-Groß | A52/389B | 2024-11 | Chinesisch und Englisch | Universal | ?HF | Tencent-Hunyuan-Groß | Tencent | MoE | Papier |
Aya-Ausdehnung | 8/32B | 2024-10 | Mehrsprachig | Universal | ?HF | / | Kohärenz für KI | CD | |
Granit 3.0 | 1/2/3/8B | 2024-10 | Mehrsprachig | Universal | ?HF | Granit-3.0-Sprachmodelle | IBM-Granit | CD | Papier |
Granit 3,0-MoE | 1B/3B/A400M | 2024-10 | Mehrsprachig | Universal | ?HF | Granit-3.0-Sprachmodelle | IBM-Granit | MoE | Papier |
TeleChat2 | 115B | 2024-09 | Chinesisch und Englisch | Universal | ?ModelScope | TeleChat2 | Tele-KI | CD | |
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | Chinesisch und Englisch | Universal | ?HF | Qwen2.5 | QwenLM | CD | Blog |
XVERSE-MoE | 255B/A36B | 2024-09 | Chinesisch und Englisch | Universal | ?HF | XVERSE-MoE-A36B | xverse-ai | MoE | |
DeepSeek-V2.5 | 236B/A21B | 2024-09 | Chinesisch und Englisch | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papier |
MiniCPM3 | 4B | 2024-09 | Chinesisch und Englisch | Universal | ?HF | MiniCPM | OpenBMB | CD | MiniCPM-Papier |
C4AI Command R+ 08-2024 | 104B | 2024-08 | Mehrsprachig | Universal | ?HF | / | CohereForAI | CD | |
JIUTIAN-Chat | 39/A13B | 2024-07 | Chinesisch und Englisch | Universal | ?MS | / | China Mobile JiuTian-AI | MOE | |
Meta-Lama-3.1 | 8/70/405B | 2024-07 | Mehrsprachig | Universal | [?HF] | Lama3 | Meta-Lama | CD | |
internlm2.5-chat | 7B | 2024-07 | Chinesisch und Englisch | Universal | [?HF] | InternLM | InternLM | CD | Technischer Bericht |
Mistral-große-Anweisung-2407 | 123B | 2024-07 | Mehrsprachig | Universal | ?HF | / | Mistral-KI | Blogbeitrag | |
DeepSeek-V2-Chat-0628 | 236B | 2024-07 | Chinesisch und Englisch | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papier |
C4ai-command-r-plus | 104B | 2024-07 | Mehrsprachig | Universal | ?HF | / | CohereForAI | CD | |
Gemma-2-Chat | 9/27B | 2024-06 | Mehrsprachig | Universal | ?HF | / | CD | ||
MAP-NEO-Chat | 2/7B | 2024-06 | Chinesisch und Englisch | Universal | ?HF | MAP-NEO | multimodale Kunstprojektion | CD | Papier |
GEB-Chat | 1,3B | 2024-06 | Chinesisch und Englisch | Universal | ?HF | / | GEB-AGI | CD | Papier |
Nemotron-4-Chat | 340B | 2024-06 | Mehrsprachig | Universal | ?HF | / | NVIDIA | CD | Technischer Bericht. |
Index-Chat | 1,9B | 2024-06 | Chinesisch und Englisch | Universal | ?HF | Index-1,9B | bilibili | CD | Bericht |
Qwen2-MoE | 57B/A14B | 2024-06 | Mehrsprachig | Universal | ?HF | Qwen2 | QwenLM | MoE | Blog |
Qwen2-Chat | 0,5/2/5/7/72B | 2024-06 | Mehrsprachig | Universal | ?HF | Qwen2 | QwenLM | CD | Blog |
GLM-4-Chat | 9B | 2024-06 | Mehrsprachig | Universal | ?HF | GLM-4 | THUDM | / | |
Skywork-MoE | 16/A22B/146B | 2024-06 | Chinesisch und Englisch | Universal | ?HF | Skywork-MoE | SkyworkAI | MoE | Tech-Bericht |
Yuan2,0 | 40/A3.7B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | Yuan2,0-M32 | IEIT-Yuan | MOE | Papier |
Star-Chat | 52B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | TeleChat-52B | Tele-KI | CD | |
LingLong | 317M | 2024-05 | Chinesisch und Englisch | Universal | ?HF | linglong | nkcs-iclab | CD | |
Seemann | 14B | 2024-05 | 7 Sprachen | Universal | ?HF | Seemann-llm | Segel-Sg | CD | Papier |
Nanbeige2 | 8/16B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | Nanbeige | Nanbeige | CD | |
Yi-1.5-Chat | 09.06.34B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | Yi-1,5 | 01-ai | CD | Papier |
DeepSeek-V2-Chat | A21B/236B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | DeepSeek-V2 | deepseek-ai | MOE | Papier |
XVERSE-MoE | A4.2B/25.8B | 2024-05 | Chinesisch und Englisch | Universal | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MOE | |
Lama3-zh | 8/70B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | / | / | CD | llama3 chinesische Liste |
Llama3-Chinese-Chat | 8B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | / | Shenzhi Wang | CD | |
Lama-3-Chat | 8/70B | 2024-04 | Mehrsprachig | Universal | ?HF | Lama3 | Meta-Lama | CD | |
Zhinao-Chat | 7B | 2024-04 | Chinesisch und Englisch | Universal | ?HF? | / | Qihoo-Technologie | CD | |
MiniCPM-MoE | 8x2B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | MiniCPM | OpenBMB | MoE | |
Nanbeige2-Chat | 8B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | Nanbeige | Nanbeige LLM Lab | CD | |
Seemann | 7B | 2024-04 | Mehrsprachig | Universal | ?HF | Seemann-llm | Sea AI Lab | CD | Papier |
Mengzi3-Chat | 13B | 2024-04 | Chinesisch und Englisch | Universal | ?HF | Mengzi3 | Langboot | CD | |
Qwen-MoE | 2,7B | 2024-03 | Chinesisch und Englisch | Universal | ?HF | Qwen1.5 | Qwen | MoE | Blog |
Befehl-R | 35B | 2024-03 | Mehrsprachig | Universal | ?HF | / | CohereForAI | CD | |
Breeze-Unterweisung | 7B | 2024-02 | Chinesisch und Englisch | Universal | ?HF | / | MediaTek-Forschung | ||
aya-101 | 13B | 2024-02 | Mehrsprachig | Universal | ?HF | / | Kohärenz für KI | CD | Papier |
ChemLLM | 7B | 2024-02 | Mehrsprachig | Universal | ?HF | / | AI4Chem | CD | Papier |
TowerInstruct | 7/13B | 2024-02 | Mehrsprachig | Universal | [?HF] | / | Unbabel | CD | |
Qwen1.5-Chat | 0,5/1,8/4/ 14.07.32/72/110B | 2024-02 | Chinesisch und Englisch | Universal | [?HF] | Qwen1.5 | Qwen | / | Blog |
MiniCPM | 2B | 2024-02 | Chinesisch und Englisch | Universal | [?HF] ModelScope | MiniCPM | OpenBMB | / | Bericht |
LongAlign-Chat | 07.06.13B | 2024-02 | Chinesisch und Englisch | Universal | [?HF] | LongAlign | THUDM | / | Papier |
Chinesisch-Mixtral-Chat | 8x7B | 2024-02 | Chinesisch und Englisch | Universal | [Baidu] [?HF] | Chinesisch-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Chat | 13B | 2024-01 | Chinesisch und Englisch | Universal | Geistesspore | / | iFlytek | CD | |
rwkv-5-welt | 0,1/1/ 3/7B | 2023-01 | Mehrsprachig | Universal | [?HF] | RWKV-LM | BlinkDL | URL | |
Orion-Chat | 14B | 2024-01 | Mehrsprachig | Universal | [?HF] | Orion | OrionStarAI | CD | Papier |
internlm2-chat | 7/20B | 2024-01 | Chinesisch und Englisch | Universal | [?HF] | InternLM | InternLM | CD | Bericht |
Chinesisch-Mixtral | 8x7B | 2023-01 | Chinesisch und Englisch | Universal | [?HF] | / | HIT-SCIR | CD-MOE | |
Telechat | 7/12B | 2024-01 | Chinesisch und Englisch | Universal | [?HF] | Telechatx | Tele-KI | CD | Bericht |
kagentlms | 7/13B | 2024-01 | Chinesisch und Englisch | Universal | [?HF] | KwaiAgents | KwaiKEG | ||
YaYi2-Chat | 30B | 2023-12 | Mehrsprachig | Universal | [?HF] | YAYI2 | Wenge-Forschung | CD | Papier |
SUS-Chat | 34/72B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | SUS-Chat | SUSTech-IDEE | CD | |
Aquila2-Chat | 34.07.70B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | Aquila2 | FlagAI | CD | |
Alaya-Chat | 7B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | Alaya | DataCanvas | CD | |
Qwen-Chat | 1,8/7/ 14/72B | 2023-12 | Chinesisch und Englisch | Universal | [?HF] | Qwen | Alibaba Cloud | CD | Papierbericht Bericht2 |
DeepSeek-Chat | 7/67B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | DeepSeek-LLM | deepseek-ai | CD | |
Yi-Chat | 6/34B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | Yi | 01.AI | CD | |
Alaya-Chat | 7B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | Alaya | DataCanvasIO | CD | |
OrionStar-Yi-Chat | 34B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | OrionStar-Yi-34B-Chat | OrionStarAI | CD | |
Nanbeige-Chat | 16B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | Nanbeige | Nanbeige LLM Lab | CD | |
OpenChat 3.5 | 7B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | openchat | OpenChat | CD | Papier |
XVERSE-Chat | 7/13B | 2023-11 | Mehrsprachig | Universal | [?HF] | XVERSE | Yuanxiang-Technologie | CD | |
AndesGPT | 7B | 2023-11 | chinesisch | Universal | [?HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Chat | 13B | 2023-11 | Mehrsprachig | Universal | [?HF] | SeaLLMs | SeaLLMs | CD | |
BlueLM | 7B | 2023-11 | Chinesisch und Englisch | Universal | [?HF] | BlueLM | vivo AI Lab | CD | |
Skywork-Chat | 13B | 2023-10 | chinesisch | Universal | [?HF] | Himmelswerk | SkyworkAI | CD | Papier |
Zephyr | 7B | 2023-10 | Mehrsprachig | Universal | [?HF] | Ausrichtungshandbuch | Umarmendes Gesicht H4 | CD | Papier |
Mistral | 7B | 2023-10 | Mehrsprachig | Universal | [?HF] | mistral-src | Mistral-KI | CD | Papier |
chatglm3 | 6B | 2023-10 | Chinesisch und Englisch | Universal | [?HF] | ChatGLM3 | THUDM | ND | |
Zhiyin-Chat | 7B | 2023-10 | Chinesisch und Englisch | Universal | [?HF] | Zhiyin | Institut für Akustik, Chinesische Akademie der Wissenschaften | CD | |
Ziya2-Chat | 13B | 2023-10 | Chinesisch und Englisch | Universal | [?HF] | Fengshenbang-LM | IDEA-Institut | CD | |
Geier | 40/180B | 2023-10 | Mehrsprachig | Universal | [?HF] | / | VILM-AI | TODO | |
Geier | 3/7/ 40/180B | 2023-09 | Mehrsprachig | Universal | [?HF] | / | VILM | CD | |