Di bidang pemrosesan bahasa alami, model bahasa terlatih (Model Bahasa Terlatih) telah menjadi teknologi dasar yang sangat penting. Gudang ini terutama mengumpulkan beberapa model pra-pelatihan Tiongkok berkualitas tinggi, model multi-modal Tiongkok, dan model bahasa besar Tiongkok itu saat ini bersifat publik di Internet dan konten lainnya (terima kasih kepada orang yang berbagi sumber daya), dan akan terus memperbarui...
Untuk mengunduh model gudang HuggingFace di Tiongkok, disarankan untuk menggunakan alamat mirror HuggingFace: https://hf-mirror.com/
Ubah catatan
Model besar dasar umum
Model besar pondasi vertikal
Model dialog universal
Model dialog vertikal
Dialog multimodal model besar
Tolok ukur evaluasi model besar
Model pengalaman online
Platform perpustakaan model sumber terbuka
Pustaka kumpulan data sumber terbuka
Kumpulan data instruksi bahasa Mandarin sumber terbuka
Penyematan
Lainnya-Luar Biasa
备注
ND: Dekoder Non-Kausal atau Awalan LM
CD: Dekoder Kausal
ED: Encoder-Decoder
Model dasar skala besar: Hanya model
大于7B
yang tercantum dalam tabel.
Model | ukuran | waktu | bahasa | bidang | unduh | Alamat proyek | Institusi/Perorangan | Arsitektur | literatur | Komentar |
---|---|---|---|---|---|---|---|---|---|---|
XVERSE-MoE | 255B/A36B | 2024-09 | Cina dan Inggris | Universal | ?HF | XVERSE-MoE-A36B | xverse-ai | MoE | ||
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | Cina dan Inggris | Universal | ?HF | Qwen2.5 | QwenLM | CD | blog | |
Tele-FLM | 52B/102B/1TB | 2024-07 | Multibahasa | Universal | [?HF] | / | KopiAI | CD | Laporan Teknis Tele-FLM | |
meta-lama-3.1 | 8/70/405B | 2024-07 | Multibahasa | Universal | [?HF] | llama3 | meta-lama | CD | ||
maganglm2.5-Pangkalan | 7B | 2024-07 | Cina dan Inggris | Universal | [?HF] | MagangLM | MagangLM | CD | Laporan Teknis | |
Basis PETA-NEO | 2/7B | 2024-06 | Cina dan Inggris | Universal | ?HF | PETA-NEO | proyeksi seni multimodal | CD | Kertas | |
Nemotron-4-Basis | 340B | 2024-06 | Multibahasa | Universal | ?HF | / | NVIDIA | CD | laporan teknis. | |
Basis Indeks | 1.9B | 2024-06 | Cina dan Inggris | Universal | ?HF | Indeks-1.9B | bilibili | CD | Laporan | |
Pangkalan Qwen2 | 0,5/2/5/7/72B | 2024-06 | Multibahasa | Universal | ?HF | Qwen2 | QwenLM | CD | blog | |
GLM-4-Base | 9B | 2024-06 | Multibahasa | Universal | ?HF | GLM-4 | THUDM | / | ||
Yi-1.5-Basis | 6/9/34B | 2024-05 | Cina dan Inggris | Universal | ?HF | Yi-1.5 | 01-ai | CD | Kertas | |
Basis DeepSeek-V2 | A21B/236B | 2024-05 | Cina dan Inggris | Universal | ?HF | DeepSeek-V2 | pencarian mendalam-ai | MOE | Kertas | |
Llama-3-Pangkalan | 8/70B | 2024-04 | Multibahasa | Universal | ?HF | llama3 | Meta Lama | CD | ||
Pangkalan Zhinao | 7B | 2024-04 | Cina dan Inggris | Universal | ?HF? | / | Teknologi Qihoo | CD | ||
XVERSE-MoE | A4.2B/25.8B | 2024-04 | Cina dan Inggris | Universal | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MoE | ||
Pangkalan SoftTiger | 13/70B | 2024-04 | Cina dan Inggris | Universal | ?HF | Bot Harimau | Penelitian Harimau | CD | ||
PaluLLM | 1.4b | 2024-04 | Cina dan Inggris | Universal | ?HF | PaluLLM | DataHammer | |||
Mengzi3-Pangkalan | 13B | 2024-04 | Cina dan Inggris | Universal | ?HF | Mengzi3 | perahu lang | CD | ||
Pangkalan Angin | 7B | 2024-02 | Cina dan Inggris | Universal | ?HF | / | Riset MediaTek | |||
Pangkalan Menara | 7/13B | 2024-02 | Multibahasa | Universal | [?HF] | / | Unbabel | CD | ||
Qwen1.5-Pangkalan | 0,5/1,8/4 14/7/32/72/110B | 2024-02 | Cina dan Inggris | Universal | [?HF] | Qwen1.5 | Qwen | / | blog | |
Basis LongAlign | 6/7/13B | 2024-02 | Cina dan Inggris | Universal | [?HF] | Sejajarkan Panjang | THUDM | / | Kertas | |
Pangkalan Campuran Cina | 8x7B | 2024-02 | Cina dan Inggris | Universal | [Baidu] [?HF] | Cina-Mixtral | Yiming Cui | MOE | ||
iFlytekSpark-Base | 13B | 2024-01 | Cina dan Inggris | Universal | mindpore | / | iFlytek | CD | ||
Pangkalan Orion | 14B | 2024-01 | Multibahasa | Universal | [?HF] | Orion | OrionStarAI | CD | Kertas | LAP Pengaya |
Basis YaYi2 | 30B | 2023-12 | Multibahasa | Universal | [?HF] | YAYI2 | penelitian wenge | CD | Kertas | |
Pangkalan Aquila2 | 34/7/70B | 2023-12 | Cina dan Inggris | Universal | [?HF] | Akuila2 | BenderaAI | CD | ||
Pangkalan Alaya | 7B | 2023-12 | Cina dan Inggris | Universal | [?HF] | Alay | Kanvas Data | CD | ||
Pangkalan Qwen | 1.8/7 14/72B | 2023-12 | Cina dan Inggris | Universal | [?HF] | Qwen | Alibaba Cloud | CD | Laporan Kertas Laporan2 | |
Basis DeepSeek | 7/67B | 2023-11 | Cina dan Inggris | Universal | [?HF] | DeepSeek-LLM | pencarian mendalam-ai | CD | ||
Yuan-2.0 | 2/51 102B | 2023-11 | Cina dan Inggris | Universal | Baidu [?HF] | Yuan-2.0 | IEIT-Yuan | CD | ||
Pangkalan Alaya | 7B | 2023-11 | Cina dan Inggris | Universal | [?HF] | Alay | DataCanvasIO | CD | ||
Pangkalan Yi | 6/9/34B | 2023-11 | Cina dan Inggris | Universal | [?HF] | Yi | 01.AI | CD | ||
Basis XVERSE | 13/7 65B | 2023-11 | Multibahasa | Universal | [?HF] | XVERSE | Teknologi Yuanxiang | CD | ||
Pangkalan Nanbeige | 16B | 2023-11 | Cina dan Inggris | Universal | [?HF] | Nanbeige | Lab LLM Nanbeige | CD | ||
Paus Lingo | 8B | 2023-11 | Cina dan Inggris | Universal | [?HF] | LingoWhale-8B | DeepLang AI | CD | ||
Pangkalan Skywork | 13B | 2023-10 | Cina | Universal | [?HF] | pekerjaan langit | SkyworkAI | CD | Kertas | |
Basis BlueLM | 7B | 2023-11 | Cina dan Inggris | Universal | [?HF] | BiruLM | laboratorium AI vivo | CD | ||
Basis Chatglm3 | 6B | 2023-10 | Cina dan Inggris | Universal | [?HF] | ObrolanGLM3 | THUDM | tidak | ||
Basis Ziya2 | 13B | 2023-10 | Cina dan Inggris | Universal | [?HF] | Fengshenbang-LM | Institut IDE | CD | ||
OpenBA-LM | 15B | 2023-09 | Cina dan Inggris | Universal | [?HF] | BukaBA | Grup OpenNLG | ED | Kertas | |
TigerBot-Base-70B | 80B | 2023-09 | Multibahasa | Universal | [?HF] | Bot Harimau | Teknologi Hubo | CD | Kertas | |
FLM | 101B | 2023-09 | Cina dan Inggris | Universal | [?HF] | / | KopiAI | CD | ||
elang | 7/40 180B | 2023-09 | Multibahasa | Universal | [?HF] | / | Institut Inovasi Teknologi | CD | ||
Baichuan2 | 7/13B | 2023-09 | Cina | Universal | [?HF] | Baichuan2 | Intelijen Baichuan | CD | ||
Cina-LLaMA-2-16K | 7/13B | 2023-08 | Cina dan Inggris | Universal | [?HF] | Cina-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | Cina dan Inggris | Universal | [?HF] | YuLan-Obrolan | Universitas Renmin Cina | CD | ||
Aquila-Base-33B | 33B | 2023-08 | Cina dan Inggris | Universal | TODO | Akuila | BenderaAI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | Multibahasa | Universal | [?HF] | Bot Harimau | Teknologi Hubo | CD | ||
Linly-Cina-LLaMA-2 | 7/13B | 2023-07 | Cina dan Inggris | Universal | [?HF] | Linly | Institut Visi Komputer Universitas Shenzhen | CD | ||
Cina-LLaMA-2 | 7B | 2023-07 | Cina dan Inggris | Universal | [?HF] | Cina-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
Pangkalan Jiang | 13B | 2023-07 | Cina | Universal | [?HF] | / | Tidak mengetahui hikmahnya | CD | ||
wx | 7/13B | 2023-07 | Cina | Universal | [?HF] | / | Nomor nasional paus biru | CD | ||
Lama2 | 13/7 70B | 2023-07 | Multibahasa | Universal | [?HF] | lama | Meta | CD | Kertas | |
PoliLM | 13B | 2023-07 | Multibahasa | Universal | [?HF] | PoliLM | Akademi Bodhidharma | CD | Kertas | |
Baichuan-13B | 13B | 2023-07 | Cina | Universal | [?HF] | Baichuan-13B | Intelijen Baichuan | CD | ||
Bot Harimau | 7B | 2023-07 | Multibahasa | Universal | [?HF] | Bot Harimau | Teknologi Hubo | CD | ||
Basis InternLM | 7/20B | 2023-07 | Cina | Universal | [?HF] | MagangLM | Laboratorium Kecerdasan Buatan Shanghai | CD | laporan | |
MPT | 7/30B | 2023-06 | Multibahasa | Universal | [?HF] | llm-pengecoran | MosaikML | CD | ||
Baichuan | 7B | 2023-06 | Cina dan Inggris | Universal | [?HF] | baichuan-7B | Intelijen Baichuan | CD | ||
Elang Cina | 7B | 2023-06 | Cina dan Inggris | Universal | [?HF] | Linly | Institut Visi Komputer Universitas Shenzhen | CD | blog | |
AtomGPT | 13B | 2023-06 | Cina dan Inggris | Universal | [?HF] | / | gema atom | CD | ||
Akuila | 7B | 2023-06 | Cina dan Inggris | Universal | [?HF] | Akuila | BenderaAI | CD | ||
Cina-LLaMA | 33B | 2023-06 | Cina dan Inggris | Universal | [?HF] | Cina-LLaMA-Alpaca | Yiming Cui | CD | ||
Bot Harimau | 7B | 2023-06 | Multibahasa | Universal | [?HF] | Bot Harimau | Teknologi Hubo | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | Cina dan Inggris | Universal | [?HF] | pandalm | dandelionllm | CD | ||
Panda | 7/13B | 2023-05 | Cina dan Inggris | Universal | [?HF] | pandalm | dandelionllm | CD | ||
BukaLLaMA | 13B | 2023-05 | Cina dan Inggris | Universal | [?HF] | Linly | Institut Visi Komputer Universitas Shenzhen | CD | ||
BiLLa-LLM | 7B | 2023-05 | Cina dan Inggris | Universal | [?HF] | ikB | Zhong Li Li | CD | ||
Ziya-LLaMA-Hadiah | 7B | 2023-05 | Cina dan Inggris | Universal | [?HF] | Fengshenbang-LM | Institut IDE | CD | ||
YuYan | 11B | 2023-04 | Cina | Universal | [?HF] | / | NetEase Fuxi | CD | Kertas | |
Cina-LLaMA | 13/7/33B | 2023-04 | Cina | Universal | [?HF] | Linly | Institut Visi Komputer Universitas Shenzhen | CD | blog | |
BukaCinaLLaMA | 7B | 2023-04 | Cina dan Inggris | Universal | [?HF] | BukaCinaLLaMA | BukaLMLab | CD | ||
lumut-003 | 16B | 2023-04 | Cina dan Inggris | Universal | [?HF] | LUMUT | Universitas Fudan | CD | ||
BBT-2-Teks | 13B | 2023-04 | Cina | Universal | Menerapkan | BBT-FinCUGE-Aplikasi | supersimetri | CD | Kertas | |
BBT-2-Teks | 12B | 2023-04 | Cina | Universal | Menerapkan | BBT-FinCUGE-Aplikasi | supersimetri | CD | Kertas | |
Cina-LLaMA | 13B | 2023-04 | Cina dan Inggris | Universal | [?HF] | Cina-LLaMA-Alpaca | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | Multibahasa | Universal | [?HF] | ul2 | ED | Kertas | ||
CPM-Lebah | 10B | 2023-01 | Cina dan Inggris | Universal | [?HF] | CPM-Lebah | BukaBMB | CD | ||
BUNGA | 176B | 2022-11 | Multibahasa | Universal | [?HF] | Megatron-DeepSpeed | Sains Besar | CD | Kertas | |
BLOOMZ | 176B | 2022-11 | Multibahasa | Universal | [?HF] | Megatron-DeepSpeed | Sains Besar | CD | Kertas | |
flan-t5-xxl | 11B | 2022-11 | Multibahasa | Universal | [?HF] | t5x | ED | kertas | ||
BPS-Semut+ | 10B | 2022-10 | Cina dan Inggris | Universal | BMB | CPM-Langsung | BukaBMB | CD | blog | |
GLM | 130B | 2022-10 | Cina dan Inggris | Universal | Menerapkan | GLM-130B | Universitas Tsinghua | tidak | kertas | |
BPS-Semut | 10B | 2022-09 | Cina | Universal | [?HF] | CPM-Langsung | BukaBMB | CD | blog | |
GLM | 10B | 2022-09 | Cina | Universal | [?HF] | GLM | Universitas Tsinghua | tidak | kertas | |
Sumber 1.0 | 245B | 2021-09 | Cina | Universal | API | Yian-1.0 | melambai | CD | kertas | |
BPS-2 | 10/11/ 200B | 2021-06 | Cina | Universal | Menerapkan | BPS | Institut Penelitian Zhiyuan | ED | kertas | |
PanGu-Alpha | 13/200B | 2021-05 | Cina | Universal | [?HF] | PanGu-Alpha | Laboratorium Pengcheng | CD | kertas | |
STEKER | 27B | 2021-04 | Cina | Universal | Menerapkan | AliceMind | Alibaba | ED | ||
GPT-3 | 13/30B | 2021-04 | Cina | Universal | TODO | GPT-3 | Akademi Bodhidharma | CD |
[Kembali ke Atas]
Model dasar sumber terbuka di berbagai bidang vertikal
Model | ukuran | waktu | bahasa | bidang | unduh | Alamat proyek | Institusi/Perorangan | Arsitektur | literatur | Komentar |
---|---|---|---|---|---|---|---|---|---|---|
Qwen-2.5 | 1,5/7B | 2024-09 | Cina dan Inggris | kode | ?HF | Qwen2.5 | QwenLM | CD | blog | |
Qwen-2.5 | 1,5/7/72B | 2024-09 | Cina dan Inggris | matematika | ?HF | Qwen2.5 | QwenLM | CD | blog | |
Basis Keuangan Tongyi | 14B | 2023-11 | Cina | keuangan | Lingkup Model | Tongyi Keuangan-14B | Model keuangan Tongyi | CD | ||
ChiMed-GPT | 13B | 2023-10 | Cina | medis | [?HF] | ChiMed-GPT | Universitas Sains dan Teknologi Tiongkok | CD | Kertas | |
Basis CodeShell | 7B | 2023-10 | Cina dan Inggris | kode | [?HF] | cangkang kode | Cangkang Kebijaksanaan | CD | ||
Basis WiNGPT | 7B | 2023-09 | Cina | obat | [?HF] | WiNGPT2 | Memenangkan Penelitian AI Kesehatan | CD | ||
Xuan Yuan | 70B | 2023-09 | Cina | keuangan | [?HF] | Xuan Yuan | Du Xiaoman | CD | Laporan | |
KodeLLAma | 13/7/ 34B | 2023-08 | Multibahasa | kode | [?HF] | codella | Penelitian Meta | CD | Kertas | |
pendidikan-basis-002 | 7/13B | 2023-06 | Cina dan Inggris | mendidik | [?HF] | Obrolan Pendidikan | Universitas Normal Tiongkok Timur | CD | ||
AquilaCode-NV | 7B | 2023-06 | Cina dan Inggris | kode | [?HF] | Akuila | BenderaAI | CD | ||
AquilaCode-TS | 7B | 2023-06 | Cina dan Inggris | kode | [?HF] | Akuila | BenderaAI | CD | ||
HukumWGPT | 7B | 2023-05 | Cina dan Inggris | hukum | [?HF] | HukumGPT | Lagu Pengxiao | CD | ||
KodeGeeX | 13B | 2022-06 | Multibahasa | kode | Menerapkan | KodeGeeX | Universitas Tsinghua | CD | blog |
[Kembali ke Atas]
Model bahasa besar dengan kemampuan seperti menjawab pertanyaan dan dialog.
Model | ukuran | waktu | bahasa | bidang | unduh | Alamat proyek | Institusi/Perorangan | Arsitektur | literatur |
---|---|---|---|---|---|---|---|---|---|
Athene-V2-Obrolan | 72B | 2024-11 | Cina dan Inggris | Universal | ?HF | / | Aliran Nexus | CD | blog |
Agen Athene-V2 | 72B | 2024-11 | Cina dan Inggris | Panggilan alat | ?HF | / | Aliran Nexus | CD | blog |
Hunyuan-Besar | A52/389B | 2024-11 | Cina dan Inggris | Universal | ?HF | Tencent-Hunyuan-Besar | Tencent | MoE | Kertas |
Aya-Hamparan | 8/32B | 2024-10 | Multibahasa | Universal | ?HF | / | Kohere Untuk AI | CD | |
Granit 3.0 | 1/2/3/8B | 2024-10 | Multibahasa | Universal | ?HF | model bahasa granit-3.0 | ibm-granit | CD | Kertas |
Granit 3.0-MoE | 1B/3B/A400M | 2024-10 | Multibahasa | Universal | ?HF | model bahasa granit-3.0 | ibm-granit | MoE | Kertas |
TeleChat2 | 115B | 2024-09 | Cina dan Inggris | Universal | ?ModelScope | TeleChat2 | Tele-AI | CD | |
Qwen-2.5 | 0,5/1,5/3/7/14/32/72B | 2024-09 | Cina dan Inggris | Universal | ?HF | Qwen2.5 | QwenLM | CD | blog |
XVERSE-MoE | 255B/A36B | 2024-09 | Cina dan Inggris | Universal | ?HF | XVERSE-MoE-A36B | xverse-ai | MoE | |
DeepSeek-V2.5 | 236B/A21B | 2024-09 | Cina dan Inggris | Universal | ?HF | DeepSeek-V2 | pencarian mendalam-ai | MOE | Kertas |
BPS Mini3 | 4B | 2024-09 | Cina dan Inggris | Universal | ?HF | BPS Mini | BukaBMB | CD | Makalah BPS Mini |
Perintah C4AI R+ 08-2024 | 104B | 2024-08 | Multibahasa | Universal | ?HF | / | KohereForAI | CD | |
JIUTIAN-Obrolan | 39/A13B | 2024-07 | Cina dan Inggris | Universal | ?MS | / | China Mobile JiuTian-AI | MOE | |
meta-lama-3.1 | 8/70/405B | 2024-07 | Multibahasa | Universal | [?HF] | llama3 | meta-lama | CD | |
maganglm2.5-obrolan | 7B | 2024-07 | Cina dan Inggris | Universal | [?HF] | MagangLM | MagangLM | CD | Laporan Teknis |
Instruksi-mistral-besar-2407 | 123B | 2024-07 | Multibahasa | Universal | ?HF | / | AI Mistral | postingan blog | |
DeepSeek-V2-Obrolan-0628 | 236B | 2024-07 | Cina dan Inggris | Universal | ?HF | DeepSeek-V2 | pencarian mendalam-ai | MOE | Kertas |
C4ai-perintah-r-plus | 104B | 2024-07 | Multibahasa | Universal | ?HF | / | KohereForAI | CD | |
Gemma-2-obrolan | 9/27B | 2024-06 | Multibahasa | Universal | ?HF | / | CD | ||
PETA-NEO-Obrolan | 2/7B | 2024-06 | Cina dan Inggris | Universal | ?HF | PETA-NEO | proyeksi seni multimodal | CD | Kertas |
GEB-Obrolan | 1.3B | 2024-06 | Cina dan Inggris | Universal | ?HF | / | GEB-AGI | CD | Kertas |
Nemotron-4-Obrolan | 340B | 2024-06 | Multibahasa | Universal | ?HF | / | NVIDIA | CD | laporan teknis. |
Indeks-Obrolan | 1.9B | 2024-06 | Cina dan Inggris | Universal | ?HF | Indeks-1.9B | bilibili | CD | Laporan |
Qwen2-MoE | 57B/A14B | 2024-06 | Multibahasa | Universal | ?HF | Qwen2 | QwenLM | MoE | blog |
Qwen2-Obrolan | 0,5/2/5/7/72B | 2024-06 | Multibahasa | Universal | ?HF | Qwen2 | QwenLM | CD | blog |
GLM-4-Obrolan | 9B | 2024-06 | Multibahasa | Universal | ?HF | GLM-4 | THUDM | / | |
Skywork-MoE | 16/A22B/146B | 2024-06 | Cina dan Inggris | Universal | ?HF | Skywork-MoE | SkyworkAI | MoE | Laporan Teknologi |
Yuan2.0 | 40/A3.7B | 2024-05 | Cina dan Inggris | Universal | ?HF | Yuan2.0-M32 | IEIT-Yuan | MOE | Kertas |
Obrolan Bintang | 52B | 2024-05 | Cina dan Inggris | Universal | ?HF | TeleChat-52B | Tele-AI | CD | |
LingLong | 317M | 2024-05 | Cina dan Inggris | Universal | ?HF | lama sekali | nkcs-iclab | CD | |
Pelaut | 14B | 2024-05 | 7 bahasa | Universal | ?HF | pelaut-llm | berlayar-sg | CD | Kertas |
Nanbeige2 | 8/16B | 2024-05 | Cina dan Inggris | Universal | ?HF | Nanbeige | Nanbeige | CD | |
Yi-1.5-Obrolan | 6/9/34B | 2024-05 | Cina dan Inggris | Universal | ?HF | Yi-1.5 | 01-ai | CD | Kertas |
Obrolan DeepSeek-V2 | A21B/236B | 2024-05 | Cina dan Inggris | Universal | ?HF | DeepSeek-V2 | pencarian mendalam-ai | MOE | Kertas |
XVERSE-MoE | A4.2B/25.8B | 2024-05 | Cina dan Inggris | Universal | ?HF | XVERSE-MoE-A4.2B | xverse-ai | MOE | |
Llama3-zh | 8/70B | 2024-04 | Cina dan Inggris | Universal | ?HF | / | / | CD | llama3 daftar Cina |
Llama3-Obrolan Cina | 8B | 2024-04 | Cina dan Inggris | Universal | ?HF | / | Shenzhi Wang | CD | |
Llama-3-Obrolan | 8/70B | 2024-04 | Multibahasa | Universal | ?HF | llama3 | Meta Lama | CD | |
Zhinao-Obrolan | 7B | 2024-04 | Cina dan Inggris | Universal | ?HF? | / | Teknologi Qihoo | CD | |
MiniCPM-MoE | 8x2B | 2024-04 | Cina dan Inggris | Universal | ?HF | BPS Mini | BukaBMB | MoE | |
Nanbeige2-Obrolan | 8B | 2024-04 | Cina dan Inggris | Universal | ?HF | Nanbeige | Lab LLM Nanbeige | CD | |
Pelaut | 7B | 2024-04 | Multibahasa | Universal | ?HF | pelaut-llm | Lab AI Laut | CD | Kertas |
Mengzi3-Obrolan | 13B | 2024-04 | Cina dan Inggris | Universal | ?HF | Mengzi3 | perahu lang | CD | |
Qwen-MoE | 2.7B | 2024-03 | Cina dan Inggris | Universal | ?HF | Qwen1.5 | Qwen | MoE | blog |
Komando-R | 35B | 2024-03 | Multibahasa | Universal | ?HF | / | KohereForAI | CD | |
Instruksi Angin | 7B | 2024-02 | Cina dan Inggris | Universal | ?HF | / | Riset MediaTek | ||
aya-101 | 13B | 2024-02 | Multibahasa | Universal | ?HF | / | Kohere Untuk AI | CD | Kertas |
KimiaLLM | 7B | 2024-02 | Multibahasa | Universal | ?HF | / | AI4Chem | CD | Kertas |
MenaraInstruksikan | 7/13B | 2024-02 | Multibahasa | Universal | [?HF] | / | Unbabel | CD | |
Qwen1.5-Obrolan | 0,5/1,8/4/ 14/7/32/72/110B | 2024-02 | Cina dan Inggris | Universal | [?HF] | Qwen1.5 | Qwen | / | blog |
BPS Mini | 2B | 2024-02 | Cina dan Inggris | Universal | [?HF] ModelScope | BPS Mini | BukaBMB | / | Laporan |
Obrolan Sejajar Panjang | 6/7/13B | 2024-02 | Cina dan Inggris | Universal | [?HF] | Sejajarkan Panjang | THUDM | / | Kertas |
Obrolan Campuran-Cina | 8x7B | 2024-02 | Cina dan Inggris | Universal | [Baidu] [?HF] | Cina-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Obrolan | 13B | 2024-01 | Cina dan Inggris | Universal | mindpore | / | iFlytek | CD | |
rwkv-5-dunia | 0,1/1/ 3/7B | 2023-01 | Multibahasa | Universal | [?HF] | RWKV-LM | BerkedipDL | URL | |
Orion-Obrolan | 14B | 2024-01 | Multibahasa | Universal | [?HF] | Orion | OrionStarAI | CD | Kertas |
maganglm2-obrolan | 7/20B | 2024-01 | Cina dan Inggris | Universal | [?HF] | MagangLM | MagangLM | CD | Laporan |
Cina-Mixtral | 8x7B | 2023-01 | Cina dan Inggris | Universal | [?HF] | / | HIT-SCIR | CD-MOE | |
Obrolan Tele | 7/12B | 2024-01 | Cina dan Inggris | Universal | [?HF] | Telechatx | Tele-AI | CD | Laporan |
kagentlms | 7/13B | 2024-01 | Cina dan Inggris | Universal | [?HF] | Agen Kwai | KwaiKEG | ||
YaYi2-Obrolan | 30B | 2023-12 | Multibahasa | Universal | [?HF] | YAYI2 | penelitian wenge | CD | Kertas |
SUS-Obrolan | 34/72B | 2023-12 | Cina dan Inggris | Universal | [?HF] | SUS-Obrolan | SUSTech-IDEA | CD | |
Aquila2-Obrolan | 34/7/70B | 2023-12 | Cina dan Inggris | Universal | [?HF] | Akuila2 | BenderaAI | CD | |
Alaya-Obrolan | 7B | 2023-12 | Cina dan Inggris | Universal | [?HF] | Alay | Kanvas Data | CD | |
Qwen-Obrolan | 1,8/7/ 14/72B | 2023-12 | Cina dan Inggris | Universal | [?HF] | Qwen | Alibaba Cloud | CD | Laporan Kertas Laporan2 |
Obrolan DeepSeek | 7/67B | 2023-11 | Cina dan Inggris | Universal | [?HF] | DeepSeek-LLM | pencarian mendalam-ai | CD | |
Yi-Obrolan | 6/34B | 2023-11 | Cina dan Inggris | Universal | [?HF] | Yi | 01.AI | CD | |
Alaya-Obrolan | 7B | 2023-11 | Cina dan Inggris | Universal | [?HF] | Alay | DataCanvasIO | CD | |
OrionStar-Yi-Obrolan | 34B | 2023-11 | Cina dan Inggris | Universal | [?HF] | OrionStar-Yi-34B-Obrolan | OrionStarAI | CD | |
Nanbeige-Obrolan | 16B | 2023-11 | Cina dan Inggris | Universal | [?HF] | Nanbeige | Lab LLM Nanbeige | CD | |
Buka Obrolan 3.5 | 7B | 2023-11 | Cina dan Inggris | Universal | [?HF] | obrolan terbuka | Obrolan Terbuka | CD | Kertas |
XVERSE-Obrolan | 7/13B | 2023-11 | Multibahasa | Universal | [?HF] | XVERSE | Teknologi Yuanxiang | CD | |
AndesGPT | 7B | 2023-11 | Cina | Universal | [?HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Obrolan | 13B | 2023-11 | Multibahasa | Universal | [?HF] | SeaLLM | SeaLLM | CD | |
BiruLM | 7B | 2023-11 | Cina dan Inggris | Universal | [?HF] | BiruLM | laboratorium AI vivo | CD | |
Obrolan Skywork | 13B | 2023-10 | Cina | Universal | [?HF] | pekerjaan langit | SkyworkAI | CD | Kertas |
Angin barat | 7B | 2023-10 | Multibahasa | Universal | [?HF] | buku pegangan penyelarasan | Memeluk Wajah H4 | CD | Kertas |
Mistral | 7B | 2023-10 | Multibahasa | Universal | [?HF] | mistral-src | AI Mistral | CD | Kertas |
obrolanglm3 | 6B | 2023-10 | Cina dan Inggris | Universal | [?HF] | ObrolanGLM3 | THUDM | tidak | |
Obrolan Zhiyin | 7B | 2023-10 | Cina dan Inggris | Universal | [?HF] | Zhiyin | Institut Akustik, Akademi Ilmu Pengetahuan Tiongkok | CD | |
Ziya2-Obrolan | 13B | 2023-10 | Cina dan Inggris | Universal | [?HF] | Fengshenbang-LM | Institut IDE | CD | |
Burung bangkai | 40/180B | 2023-10 | Multibahasa | Universal | [?HF] | / | VILM-AI | TODO | |
Burung bangkai | 3/7/ 40/180B | 2023-09 | Multibahasa | Universal | [?HF] | / | VILM | CD | |