api for open llm下載api for open llm源代碼下載

api for open llm

其他源碼

latest

下載

API for Open LLMs

圖片來自於論文: [A Survey of Large Language Models](https://arxiv.org/pdf/2303.18223.pdf)

? 新聞

【2024.06.13】支持MiniCPM-Llama3-V-2_5模型，修改環境變量MODEL_NAME=minicpm-v PROMPT_NAME=minicpm-v DTYPE=bfloat16
【2024.06.12】支持GLM-4V模型，修改環境變量MODEL_NAME=glm-4v PROMPT_NAME=glm-4v DTYPE=bfloat16 ，測試示例見glm4v
【2024.06.08】已支持QWEN2模型，修改環境變量MODEL_NAME=qwen2 PROMPT_NAME=qwen2
【2024.06.05】支持GLM4模型，修改環境變量MODEL_NAME=chatglm4 PROMPT_NAME=chatglm4
【2024.04.18】支持Code Qwen模型，sql問答demo
【2024.04.16】支持Rerank重排序模型，使用方式
【2024.02.26】 QWEN1.5模型需要修改環境變量MODEL_NAME=qwen2 PROMPT_NAME=qwen2

更多新聞和歷史請轉至此處

此項目主要內容

此項目為開源大模型的推理實現統一的後端接口，與OpenAI的響應保持一致，具有以下特性：

以OpenAI ChatGPT API的方式調用各類開源大模型
?️ 支持流式響應，實現打印機效果
實現文本嵌入模型，為文檔知識問答提供支持
?️ 支持大規模語言模型開發工具langchain的各類功能
? 只需要簡單的修改環境變量即可將開源模型作為chatgpt的替代模型，為各類應用提供後端支持
支持加載經過自行訓練過的lora模型
⚡ 支持vLLM 推理加速和處理並發請求

內容導引

章節	描述
??‍♂支持模型	此項目支持的開源模型以及簡要信息
?啟動方式	啟動模型的環境配置和啟動命令
⚡vLLM啟動方式	使用`vLLM`啟動模型的環境配置和啟動命令
調用方式	啟動模型之後的調用方式
❓常見問題	一些常見問題的回复

? 支持模型

語言模型

模型	模型參數大小
Baichuan	7B/13B
ChatGLM	6B
DeepSeek	7B/16B/67B/236B
InternLM	7B/20B
LLaMA	7B/13B/33B/65B
LLaMA-2	7B/13B/70B
LLaMA-3	8B/70B
Qwen	1.8B/7B/14B/72B
Qwen1.5	0.5B/1.8B/4B/7B/14B/32B/72B/110B
Qwen2	0.5B/1.5B/7B/57B/72B
Yi (1/1.5)	6B/9B/34B

啟動方式詳見vLLM啟動方式、transformers啟動方式

嵌入模型

模型	維度	權重鏈接
bge-large-zh	1024	bge-large-zh
m3e-large	1024	moka-ai/m3e-large
text2vec-large-chinese	1024	text2vec-large-chinese
bce-embedding-base_v1（推薦）	768	bce-embedding-base_v1

? 使用方式

環境變量

OPENAI_API_KEY : 此處隨意填一個字符串即可
OPENAI_API_BASE : 後端啟動的接口地址，如：http://192.168.0.xx:80/v1

聊天界面

 cd streamlit-demo
pip install -r requirements.txt
streamlit run streamlit_app.py

openai v1.1.0

Chat Completions

 from openai import OpenAI

client = OpenAI (
    api_key = "EMPTY" ,
    base_url = "http://192.168.20.59:7891/v1/" ,
)

# Chat completion API
chat_completion = client . chat . completions . create (
    messages = [
        {
            "role" : "user" ,
            "content" : "你好" ,
        }
    ],
    model = "gpt-3.5-turbo" ,
)
print ( chat_completion )
# 你好！我是人工智能助手 ChatGLM3-6B，很高兴见到你，欢迎问我任何问题。


# stream = client.chat.completions.create(
#     messages=[
#         {
#             "role": "user",
#             "content": "感冒了怎么办",
#         }
#     ],
#     model="gpt-3.5-turbo",
#     stream=True,
# )
# for part in stream:
#     print(part.choices[0].delta.content or "", end="", flush=True)

Completions

 from openai import OpenAI

client = OpenAI (
    api_key = "EMPTY" ,
    base_url = "http://192.168.20.59:7891/v1/" ,
)


# Chat completion API
completion = client . completions . create (
    model = "gpt-3.5-turbo" ,
    prompt = "你好" ,
)
print ( completion )
# 你好！我是人工智能助手 ChatGLM-6B，很高兴见到你，欢迎问我任何问题。

Embeddings

 from openai import OpenAI

client = OpenAI (
    api_key = "EMPTY" ,
    base_url = "http://192.168.20.59:7891/v1/" ,
)


# compute the embedding of the text
embedding = client . embeddings . create (
    input = "你好" ,
    model = "text-embedding-ada-002"
)
print ( embedding )

可接入的項目

通過修改OPENAI_API_BASE環境變量，大部分的chatgpt應用和前後端項目都可以無縫銜接！

ChatGPT-Next-Web: One-Click to deploy well-designed ChatGPT web UI on Vercel

docker run -d -p 3000:3000 
   -e OPENAI_API_KEY= " sk-xxxx " 
   -e BASE_URL= " http://192.168.0.xx:80 " 
   yidadaa/chatgpt-next-web

web

dify: An easy-to-use LLMOps platform designed to empower more people to create sustainable, AI-native applications

 # 在docker-compose.yml中的api和worker服务中添加以下环境变量
OPENAI_API_BASE: http://192.168.0.xx:80/v1
DISABLE_PROVIDER_CONFIG_VALIDATION: ' true '

dify

License

此項目為Apache 2.0許可證授權，有關詳細信息，請參閱LICENSE 文件。

? References

ChatGLM: An Open Bilingual Dialogue Language Model
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model
LLaMA: Open and Efficient Foundation Language Models
Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca
Phoenix: Democratizing ChatGPT across Languages
MOSS: An open-sourced plugin-augmented conversational language model
FastChat: An open platform for training, serving, and evaluating large language model based chatbots
LangChain: Building applications with LLMs through composability
ChuanhuChatgpt

Star History

展開

附加信息

版本 latest
類型其他源碼
更新時間 2025-03-02
大小 17.04MB
來自於 Github

相關應用

TensorRT LLM

2024-11-10
open webui

2024-11-03
powsybl open rao

2024-11-02
打開你的頭腦

2023-10-24
開放式中庭

2013-02-25
打開部落格

2009-07-08

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
Sunamu

其他源碼

Release 2.2.0
chat.petals.dev

其他源碼

1.0.0
waymo open dataset

其他源碼

December 2023 Update
termwind

其他類別

v2.3.0
wp functions

其他類別

1.0.0

相關資訊全部