bedrock access gateway下載 - bedrock access gateway源代碼下載

bedrock access gateway

其他源碼

1.0.0

下載

中文

基岩進入門戶

Amazon Bedrock的OpenAI兼容的RESTFUL API

打破變化

源代碼是通過基岩的新匡威API重構的，該API通過工具調用提供本機支持。

如果您面臨任何問題，請提出問題。

概述

亞馬遜Bedrock提供了廣泛的基礎模型（例如Claude 3 Opus/Sonnet/Haiku，Llama 2/3，Mistral/Mixtral等），並為您提供了構建生成AI應用程序的廣泛功能。查看亞馬遜基岩著陸頁以獲取更多信息。

有時，您可能會使用OpenAI API或SDK開發應用程序，並且您想在不修改代碼庫的情況下嘗試Amazon Bedrock。或者，您可能只想在Autogen等工具等工具中評估這些基礎模型的功能。好吧，此存儲庫使您可以通過OpenAI API和SDK無縫訪問Amazon Bedrock模型，從而使您能夠在沒有代碼更改的情況下測試這些模型。

如果您覺得這個GitHub存儲庫有用，請考慮給它一個免費的星星，以表示您對該項目的讚賞和支持。

特徵：

請查看使用指南，以獲取有關如何使用新API的更多詳細信息。

注意：不支持舊文本完成API，您應該更改以使用聊天完成API。

支持亞馬遜基岩模型家庭：

人類克勞德2/3（haiku / sonnet / opus） / 3.5十四行詩
Meta Llama 2 /3
Mistral / Mixtral
cohere命令r / r+
共嵌入

您可以調用models API以獲取支持的模型ID列表。

注意：默認模型設置為anthropic.claude-3-sonnet-20240229-v1:0該模型可以通過Lambda環境變量（ DEFAULT_MODEL ）更改。

開始

先決條件

請確保您在先決條件下面見面：

訪問亞馬遜基岩基金會模型。

有關如何請求模型訪問的更多信息，請參閱《亞馬遜基礎用戶指南》（設置>模型訪問）

建築學

下圖說明了參考體系結構。請注意，它還包括一個新的VPC ，其中包含兩個公共子網，僅用於應用程序負載平衡器（ALB）。

您還可以選擇使用AWS Fargate在Alb而不是AWS Lambda後面使用，主要區別是第一個用於流響應的字節的延遲（Fargate較低）。

另外，您可以使用lambda功能URL替換ALB，請參見示例

部署

請按照以下步驟將基礎代理API部署到您的AWS帳戶中。僅支持可用亞馬遜底石的區域（例如us-west-2 ）。部署大約需要3-5分鐘。

步驟1：創建自己的自定義API鍵（可選）

注意：此步驟是使用您想創建一個自定義API密鑰（憑據）的任何字符串（無空格），該鍵將用於稍後訪問代理API。此密鑰不必匹配您的實際OpenAI鍵，也不需要擁有OpenAI API鍵。建議您採取此步驟並確保保持關鍵安全和私密。

打開AWS管理控制台並導航到系統管理器服務。
在左側導航窗格中，單擊“參數存儲”。
單擊“創建參數”按鈕。
在“創建參數”窗口中，選擇以下選項：
- 名稱：輸入您的參數的描述性名稱（例如，“ Bedrockproxyapikey”）。
- 描述：可選，為參數提供描述。
- 層：選擇標準。
- 類型：選擇Securestring 。
- 值：任何字符串（沒有空格）。
單擊“創建參數”。
記下您使用的參數名稱（例如“ Bedrockproxyapikey”）。下一步您需要此。

步驟2：部署雲形式堆棧

登錄到AWS管理控制台，切換到該區域以將雲形式堆棧部署到。
單擊以下按鈕以啟動該區域中的CloudFormation堆棧。選擇以下一項：
- Alb + Lambda
- Alb + Fargate
單擊“下一步”。
在“指定堆棧詳細信息”頁面上，提供以下信息：
- 堆棧名稱：如果需要，請更改堆棧名稱。
- APIKEYPARAM（如果您在步驟1中設置了一個API鍵）：輸入用於存儲API鍵的參數名稱（例如， BedrockProxyAPIKey ）。如果您沒有設置API鍵，請將此字段留空。單擊“下一步”。
在“配置堆棧選項”頁面上，您可以離開默認設置或根據您的需求進行自定義。
單擊“下一步”。
在“評論”頁面上，查看您將要創建的堆棧的詳細信息。檢查底部的“我承認AWS CloudFormation可能會創建IAM資源”的複選框。
單擊“創建堆棧”。

就是這樣！？部署後，單擊CloudFormation堆棧並轉到輸出選項卡，您可以從APIBaseUrl找到API鹼基URL，該值應看起來像http://xxxx.xxx.elb.amazonaws.com/api/v1 。

SDK/API使用

您需要的只是API鍵和API鹼基URL。如果您沒有設置自己的密鑰，則將使用默認的API鍵（ bedrock ）。

現在，您可以嘗試代理API。假設您要測試Claude 3十四行詩模型（型號ID： anthropic.claude-3-sonnet-20240229-v1:0 ）...

示例API用法

 export OPENAI_API_KEY= < API key >
export OPENAI_BASE_URL= < API base url >
# For older versions
# https://github.com/openai/openai-python/issues/624
export OPENAI_API_BASE= < API base url >

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "anthropic.claude-3-sonnet-20240229-v1:0",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

示例SDK用法

 from openai import OpenAI

client = OpenAI ()
completion = client . chat . completions . create (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    messages = [{ "role" : "user" , "content" : "Hello!" }],
)

print ( completion . choices [ 0 ]. message . content )

請查看使用指南，以獲取有關如何使用嵌入API，多模式API和工具調用的更多詳細信息。

基岩跨區域的推斷

跨區域推理支持跨區域訪問基礎模型，從而使用戶可以調用在不同AWS區域中託管的模型進行推理。主要優勢：

改善的可用性：提供區域冗餘和增強的容錯性。當主要地區出現問題時，服務可能會導致備份區域的故障轉移，從而確保連續的服務可用性和業務連續性。
減少延遲：啟用在地理位置上最接近用戶的區域的選擇，優化網絡路徑並減少傳輸時間，從而獲得更好的用戶體驗和響應時間。
更好的性能和容量：實現負載平衡以分發請求壓力，提供更大的服務能力和吞吐量，並更好地處理交通峰值。
靈活性：允許根據需求選擇不同區域的模型，滿足特定的區域合規性要求，並實現更靈活的資源分配和管理。
成本收益：可以選擇更具成本效益的區域，通過資源優化降低整體運營成本，並提高資源利用效率。

請檢查基岩跨區域的推理

限制：目前，基岩訪問網關僅支持以下模型的跨區域推斷：

克勞德3 haiku
Claude 3 Opus
克勞德3十四行詩
克勞德3.5十四行詩
Meta Llama 3.1 8B指示
Meta Llama 3.1 70B指示

先決條件：

IAM策略必須允許跨區域訪問，呼叫者需要在兩個區域訪問模型和推理配置文件的權限（在雲形式模板中添加）
在推理配置文件中定義的兩個區域必須啟用模型訪問

示例API用法：

要使用基岩跨區域的推理，通過將推理配置文件的ID指定為ModelID，例如us.anthropic.claude-3-5-sonnet-20240620-v1:0 ，您可以在運行模型推理時包含推理配置文件

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "us.anthropic.claude-3-5-sonnet-20240620-v1:0",
    "max_tokens": 2048,
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

其他例子

自動基因

下面是在Autogen Studio中設置模型的圖像。

自動基因模型

Langchain

確保使用ChatOpenAI(...)而不是OpenAI(...)

 # pip install langchain-openai
import os

from langchain . chains import LLMChain
from langchain . prompts import PromptTemplate
from langchain_openai import ChatOpenAI

chat = ChatOpenAI (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    temperature = 0 ,
    openai_api_key = os . environ [ 'OPENAI_API_KEY' ],
    openai_api_base = os . environ [ 'OPENAI_BASE_URL' ],
)

template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate . from_template ( template )
llm_chain = LLMChain ( prompt = prompt , llm = chat )

question = "What NFL team won the Super Bowl in the year Justin Beiber was born?"
response = llm_chain . invoke ( question )
print ( response )

常見問題解答

關於隱私

此應用程序不會收集您的任何數據。此外，默認情況下，它不會記錄任何請求或響應。

為什麼不使用API網關而不是應用程序負載平衡器？

簡短的答案是，API網關不支持服務器範圍事件（SSE）進行流響應。

支持哪些區域？

該解決方案僅支持可用的亞馬遜基岩的區域，如下所示，在下面是列表。

美國東部（N. Virginia）：us-east-1
美國西部（俄勒岡州）：US-West-2
亞太地區（新加坡）：ap-southeast-1
亞太地區（悉尼）：AP-Southeast-2
亞太地區（東京）：AP-Northeast-1
歐洲（法蘭克福）：歐盟中央1
歐洲（巴黎）：歐盟 - 西3

一般而言，亞馬遜基岩支撐的所有地區也將得到支持，如果不是，請在Github提出問題。

請注意，並非所有模型都在這些區域中可用。

我可以構建和使用自己的ECR圖像嗎

是的，您可以克隆回購併自己構建容器圖像（ src/Dockerfile ），然後推到ECR回購。您可以使用scripts/push-to-ecr.sh

部署之前，請在雲形式模板中替換回購URL。

我可以在本地運行嗎

是的，您可以在本地運行。

API基礎URL應該看起來像http://localhost:8000/api/v1 。

通過使用代理API，任何表現犧牲或潛伏期的延遲增加

與AWS SDK調用相比，引用的體系結構將帶來額外的響應延遲，您可以嘗試自己測試。

另外，您可以使用lambda Web適配器 +功能URL（請參閱示例）替換ALB或AWS Fargate來替換Lambda，以在流響應上獲得更好的性能。

有任何支持薩吉人模型的計劃嗎？

當前，尚無計劃支持sagemaker模型。如果客戶有需求，這可能會發生變化。

有任何支持基岩定制模型的計劃嗎？

當前不支持具有配置吞吐量的微調模型和模型。您可以克隆回購併在需要時進行自定義。

如何升級？

要使用最新功能，您無需重新部署CloudFormation堆棧。您只需要拉出最新圖像即可。

為此，取決於您部署的版本：

lambda版本：轉到AWS lambda控制台，查找lambda功能，然後查找並單擊Deploy new image按鈕，然後單擊“保存”。
Fargate版本：轉到ECS控制台，單擊ECS群集，轉到Tasks選項卡，選擇正在運行的唯一任務，然後單擊Stop selected菜單。具有最新圖像的新任務將自動啟動。

安全

有關更多信息，請參見貢獻。

執照

該圖書館已獲得MIT-0許可證的許可。請參閱許可證文件。

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-03-02
大小 515.58KB
來自於 Github

相關應用

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
chat.petals.dev

其他源碼

1.0.0
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
termwind

其他類別

v2.3.0
wp functions

其他類別

1.0.0

相關資訊全部

bedrock access gateway

基岩進入門戶

打破變化

概述

開始

先決條件

建築學

部署

SDK/API使用

基岩跨區域的推斷

其他例子

自動基因

Langchain

常見問題解答

關於隱私

為什麼不使用API網關而不是應用程序負載平衡器？

支持哪些區域？

我可以構建和使用自己的ECR圖像嗎

我可以在本地運行嗎

通過使用代理API，任何表現犧牲或潛伏期的延遲增加

有任何支持薩吉人模型的計劃嗎？

有任何支持基岩定制模型的計劃嗎？

如何升級？

安全

執照

stardew access

Minecraft bedrock cracked

Access 2007 VBA寶典

Access 2007 初學者秘籍手冊

Access 2003 VBA 程式設計師參考書

Asp Access 查詢分析器

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

chat.petals.dev

Sunamu

waymo open dataset

termwind

wp functions

bedrock access gateway

基岩進入門戶

打破變化

概述

開始

先決條件

建築學

部署

SDK/API使用

基岩跨區域的推斷

其他例子

自動基因

Langchain

常見問題解答

關於隱私

為什麼不使用API​​網關而不是應用程序負載平衡器？

支持哪些區域？

我可以構建和使用自己的ECR圖像嗎

我可以在本地運行嗎

通過使用代理API，任何表現犧牲或潛伏期的延遲增加

有任何支持薩吉人模型的計劃嗎？

有任何支持基岩定制模型的計劃嗎？

如何升級？

安全

執照

為什麼不使用API網關而不是應用程序負載平衡器？