bedrock access gateway 다운로드 -Bedrock bedrock access gateway 소스 코드 다운로드

bedrock access gateway

기타 소스코드

1.0.0

다운로드

中文

기반암 액세스 게이트웨이

Amazon 기반암을위한 Openai 호환 편안한 API

변화를 깨뜨립니다

소스 코드는 Bedrock에 의해 새로운 Converse API와 함께 리팩토링되며, 이는 도구 통화와 함께 기본 지원을 제공합니다.

문제에 직면하고 있다면 문제를 제기하십시오.

개요

Amazon Bedrock은 광범위한 기초 모델 (Claude 3 Opus/Sonnet/Haiku, Llama 2/3, Mistral/Mixtral 등)과 생성 AI 애플리케이션을 구축 할 수있는 광범위한 기능 세트를 제공합니다. 추가 정보는 Amazon Bedrock 방문 페이지를 확인하십시오.

때로는 OpenAI API 또는 SDK를 사용하여 응용 프로그램이 개발되었을 수 있으며 코드베이스를 수정하지 않고 Amazon Bedrock을 실험하려고합니다. 또는 Autogen 등과 같은 도구에서 이러한 기초 모델의 기능을 평가할 수 있습니다. 글쎄,이 저장소를 사용하면 OpenAI API 및 SDK를 통해 Amazon Bedrock 모델에 완벽하게 액세스 할 수 있으므로 코드 변경없이 이러한 모델을 테스트 할 수 있습니다.

이 github 저장소에 유용하다고 생각되면 프로젝트에 대한 감사와 지원을 보여줄 무료 스타를 제공하는 것이 좋습니다.

특징:

서버에 대한 이벤트 (SSE)를 통한 스트리밍 응답 지원
지원 모델 API
채팅 완료 API를 지원합니다
지원 도구 통화 ( 신규 )
API 임베딩 지원 ( 신규 )
멀티 모달 API ( 신규 ) 지원
지역 간 추론 지원 ( 신규 )

새 API 사용 방법에 대한 자세한 내용은 사용 안내서를 확인하십시오.

참고 : 레거시 텍스트 완료 API가 지원되지 않으므로 채팅 완료 API를 사용하도록 변경해야합니다.

지원되는 Amazon Bedrock Models 제품군 :

안트로 클로드 2 / 3 (Haiku / Sonnet / Opus) / 3.5 소네트
메타 라마 2 / 3
미스트랄 / 믹스 트랄
코셔 명령 r / r+
코셔 임베딩

models API를 호출하여 지원되는 모델 ID 목록을 얻을 수 있습니다.

참고 : 기본 모델은 anthropic.claude-3-sonnet-20240229-v1:0 으로 설정되어 Lambda 환경 변수 ( DEFAULT_MODEL )를 통해 변경할 수 있습니다.

시작하세요

전제 조건

아래 전제 조건을 충족했는지 확인하십시오.

Amazon Bedrock Foundation 모델에 대한 액세스.

모델 액세스를 요청하는 방법에 대한 자세한 내용은 Amazon Bedrock 사용자 안내서 (설정> 모델 액세스)를 참조하십시오.

건축학

다음 다이어그램은 참조 아키텍처를 보여줍니다. 또한 응용 부하 밸런서 (ALB)에 대해서만 두 개의 공개 서브넷이있는 새로운 VPC 도 포함되어 있습니다.

또한 AWS Lambda 대신 Alb 뒤에 AWS Fargate를 사용할 수도 있습니다. 주요 차이점은 스트리밍 응답을위한 첫 바이트의 대기 시간입니다 (Fargate는 낮습니다).

또는 Lambda Function URL을 사용하여 ALB를 대체 할 수 있습니다. 예제를 참조하십시오.

전개

Bedrock Proxy API를 AWS 계정에 배치하려면 아래 단계를 따라 가십시오. Amazon Bedrock을 사용할 수있는 지역 만 지원합니다 (예 : us-west-2 ). 배포는 약 3-5 분이 소요됩니다.

1 단계 : 자신의 사용자 정의 API 키 생성 (선택 사항)

참고 : 이 단계는 나중에 프록시 API에 액세스하는 데 사용되는 사용자 정의 API 키 (자격 증명)를 작성하려는 문자열을 사용하는 것입니다. 이 키는 실제 OpenAI 키와 일치 할 필요가 없으며 OpenAI API 키가 필요하지 않습니다. 이 단계를 수행하고 키를 안전하고 개인적으로 유지하는 것이 좋습니다.

AWS 관리 콘솔을 열고 Systems Manager 서비스로 이동하십시오.
왼쪽 탐색 창에서 "매개 변수 저장소"를 클릭하십시오.
"매개 변수 만들기"버튼을 클릭하십시오.
"매개 변수 만들기"창에서 다음 옵션을 선택하십시오.
- 이름 : 매개 변수의 설명 이름을 입력하십시오 (예 : "BedrockproxyApikey").
- 설명 : 선택적으로 매개 변수에 대한 설명을 제공하십시오.
- 계층 : 표준을 선택하십시오.
- 유형 : Securestring을 선택하십시오.
- 값 : 모든 문자열 (공백없이).
"매개 변수 만들기"를 클릭하십시오.
사용한 매개 변수 이름 (예 : "Bedrockproxyapikey")을 기록하십시오. 다음 단계에서 이것을 필요로합니다.

2 단계 : CloudFormation 스택을 배포합니다

AWS Management Console에 로그인하고 지역으로 전환하여 CloudFormation 스택을 배포하십시오.
다음 버튼을 클릭하여 해당 지역의 CloudFormation 스택을 시작하십시오. 다음 중 하나를 선택하십시오.
- alb + lambda
- Alb + Fargate
"다음 다음"을 클릭합니다.
"스택 세부 사항 지정"페이지에서 다음 정보를 제공합니다.
- 스택 이름 : 필요한 경우 스택 이름을 변경하십시오.
- APIKEYPARAM (1 단계에서 API 키를 설정 한 경우) : API 키 (예 : BedrockProxyAPIKey )를 저장하는 데 사용한 매개 변수 이름을 입력하십시오. API 키를 설정하지 않은 경우이 필드를 비워 두십시오. "다음 다음"을 클릭합니다.
"스택 옵션 구성"페이지에서 기본 설정을 남기거나 필요에 따라 사용자 정의 할 수 있습니다.
"다음 다음"을 클릭합니다.
"검토"페이지에서 작성하려는 스택의 세부 사항을 검토하십시오. "나는 AWS CloudFormation이 하단에 iAM 자원을 생성 할 수 있음을 확인하십시오.
"스택 만들기"를 클릭하십시오.

그게 다야! ? 배포되면 CloudFormation 스택을 클릭하고 출력 탭으로 이동하면 APIBaseUrl 에서 API Base URL을 찾을 수 있습니다. 값은 http://xxxx.xxx.elb.amazonaws.com/api/v1 처럼 보일 것입니다.

SDK/API 사용

API 키와 API 기본 URL 만 있으면됩니다. 자신의 키를 설정하지 않으면 기본 API 키 ( bedrock )가 사용됩니다.

이제 프록시 API를 시험해 볼 수 있습니다. Claude 3 Sonnet Model (모델 ID : anthropic.claude-3-sonnet-20240229-v1:0 )을 테스트한다고 가정 해 봅시다.

예제 API 사용

 export OPENAI_API_KEY= < API key >
export OPENAI_BASE_URL= < API base url >
# For older versions
# https://github.com/openai/openai-python/issues/624
export OPENAI_API_BASE= < API base url >

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "anthropic.claude-3-sonnet-20240229-v1:0",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

예제 SDK 사용법

 from openai import OpenAI

client = OpenAI ()
completion = client . chat . completions . create (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    messages = [{ "role" : "user" , "content" : "Hello!" }],
)

print ( completion . choices [ 0 ]. message . content )

임베딩 API 사용 방법, 멀티 모달 API 및 공구 통화 사용 방법에 대한 자세한 내용은 사용 안내서를 확인하십시오.

기반암 교차 지역 추론

지역 간 추론은 지역의 기초 모델에 액세스하는 것을 지원하므로 사용자는 추론을 위해 다양한 AWS 지역에서 호스팅 된 모델을 호출 할 수 있습니다. 주요 장점 :

가용성 향상 : 지역 중복성과 향상된 결함 공차를 제공합니다. 1 차 지역에서 문제가 발생하면 서비스는 지역을 백업하는 데 장애가되어 지속적인 서비스 가용성 및 비즈니스 연속성을 보장 할 수 있습니다.
대기 시간 감소 : 사용자에게 지리적으로 가장 가까운 지역을 선택할 수있게되어 네트워크 경로를 최적화하고 전송 시간을 줄여서 사용자 경험과 응답 시간이 향상됩니다.
더 나은 성능 및 용량 : 요청 압력을 분배하기위한로드 밸런싱을 구현하고, 더 큰 서비스 용량과 처리량을 제공하며, 트래픽 스파이크를 더 잘 처리합니다.
유연성 : 요구 사항에 따라 다른 지역에서 모델을 선택할 수 있으며 특정 지역 준수 요구 사항을 충족하며보다 유연한 리소스 할당 및 관리를 가능하게합니다.
비용 혜택 :보다 비용 효율적인 지역을 선택하고 자원 최적화를 통해 전반적인 운영 비용을 줄이며 자원 활용 효율성을 향상시킵니다.

기반암 교차 지역 추론을 확인하십시오

제한 : 현재 Bedrock Access Gateway는 다음 모델의 크로스 지역 추론 만 지원합니다.

클로드 3 하이쿠
클로드 3 Opus
클로드 3 소네트
클로드 3.5 소네트
메타 라마 3.1 8b 지시
메타 라마 3.1 70b 지시

전제 조건 :

IAM 정책은 교차 지역 액세스를 허용해야하며, 발신자는 두 지역의 모델 및 추론 프로파일에 액세스 할 권한이 필요합니다 (CloudFormation 템플릿에 추가).
추론 프로파일로 정의 된 두 지역에서 모델 액세스를 활성화해야합니다.

예제 API 사용 :

기반암 교차 지역 추론을 사용하려면 추론 프로파일의 ID를 modelID로 지정하여 모델 추론을 실행할 때 추론 프로파일을 포함합니다 us.anthropic.claude-3-5-sonnet-20240620-v1:0

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "us.anthropic.claude-3-5-sonnet-20240620-v1:0",
    "max_tokens": 2048,
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

다른 예

Autogen

아래는 Autogen Studio에서 모델을 설정하는 이미지입니다.

Autogen 모델

랭케인

Openai 대신 ChatOpenAI(...) 사용해야합니다 OpenAI(...)

 # pip install langchain-openai
import os

from langchain . chains import LLMChain
from langchain . prompts import PromptTemplate
from langchain_openai import ChatOpenAI

chat = ChatOpenAI (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    temperature = 0 ,
    openai_api_key = os . environ [ 'OPENAI_API_KEY' ],
    openai_api_base = os . environ [ 'OPENAI_BASE_URL' ],
)

template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate . from_template ( template )
llm_chain = LLMChain ( prompt = prompt , llm = chat )

question = "What NFL team won the Super Bowl in the year Justin Beiber was born?"
response = llm_chain . invoke ( question )
print ( response )

FAQ

프라이버시에 대해

이 응용 프로그램은 귀하의 데이터를 수집하지 않습니다. 또한 기본적으로 요청이나 응답을 기록하지 않습니다.

애플리케이션로드 밸런서 대신 API 게이트웨이를 사용하지 않는 이유는 무엇입니까?

짧은 대답은 API 게이트웨이가 스트리밍 응답을 위해 서버 중지 이벤트 (SSE)를 지원하지 않는다는 것입니다.

어떤 지역이 지원됩니까?

이 솔루션은 현재와 같이 Amazon Bedrock을 사용할 수있는 지역 만 지원합니다.

미국 이스트 (N. Virginia) : US-East-1
미국 웨스트 (오레곤) : US-West-2
아시아 태평양 (싱가포르) : AP-Southeast-1
아시아 태평양 (시드니) : AP-Southeast-2
아시아 태평양 (도쿄) : AP-Northeast-1
유럽 (프랑크푸르트) : EU- 중앙 1
유럽 (파리) : EU-West-3

일반적으로 Amazon Bedrock이 지원하는 모든 지역도 지원되지 않으면 Github에서 문제를 제기하십시오.

해당 지역에서 모든 모델을 사용할 수있는 것은 아닙니다.

내 ECR 이미지를 만들고 사용할 수 있습니까?

예, 저장소 src/Dockerfile 복제하고 컨테이너 이미지를 직접 구축 한 다음 ECR Repo로 밀어 넣을 수 있습니다. scripts/push-to-ecr.sh 사용할 수 있습니다

배포하기 전에 CloudFormation 템플릿의 Repo URL을 교체하십시오.

로컬로 실행할 수 있습니까?

예,이를 로컬로 실행할 수 있습니다.

API 기본 URL은 http://localhost:8000/api/v1 처럼 보일 것입니다.

프록시 API를 사용하여 성능 희생 또는 대기 시간이 증가합니다.

AWS SDK 호출과 비교하여 참조 된 아키텍처는 추가 대기 시간을 응답 할 수 있으므로 자신의 것을 테스트하고 테스트 할 수 있습니다.

또한 Lambda Web Adapter + Function URL (예제)을 사용하여 Alb 또는 AWS Fargate를 교체하여 Lambda를 대체하여 스트리밍 응답에 대한 성능을 향상시킬 수 있습니다.

Sagemaker 모델을 지원할 계획이 있습니까?

현재 Sagemaker 모델을 지원할 계획은 없습니다. 고객의 수요가 발생하면 변경 될 수 있습니다.

기반암 사용자 정의 모델을 지원할 계획이 있습니까?

프로비저닝 처리량이있는 미세 조정 모델 및 모델은 현재 지원되지 않습니다. 필요한 경우 저장소를 복제하고 사용자 정의 할 수 있습니다.

업그레이드하는 방법?

최신 기능을 사용하려면 CloudFormation 스택을 재배치 할 필요가 없습니다. 최신 이미지를 가져와야합니다.

그렇게하려면 배포 한 버전에 따라 다릅니다.

Lambda 버전 : AWS Lambda 콘솔로 이동하여 Lambda 기능을 찾은 다음 Deploy new image 버튼을 찾아 클릭하고 저장을 클릭하십시오.
FARGATE 버전 : ECS 콘솔로 이동하고 ECS 클러스터를 클릭하고 Tasks 탭으로 이동하고 실행중인 유일한 작업을 선택하고 Stop selected 클릭합니다. 최신 이미지가있는 새로운 작업이 자동으로 시작됩니다.

보안

자세한 내용은 기여를 참조하십시오.

특허

이 라이브러리는 MIT-0 라이센스에 따라 라이센스가 부여됩니다. 라이센스 파일을 참조하십시오.

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-03-02
크기 515.58KB
출처 Github

bedrock access gateway

기반암 액세스 게이트웨이

변화를 깨뜨립니다

개요

시작하세요

전제 조건

건축학

전개

SDK/API 사용

기반암 교차 지역 추론

다른 예

Autogen

랭케인

FAQ

프라이버시에 대해

애플리케이션로드 밸런서 대신 API 게이트웨이를 사용하지 않는 이유는 무엇입니까?

어떤 지역이 지원됩니까?

내 ECR 이미지를 만들고 사용할 수 있습니까?

로컬로 실행할 수 있습니까?

프록시 API를 사용하여 성능 희생 또는 대기 시간이 증가합니다.

Sagemaker 모델을 지원할 계획이 있습니까?

기반암 사용자 정의 모델을 지원할 계획이 있습니까?

업그레이드하는 방법?

보안

특허

stardew access

Minecraft bedrock cracked

액세스 2007 VBA 가이드

Access 2007 초보자 요령 매뉴얼

Access 2003 VBA 프로그래머 참고서

Asp 액세스 쿼리 분석기

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

chat.petals.dev

Sunamu

waymo open dataset

termwind

wp functions