Unduh bedrock access gateway - Unduh Kode Sumber bedrock access gateway

bedrock access gateway

Kode sumber lainnya

1.0.0

Unduh

中文

Gateway Akses Bedrock

API RESTful yang kompatibel dengan Openai untuk Amazon Bedrock

Melanggar perubahan

Kode sumber direfaktor dengan API Converse oleh Bedrock baru yang menyediakan dukungan asli dengan panggilan alat.

Jika Anda menghadapi masalah, silakan angkat masalah.

Ringkasan

Amazon Bedrock menawarkan berbagai model pondasi (seperti Claude 3 Opus/Sonnet/Haiku, Llama 2/3, Mistral/Mixtral, dll.) Dan serangkaian kemampuan luas bagi Anda untuk membangun aplikasi AI generatif. Periksa halaman pendaratan Amazon Bedrock untuk informasi tambahan.

Terkadang, Anda mungkin memiliki aplikasi yang dikembangkan menggunakan OpenAI API atau SDK, dan Anda ingin bereksperimen dengan Amazon Bedrock tanpa memodifikasi basis kode Anda. Atau Anda mungkin hanya ingin mengevaluasi kemampuan model -model fondasi ini dalam alat -alat seperti Autogen dll. Nah, repositori ini memungkinkan Anda untuk mengakses model Amazon Bedrock dengan mulus melalui OpenAI API dan SDK, memungkinkan Anda untuk menguji model ini tanpa perubahan kode.

Jika Anda menemukan repositori github ini berguna, silakan pertimbangkan untuk memberikan bintang gratis untuk menunjukkan apresiasi dan dukungan Anda untuk proyek tersebut.

Fitur:

Dukungan Respon Streaming Melalui Acara Sersent Server (SSE)
API Model Dukungan
Dukungan API Penyelesaian Obrolan
Panggilan Alat Dukungan ( Baru )
Dukungan Embedding API ( Baru )
Dukung Multimodal API ( Baru )
Dukung inferensi lintas wilayah ( baru )

Silakan periksa Panduan Penggunaan untuk detail lebih lanjut tentang cara menggunakan API baru.

CATATAN: API Penyelesaian Teks Legacy tidak didukung, Anda harus mengubah untuk menggunakan API penyelesaian obrolan.

Model Amazon Bedrock yang Didukung Keluarga:

Antropik Claude 2/3 (haiku / soneta / opus) / 3,5 soneta
Meta llama 2/3
Mistral / Mixtral
Perintah cohere r / r+
Menyematkan kohere

Anda dapat menghubungi API models untuk mendapatkan daftar lengkap ID model yang didukung.

Catatan: Model default diatur ke anthropic.claude-3-sonnet-20240229-v1:0 yang dapat diubah melalui variabel lingkungan Lambda ( DEFAULT_MODEL ).

Mulai

Prasyarat

Pastikan Anda telah bertemu di bawah ini prasyarat:

Akses ke model Amazon Bedrock Foundation.

Untuk informasi lebih lanjut tentang cara meminta akses model, silakan merujuk ke Panduan Pengguna Amazon Bedrock (Siapkan> Model Access)

Arsitektur

Diagram berikut menggambarkan arsitektur referensi. Perhatikan bahwa itu juga termasuk VPC baru dengan dua subnet publik hanya untuk penyeimbang beban aplikasi (ALB).

Anda juga dapat memilih untuk menggunakan AWS Fargate di belakang ALB, bukan AWS Lambda, perbedaan utamanya adalah latensi byte pertama untuk respons streaming (Fargate lebih rendah).

Atau, Anda dapat menggunakan URL fungsi lambda untuk menggantikan ALB, lihat contoh

Penyebaran

Harap ikuti langkah -langkah di bawah ini untuk menggunakan API Proxy Bedrock ke akun AWS Anda. Hanya mendukung daerah di mana Amazon Bedrock tersedia (seperti us-west-2 ). Penempatan akan memakan waktu sekitar 3-5 menit .

Langkah 1: Buat kunci API khusus Anda sendiri (opsional)

Catatan: Langkah ini adalah menggunakan string apa pun (tanpa spasi) Anda ingin membuat kunci API khusus (kredensial) yang akan digunakan untuk mengakses API proxy nanti. Kunci ini tidak harus cocok dengan kunci OpenAI Anda yang sebenarnya, dan Anda tidak perlu memiliki kunci API OpenAI. Dianjurkan agar Anda mengambil langkah ini dan memastikan bahwa Anda menjaga kunci dan pribadi.

Buka konsol AWS Management dan navigasikan ke Layanan Manajer Sistem.
Di panel navigasi kiri, klik "Parameter Store".
Klik tombol "Buat Parameter".
Di jendela "Buat Parameter", pilih opsi berikut:
- Nama: Masukkan nama deskriptif untuk parameter Anda (misalnya, "bedrockproxyapey").
- Deskripsi: Secara opsional, berikan deskripsi untuk parameter.
- Tingkat: Pilih Standar .
- Jenis: Pilih Securestring .
- Nilai: string apa pun (tanpa spasi).
Klik "Buat Parameter".
Buat catatan nama parameter yang Anda gunakan (misalnya, "bedrockproxyapey"). Anda akan membutuhkan ini di langkah berikutnya.

Langkah 2: Menyebarkan tumpukan CloudFormation

Masuk ke Konsol Manajemen AWS, beralih ke wilayah tersebut untuk menggunakan tumpukan CloudFormation ke.
Klik tombol berikut untuk meluncurkan tumpukan CloudFormation di wilayah itu. Pilih salah satu dari yang berikut:
- Alb + Lambda
- Alb + Fargate
Klik "Next".
Pada halaman "Tentukan Detail Stack", berikan informasi berikut:
- Nama tumpukan: Ubah nama tumpukan jika diperlukan.
- APIKEEPARAM (Jika Anda mengatur kunci API di Langkah 1): Masukkan nama parameter yang Anda gunakan untuk menyimpan kunci API (misalnya, BedrockProxyAPIKey ). Jika Anda tidak mengatur kunci API, biarkan bidang ini kosong. Klik "Next".
Pada halaman "Configure Stack Options", Anda dapat meninggalkan pengaturan default atau menyesuaikannya sesuai dengan kebutuhan Anda.
Klik "Next".
Pada halaman "Tinjau", tinjau detail tumpukan yang akan Anda buat. Periksa kotak centang "Saya mengakui bahwa AWS CloudFormation dapat membuat IAM Resources" di bagian bawah.
Klik "Buat Stack".

Hanya itu saja! ? Setelah dikerahkan, klik CloudFormation Stack dan buka tab Outputs , Anda dapat menemukan URL dasar API dari APIBaseUrl , nilainya akan terlihat seperti http://xxxx.xxx.elb.amazonaws.com/api/v1 .

Penggunaan SDK/API

Yang Anda butuhkan hanyalah kunci API dan URL basis API. Jika Anda tidak mengatur kunci Anda sendiri, maka kunci API default ( bedrock ) akan digunakan.

Sekarang, Anda dapat mencoba API proxy. Katakanlah Anda ingin menguji model Sonnet Claude 3 (Model ID: anthropic.claude-3-sonnet-20240229-v1:0 ) ...

Contoh Penggunaan API

 export OPENAI_API_KEY= < API key >
export OPENAI_BASE_URL= < API base url >
# For older versions
# https://github.com/openai/openai-python/issues/624
export OPENAI_API_BASE= < API base url >

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "anthropic.claude-3-sonnet-20240229-v1:0",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

Contoh Penggunaan SDK

 from openai import OpenAI

client = OpenAI ()
completion = client . chat . completions . create (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    messages = [{ "role" : "user" , "content" : "Hello!" }],
)

print ( completion . choices [ 0 ]. message . content )

Silakan periksa Panduan Penggunaan untuk detail lebih lanjut tentang cara menggunakan embedding API, Multimodal API, dan panggilan alat.

Bedrock Cross-Region Inference

Inferensi lintas wilayah mendukung mengakses model yayasan di seluruh wilayah, yang memungkinkan pengguna untuk memanggil model yang di-host di berbagai daerah AWS untuk inferensi. Keuntungan utama:

Peningkatan ketersediaan : Menyediakan redundansi regional dan toleransi kesalahan yang ditingkatkan. Ketika masalah terjadi di wilayah utama, layanan dapat gagal ke daerah cadangan, memastikan ketersediaan layanan yang berkelanjutan dan kesinambungan bisnis.
Pengurangan latensi : Memungkinkan pemilihan daerah yang secara geografis paling dekat dengan pengguna, mengoptimalkan jalur jaringan dan mengurangi waktu transmisi, menghasilkan pengalaman pengguna dan waktu respons yang lebih baik.
Kinerja dan kapasitas yang lebih baik : Menerapkan penyeimbangan beban untuk mendistribusikan tekanan permintaan, memberikan kapasitas dan throughput layanan yang lebih besar, dan menangani lonjakan lalu lintas yang lebih baik.
Fleksibilitas : Memungkinkan pemilihan model dari daerah yang berbeda berdasarkan persyaratan, memenuhi persyaratan kepatuhan regional tertentu, dan memungkinkan alokasi dan manajemen sumber daya yang lebih fleksibel.
Manfaat Biaya : Memungkinkan pemilihan daerah yang lebih hemat biaya, mengurangi biaya operasional secara keseluruhan melalui optimasi sumber daya, dan meningkatkan efisiensi pemanfaatan sumber daya.

Harap periksa inferensi lintas-wilayah Bedrock

Batasan: Saat ini, Gateway Akses Bedrock hanya mendukung inferensi lintas wilayah untuk model-model berikut:

Claude 3 haiku
Claude 3 Opus
Claude 3 Sonnet
Claude 3.5 sonnet
Meta llama 3.1 8b Instruksi
Meta llama 3.1 70b menginstruksikan

Prasyarat:

Kebijakan IAM harus memungkinkan akses lintas wilayah, penelepon membutuhkan izin untuk mengakses model dan profil inferensi di kedua wilayah (ditambahkan dalam templat CloudFormation)
Akses model harus diaktifkan di kedua wilayah, yang didefinisikan dalam profil inferensi

Contoh Penggunaan API:

Untuk menggunakan inferensi cross-region batuan dasar, Anda menyertakan profil inferensi saat menjalankan inferensi model dengan menentukan ID profil inferensi sebagai modelid, seperti us.anthropic.claude-3-5-sonnet-20240620-v1:0

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "us.anthropic.claude-3-5-sonnet-20240620-v1:0",
    "max_tokens": 2048,
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

Contoh lainnya

Autogen

Di bawah ini adalah gambar pengaturan model di Autogen Studio.

Model autogen

Langchain

Pastikan Anda menggunakan ChatOpenAI(...) alih -alih OpenAI(...)

 # pip install langchain-openai
import os

from langchain . chains import LLMChain
from langchain . prompts import PromptTemplate
from langchain_openai import ChatOpenAI

chat = ChatOpenAI (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    temperature = 0 ,
    openai_api_key = os . environ [ 'OPENAI_API_KEY' ],
    openai_api_base = os . environ [ 'OPENAI_BASE_URL' ],
)

template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate . from_template ( template )
llm_chain = LLMChain ( prompt = prompt , llm = chat )

question = "What NFL team won the Super Bowl in the year Justin Beiber was born?"
response = llm_chain . invoke ( question )
print ( response )

FAQ

Tentang privasi

Aplikasi ini tidak mengumpulkan data Anda. Selain itu, tidak mencatat permintaan atau tanggapan apa pun secara default.

Mengapa tidak menggunakan API Gateway alih -alih penyeimbang beban aplikasi?

Jawaban singkatnya adalah bahwa API Gateway tidak mendukung Events-Sent Events (SSE) untuk respons streaming.

Daerah mana yang didukung?

Solusi ini hanya mendukung daerah di mana Amazon Bedrock tersedia, seperti saat ini, di bawah ini adalah daftarnya.

US East (N. Virginia): US-East-1
US West (Oregon): US-West-2
Asia Pasifik (Singapura): AP-Southeast-1
Asia Pasifik (Sydney): AP-Southeast-2
Asia Pasifik (Tokyo): AP-Northeast-1
Eropa (Frankfurt): EU-Central-1
Eropa (Paris): UE-West-3

Secara umum, semua wilayah yang didukung Amazon Bedrock juga akan didukung, jika tidak, silakan angkat masalah di GitHub.

Perhatikan bahwa tidak semua model tersedia di wilayah tersebut.

Dapatkah saya membangun dan menggunakan gambar ECR saya sendiri

Ya, Anda dapat mengkloning repo dan membangun gambar wadah sendiri ( src/Dockerfile ) dan kemudian mendorong ke repo ECR Anda. Anda dapat menggunakan scripts/push-to-ecr.sh

Ganti URL repo di templat CloudFormation sebelum Anda menggunakan.

Dapatkah saya menjalankan ini secara lokal

Ya, Anda dapat menjalankan ini secara lokal.

URL dasar API harus terlihat seperti http://localhost:8000/api/v1 .

Pengorbanan kinerja atau peningkatan latensi dengan menggunakan API proxy

Dibandingkan dengan panggilan AWS SDK, arsitektur yang direferensikan akan membawa latensi tambahan pada respons, Anda dapat mencoba dan mengujinya sendiri.

Juga, Anda dapat menggunakan Lambda Web Adapter + URL fungsi (lihat contoh) untuk menggantikan ALB atau AWS Fargate untuk menggantikan Lambda untuk mendapatkan kinerja yang lebih baik pada respons streaming.

Adakah rencana untuk mendukung model Sagemaker?

Saat ini, tidak ada rencana untuk mendukung model Sagemaker. Ini dapat berubah asalkan ada permintaan dari pelanggan.

Adakah rencana untuk mendukung model kustom Bedrock?

Model dan model yang disempurnakan dengan throughput yang disediakan saat ini tidak didukung. Anda dapat mengkloning repo dan membuat kustomisasi jika diperlukan.

Bagaimana cara meningkatkan?

Untuk menggunakan fitur -fitur terbaru, Anda tidak perlu menggunakan kembali tumpukan CloudFormation. Anda hanya perlu menarik gambar terbaru.

Untuk melakukannya, tergantung pada versi mana yang Anda gunakan:

Versi Lambda : Pergi ke konsol AWS Lambda, temukan fungsi Lambda, lalu temukan dan klik Tombol Deploy new image dan klik Simpan.
Versi Fargate : Pergi ke ECS Console, klik ECS Cluster, pergi tab Tasks , pilih satu -satunya tugas yang berjalan dan cukup klik Stop selected . Tugas baru dengan gambar terbaru akan dimulai secara otomatis.