Загрузка bedrock access gateway Download - Загрузка исходного кода bedrock access gateway

bedrock access gateway

Другой исходный код

1.0.0

Скачать

中文

Враща доступа коренной породы

OpenAI-совместимые API RESTFUL для Amazon Bedrock

Нарушение изменений

Исходный код рефактируется новым API Converse API By Bedrock, которая обеспечивает собственную поддержку с помощью инструментов.

Если вы сталкиваетесь с какими -либо проблемами, поднимите проблему.

Обзор

Amazon Bedrock предлагает широкий спектр моделей фундамента (такие как Claude 3 Opus/Sonnet/Haiku, Llama 2/3, Mistral/Mixtral и т. Д.), И широкий набор возможностей для создания генеративных применений ИИ. Проверьте целевую страницу Amazon Bedrock для получения дополнительной информации.

Иногда у вас могут быть приложения, разработанные с использованием API или SDK OpenAI, и вы хотите экспериментировать с Amazon Bendrock, не изменяя кодовую базу. Или вы можете просто захотеть оценить возможности этих моделей фундамента в таких инструментах, как Autogen и т. Д. Что ж, этот репозиторий позволяет вам беспрепятственно получить доступ к моделям Amazon Bendrock через API и SDK Openai, что позволяет вам протестировать эти модели без изменений кода.

Если вы найдете этот репозиторий GitHub полезным, пожалуйста, рассмотрите возможность предоставить ему бесплатную звезду, чтобы показать свою признательность и поддержку проекту.

Функции:

Поддержка потокового ответа через серверные события (SSE)
Поддержка модели API
API -интерфейс заполнения чата поддержки
Вызов инструмента поддержки ( новый )
Поддержка встраивания API ( новый )
Поддержать мультимодальный API ( новый )
Поддержка перекрестного вывода ( новый )

Пожалуйста, проверьте руководство по использованию для получения более подробной информации о том, как использовать новые API.

Примечание. API завершения устаревшего текста не поддерживается, вам следует изменить, чтобы использовать API завершения чата.

Поддержал Amazon Bedrock Models Family:

Антропический Клод 2/3 (Хайку / Сонет / Опус) / 3.5 Сонет
Meta llama 2/3
Mistral / Mixtral
Команда Cohere R / R+
Внедрение

Вы можете позвонить в API models , чтобы получить полный список поддерживаемых идентификаторов моделей.

ПРИМЕЧАНИЕ. Модель по умолчанию установлена на anthropic.claude-3-sonnet-20240229-v1:0 , который можно изменить с помощью переменных среды Lambda ( DEFAULT_MODEL ).

Начните

Предварительные условия

Пожалуйста, убедитесь, что вы встретили ниже предварительные условия:

Доступ к моделям фонда Amazon Bedrock.

Для получения дополнительной информации о том, как запросить доступ к модели, пожалуйста, обратитесь к Руководству пользователя Amazon Bedrock (Setule> Model Access)

Архитектура

Следующая диаграмма иллюстрирует эталонную архитектуру. Обратите внимание, что он также включает в себя новый VPC с двумя публичными подсетизаторами только для балансировщика нагрузки приложения (ALB).

Вы также можете использовать AWS Fargate за ALB вместо AWS Lambda, основным отличием является задержка первого байта для потокового отклика (FARGATE ниже).

В качестве альтернативы, вы можете использовать URL Function Function для замены ALB, см. Пример

Развертывание

Пожалуйста, следуйте приведенным ниже шагам, чтобы развернуть APIS Proxy Proxy Proxy API в своей учетной записи AWS. Только поддерживает регионы, где доступен Amazon Bedrock (например us-west-2 ). Развертывание займет около 3-5 минут .

Шаг 1: Создайте свой собственный ключ API (необязательно)

Примечание. Этот шаг состоит в том, чтобы использовать любую строку (без пробелов), которые вы хотите создать для создания пользовательского ключа API (учетных данных), который будет использоваться для доступа к прокси -API позже. Этот ключ не должен соответствовать вашему фактическому клавишу Openai, и вам не нужно иметь ключ API OpenAI. Рекомендуется сделать этот шаг и убедиться, что вы сохраняете ключ безопасным и частным.

Откройте консоль управления AWS и перейдите к службе Systems Manager.
На левой навигационной панели нажмите «Store Parameters».
Нажмите кнопку «Создать параметр».
В окне «Создать параметр» выберите следующие параметры:
- Имя: введите описательное имя для вашего параметра (например, "Bedrockproxyapikey").
- Описание: необязательно, предоставьте описание для параметра.
- Уровень: выберите Стандарт .
- Тип: выберите Securestring .
- Значение: любая строка (без пробелов).
Нажмите «Создать параметр».
Запишите название параметра, которое вы использовали (например, «Bedrockproxyapikey»). Вам понадобится это на следующем шаге.

Шаг 2: развернуть стек CloudFormation

Войдите в консоли управления AWS, переключитесь на регион, чтобы развернуть стек CloudFormation.
Нажмите следующую кнопку, чтобы запустить стек CloudFormation в этом регионе. Выберите один из следующих:
- Альб + Ламбда
- Альб + Фаргейт
Нажмите «Далее».
На странице «Укажите информацию о стеке», предоставьте следующую информацию:
- Имя стека: Измените имя стека, если это необходимо.
- Apikeyparam (если вы настраиваете клавишу API на шаге 1): введите имя параметра, которое вы использовали для хранения клавиши API (например, BedrockProxyAPIKey ). Если вы не настроили ключ API, оставьте это поле пустым. Нажмите «Далее».
На странице «Настроить параметры стека» вы можете оставить настройки по умолчанию или настроить их в соответствии с вашими потребностями.
Нажмите «Далее».
На странице «Обзор» просмотрите детали стека, который вы собираетесь создать. Проверьте флажок «Я признаю, что AWS CloudFormation может создать IAM Resources» внизу.
Нажмите «Создать стек».

Вот и все! ? После развертывания щелкните стек CloudFormation и перейдите на вкладку «Выходные» , вы можете найти URL -адрес базы API от APIBaseUrl , значение должно выглядеть как http://xxxx.xxx.elb.amazonaws.com/api/v1 .

Использование SDK/API

Все, что вам нужно, это ключ API и URL -адрес базы API. Если вы не настроили свой собственный ключ, то будет использоваться ключ API по умолчанию ( bedrock ).

Теперь вы можете попробовать прокси -API. Допустим, вы хотите проверить модель Claude 3 Sonnet (ID модели: anthropic.claude-3-sonnet-20240229-v1:0 ) ...

Пример использования API

 export OPENAI_API_KEY= < API key >
export OPENAI_BASE_URL= < API base url >
# For older versions
# https://github.com/openai/openai-python/issues/624
export OPENAI_API_BASE= < API base url >

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "anthropic.claude-3-sonnet-20240229-v1:0",
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

Пример использования SDK

 from openai import OpenAI

client = OpenAI ()
completion = client . chat . completions . create (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    messages = [{ "role" : "user" , "content" : "Hello!" }],
)

print ( completion . choices [ 0 ]. message . content )

Пожалуйста, проверьте Руководство по использованию для получения более подробной информации о том, как использовать API Embedding API, мультимодальный API и инструмент.

Крестный перекрестный вывод

Межрегистрирование вывода поддерживает доступ к моделям фундамента в разных регионах, что позволяет пользователям вызывать модели, размещенные в различных регионах AWS для вывода. Основные преимущества:

Улучшенная доступность : обеспечивает региональную избыточность и повышенную устойчивость к разломам. Когда проблемы возникают в основном регионе, услуги могут отказаться от резервного копирования регионов, обеспечивая непрерывную доступность обслуживания и непрерывность бизнеса.
Снижение задержки : позволяет выбирать регионы, географически ближайшие к пользователям, оптимизировать сетевые пути и сокращать время передачи, что приводит к лучшему опыту пользователя и времени отклика.
Лучшая производительность и пропускная способность : реализует балансировку нагрузки для распределения давления запроса, обеспечивает большую способность обслуживания и пропускную способность, а также лучше обрабатывает всплески трафика.
Гибкость : позволяет выбирать модели из разных регионов на основе требований, соответствовать конкретным требованиям регионального соответствия и обеспечивает более гибкое распределение ресурсов и управление.
Затраты : обеспечивает выбор более экономически эффективных регионов, снижает общие эксплуатационные затраты за счет оптимизации ресурсов и повышает эффективность использования ресурсов.

Пожалуйста, проверьте поперечный вывод Bedrock Cross Region

Ограничение: В настоящее время шлюз доступа коренной породы поддерживает перекрестный вывод только для следующих моделей:

Клод 3 Хайку
Клод 3 Опус
Клод 3 Сонет
Клод 3.5 Сонет
Meta llama 3.1 8b инструктируйте
Meta llama 3.1 70b

Предварительные условия:

Политика IAM должна разрешать перекрестный доступ, абонентам нуждаются в разрешениях для доступа к моделям и профилям вывода в обеих регионах (добавлено в шаблоне облачной информации)
Доступ модели должен быть включен в обеих регионах, которые определяются в профилях выводов

Пример использования API:

Чтобы использовать вывод по перекрестному региону коренной породы, вы включаете профиль вывода при выполнении вывода модели, указав идентификатор профиля вывода в качестве модели, такой как us.anthropic.claude-3-5-sonnet-20240620-v1:0

curl $OPENAI_BASE_URL /chat/completions 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer $OPENAI_API_KEY " 
  -d ' {
    "model": "us.anthropic.claude-3-5-sonnet-20240620-v1:0",
    "max_tokens": 2048,
    "messages": [
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  } '

Другие примеры

Автоген

Ниже приведено изображение настройки модели в Autogen Studio.

Автоген модель

Лангхейн

Убедитесь, что вы используете ChatOpenAI(...) вместо OpenAI(...)

 # pip install langchain-openai
import os

from langchain . chains import LLMChain
from langchain . prompts import PromptTemplate
from langchain_openai import ChatOpenAI

chat = ChatOpenAI (
    model = "anthropic.claude-3-sonnet-20240229-v1:0" ,
    temperature = 0 ,
    openai_api_key = os . environ [ 'OPENAI_API_KEY' ],
    openai_api_base = os . environ [ 'OPENAI_BASE_URL' ],
)

template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate . from_template ( template )
llm_chain = LLMChain ( prompt = prompt , llm = chat )

question = "What NFL team won the Super Bowl in the year Justin Beiber was born?"
response = llm_chain . invoke ( question )
print ( response )

Часто задаваемые вопросы

О конфиденциальности

Это приложение не собирает ни одного из ваших данных. Кроме того, он не регистрирует какие -либо запросы или ответы по умолчанию.

Почему бы не использовать API Gateway вместо балансировщика нагрузки приложения?

Короткий ответ заключается в том, что API Gateway не поддерживает события Server-Sent (SSE) для потокового ответа.

Какие регионы поддерживаются?

Это решение поддерживает только регионы, где доступен Amazon Bedrock, так как на данный момент ниже приведены список.

США Восток (Н. Вирджиния): США-восток-1
США Запад (Орегон): США-Запад-2
Азиатско-Тихоокеанский регион (Сингапур): AP-Southeast-1
Азиатско-Тихоокеанский регион (Сидней): AP-Southeast-2
Азиатско-Тихоокеанский регион (Токио): AP-Northeest-1
Европа (Франкфурт): ЕС-Центральный 1
Европа (Париж): ЕС-Вест-3

Вообще говоря, все регионы, которые поддерживает Amazon Bedrock, также будут поддерживать, если нет, пожалуйста, поднимите проблему в GitHub.

Обратите внимание, что не все модели доступны в этих регионах.

Могу ли я построить и использовать свое собственное изображение ECR

Да, вы можете клонировать репо и самостоятельно построить изображение контейнера ( src/Dockerfile ), а затем подтолкнуть к своему репо. Вы можете использовать scripts/push-to-ecr.sh

Замените URL -адрес в шаблоне CloudFormation, прежде чем развернуть.

Могу ли я запустить это на местном уровне

Да, вы можете запустить это на местном уровне.

URL -адрес базы API должен выглядеть как http://localhost:8000/api/v1 .

Любая жертва производительности или задержку с использованием прокси -APIS

Сравнивая с вызовом AWS SDK, ссылочная архитектура принесет дополнительную задержку в ответе, вы можете попробовать проверить это на собственном.

Кроме того, вы можете использовать URL -файл Lambda Web Adapter + функции (см. Пример), чтобы заменить ALB или AWS Fargate, чтобы заменить Lambda, чтобы повысить производительность при потоковой реакции.

Есть ли план поддержки моделей SageMaker?

В настоящее время нет плана поддержки моделей SageMaker. Это может измениться при условии, что от клиентов есть спрос.

Есть ли план поддержки моделей Bedrock Custom?

Тонко настроенные модели и модели с предоставленной пропускной способностью в настоящее время не поддерживаются. Вы можете клонировать репо и сделать настройку, если это необходимо.

Как обновить?

Чтобы использовать новейшие функции, вам не нужно перераспределить стек CloudFormation. Вам просто нужно вытащить последнее изображение.

Для этого зависит от того, какая версия вы развернули:

Lambda версия : перейдите в консоль AWS Lambda, найдите функцию Lambda, затем найдите и нажмите кнопку Deploy new image и нажмите «Сохранить».
Версия Fargate : перейдите в консоли ECS, нажмите кластер ECS, перейдите на вкладку Tasks », выберите единственную задачу, которая работает, и просто нажмите Stop selected меню». Новая задача с последним изображением начнется автоматически.