Скачать litellm - Скачать исходный код litellm

litellm

Другой исходный код

Скачать

? ЛайтLLM

Вызовите все API-интерфейсы LLM, используя формат OpenAI [Bedrock, Huggingface, VertexAI, TogetherAI, Azure, OpenAI, Groq и т. д.]

Прокси-сервер LiteLLM (шлюз LLM) | Хостинг-прокси (предварительная версия) | Корпоративный уровень

LiteLLM управляет:

Преобразование входных данных в конечные точки completion , embedding и image_generation поставщика.
Последовательный вывод, текстовые ответы всегда будут доступны по адресу ['choices'][0]['message']['content']
Логика повтора/резервного возврата в нескольких развертываниях (например, Azure/OpenAI) — Маршрутизатор
Установите бюджеты и ограничения ставок для каждого проекта, ключ API, модель Прокси-сервер LiteLLM (шлюз LLM)

Перейти к документации по прокси-серверу LiteLLM (шлюз LLM)
Перейти к поддерживаемым поставщикам LLM

? Стабильная версия: используйте образы Docker с тегом -stable . Перед публикацией они прошли 12-часовые нагрузочные тесты.

Поддержка большего количества провайдеров. Отсутствует поставщик или платформа LLM, отправьте запрос на добавление функции.

Использование ( Документация )

Важный

LiteLLM v1.0.0 теперь требует openai>=1.0.0 . Руководство по миграции здесь
LiteLLM v1.40.14+ теперь требует pydantic>=2.0.0 . Никаких изменений не требуется.

pip install litellm

 from litellm import completion
import os

## set ENV variables
os . environ [ "OPENAI_API_KEY" ] = "your-openai-key"
os . environ [ "COHERE_API_KEY" ] = "your-cohere-key"

messages = [{ "content" : "Hello, how are you?" , "role" : "user" }]

# openai call
response = completion ( model = "gpt-3.5-turbo" , messages = messages )

# cohere call
response = completion ( model = "command-nightly" , messages = messages )
print ( response )

Вызовите любую модель, поддерживаемую поставщиком, с помощью model=<provider_name>/<model_name> . Здесь могут быть подробности, специфичные для поставщика, поэтому для получения дополнительной информации обратитесь к документации поставщика.

Асинхронный (Документация)

 from litellm import acompletion
import asyncio

async def test_get_response ():
    user_message = "Hello, how are you?"
    messages = [{ "content" : user_message , "role" : "user" }]
    response = await acompletion ( model = "gpt-3.5-turbo" , messages = messages )
    return response

response = asyncio . run ( test_get_response ())
print ( response )

Потоковая передача (Документация)

liteLLM поддерживает обратную потоковую передачу ответа модели, stream=True чтобы получить в ответ потоковый итератор.
Потоковая передача поддерживается для всех моделей (Bedrock, Huggingface, TogetherAI, Azure, OpenAI и т. д.).

 from litellm import completion
response = completion ( model = "gpt-3.5-turbo" , messages = messages , stream = True )
for part in response :
    print ( part . choices [ 0 ]. delta . content or "" )

# claude 2
response = completion ( 'claude-2' , messages , stream = True )
for part in response :
    print ( part . choices [ 0 ]. delta . content or "" )

Наблюдаемость журналирования (Документация)

LiteLLM предоставляет предварительно определенные обратные вызовы для отправки данных в Lunary, Langfuse, DynamoDB, s3 Buckets, Helicone, Promptlayer, Traceloop, Athina, Slack.

 from litellm import completion

## set env variables for logging tools
os . environ [ "LUNARY_PUBLIC_KEY" ] = "your-lunary-public-key"
os . environ [ "HELICONE_API_KEY" ] = "your-helicone-auth-key"
os . environ [ "LANGFUSE_PUBLIC_KEY" ] = ""
os . environ [ "LANGFUSE_SECRET_KEY" ] = ""
os . environ [ "ATHINA_API_KEY" ] = "your-athina-api-key"

os . environ [ "OPENAI_API_KEY" ]

# set callbacks
litellm . success_callback = [ "lunary" , "langfuse" , "athina" , "helicone" ] # log input/output to lunary, langfuse, supabase, athina, helicone etc

#openai call
response = completion ( model = "gpt-3.5-turbo" , messages = [{ "role" : "user" , "content" : "Hi ? - i'm openai" }])

Прокси-сервер LiteLLM (шлюз LLM) – (Документация)

Отслеживайте расходы и балансируйте нагрузку в нескольких проектах

Хостинг-прокси (предварительная версия)

Прокси обеспечивает:

Хуки для авторизации
Хуки для логирования
Отслеживание затрат
Ограничение скорости

? Конечные точки прокси — Swagger Docs

Прокси-сервер для быстрого запуска — CLI

pip install ' litellm[proxy] '

Шаг 1. Запустите прокси-сервер Litellm.

$ litellm --model huggingface/bigcode/starcoder

# INFO: Proxy running on http://0.0.0.0:4000

Шаг 2. Отправьте запрос ChatCompletions на прокси

Важный

Используйте прокси-сервер LiteLLM с Langchain (Python, JS), OpenAI SDK (Python, JS), Anthropic SDK, Mistral SDK, LlamaIndex, Instructor, Curl

 import openai # openai v1.0.0+
client = openai . OpenAI ( api_key = "anything" , base_url = "http://0.0.0.0:4000" ) # set proxy to base_url
# request sent to model set on litellm proxy, `litellm --model`
response = client . chat . completions . create ( model = "gpt-3.5-turbo" , messages = [
    {
        "role" : "user" ,
        "content" : "this is a test request, write a short poem"
    }
])

print ( response )

Управление ключами прокси (Документация)

Подключите прокси к базе данных Postgres для создания ключей прокси.

 # Get the code
git clone https://github.com/BerriAI/litellm

# Go to folder
cd litellm

# Add the master key - you can change this after setup
echo ' LITELLM_MASTER_KEY="sk-1234" ' > .env

# Add the litellm salt key - you cannot change this after adding a model
# It is used to encrypt / decrypt your LLM API Key credentials
# We recommned - https://1password.com/password-generator/ 
# password generator to get a random hash for litellm salt key
echo ' LITELLM_SALT_KEY="sk-1234" ' > .env

source .env

# Start
docker-compose up

Пользовательский интерфейс в /ui на вашем прокси-сервере ui_3

Установите бюджеты и ограничения ставок для нескольких проектов POST /key/generate

Запрос

curl ' http://0.0.0.0:4000/key/generate ' 
--header ' Authorization: Bearer sk-1234 ' 
--header ' Content-Type: application/json ' 
--data-raw ' {"models": ["gpt-3.5-turbo", "gpt-4", "claude-2"], "duration": "20m","metadata": {"user": "[email protected]", "team": "core-infra"}} '

Ожидаемый ответ

{
    " key " : " sk-kdEXbIqZRwEeEiHwdg7sFA " , # Bearer token
    " expires " : " 2023-11-19T01:38:25.838000+00:00 " # datetime object
}

Поддерживаемые поставщики (документы)

Поставщик	Завершение	Потоковое вещание	Асинхронное завершение	Асинхронная потоковая передача	Асинхронное внедрение	Асинхронное создание изображений
опенай	✅	✅	✅	✅	✅	✅
лазурный	✅	✅	✅	✅	✅	✅
оу - мудрец	✅	✅	✅	✅	✅
оу - основа	✅	✅	✅	✅	✅
гугл — vertex_ai	✅	✅	✅	✅	✅	✅
Гугл – ладонь	✅	✅	✅	✅
Google AI Studio – Близнецы	✅	✅	✅	✅
мистраль ай апи	✅	✅	✅	✅	✅
Cloudflare AI-работники	✅	✅	✅	✅
согласовываться	✅	✅	✅	✅	✅
антропный	✅	✅	✅	✅
расширять возможности	✅	✅	✅	✅
обнимающее лицо	✅	✅	✅	✅	✅
копировать	✅	✅	✅	✅
вместе_ай	✅	✅	✅	✅
openrouter	✅	✅	✅	✅
ай21	✅	✅	✅	✅
бастен	✅	✅	✅	✅
вллм	✅	✅	✅	✅
nlp_cloud	✅	✅	✅	✅
алеф альфа	✅	✅	✅	✅
лепестки	✅	✅	✅	✅
оллама	✅	✅	✅	✅	✅
глубокая инфра	✅	✅	✅	✅
недоумение-ай	✅	✅	✅	✅
Грок ИИ	✅	✅	✅	✅
Глубокий поиск	✅	✅	✅	✅
любой масштаб	✅	✅	✅	✅
IBM — watsonx.ai	✅	✅	✅	✅	✅
путешествие ИИ					✅
xinference [Вывод Xorbits]					✅
Дружественный AI	✅	✅	✅	✅

Прочтите документацию

Содействие

Чтобы внести свой вклад: клонируйте репозиторий локально -> Внесите изменения -> Отправьте PR с изменением.

Вот как можно изменить репозиторий локально: Шаг 1. Клонируйте репозиторий.

 git clone https://github.com/BerriAI/litellm.git

Шаг 2. Перейдите в проект и установите зависимости:

 cd litellm
poetry install -E extra_proxy -E proxy

Шаг 3. Проверьте изменения:

 cd litellm/tests # pwd: Documents/litellm/litellm/tests
poetry run flake8
poetry run pytest .

Шаг 4. Отправьте PR со своими изменениями! ?

вставьте вилку в свой репозиторий GitHub
отправить PR оттуда

Предприятие

Для компаний, которым нужна лучшая безопасность, управление пользователями и профессиональная поддержка.

Поговорите с основателями

Это охватывает:

✅ Возможности коммерческой лицензии LiteLLM:
✅ Приоритизация функций
✅ Пользовательские интеграции
✅ Профессиональная поддержка - выделенный дискорд + слабина
✅ Индивидуальные соглашения об уровне обслуживания
✅ Безопасный доступ с помощью единого входа

Поддержка/разговор с основателями

Запланировать демонстрацию?
Раздор в сообществе?
Наши цифры? +1 (770) 8783-106 / +1 (412) 618-6238
Наша электронная почта ✉️ [email protected] / [email protected]

Почему мы построили это

Необходимость простоты : наш код стал чрезвычайно усложняться при управлении и трансляции вызовов между Azure, OpenAI и Cohere.

Авторы

Расширять

Дополнительная информация

Версия
Тип Другой исходный код
Время обновления 2024-11-09
размер 50MB
От Github

Связанные приложения

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30

litellm

? ЛайтLLM

Прокси-сервер LiteLLM (шлюз LLM) | Хостинг-прокси (предварительная версия) | Корпоративный уровень

Использование ( Документация )

Асинхронный (Документация)

Потоковая передача (Документация)

Наблюдаемость журналирования (Документация)

Прокси-сервер LiteLLM (шлюз LLM) – (Документация)

? Конечные точки прокси — Swagger Docs

Прокси-сервер для быстрого запуска — CLI

Шаг 1. Запустите прокси-сервер Litellm.

Шаг 2. Отправьте запрос ChatCompletions на прокси

Управление ключами прокси (Документация)

Запрос

Ожидаемый ответ

Поддерживаемые поставщики (документы)

Содействие

Предприятие

Поддержка/разговор с основателями

Почему мы построили это

Авторы

waymo open dataset

SmartTube

Sunamu

viptools for eslam

MySchedule.py

chat.petals.dev

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind