Загрузка ollama python - Загрузка исходного кода ollama python

ollama python

Питон

v0.4.4

Скачать

Библиотека Python Олламы

Библиотека Ollama Python обеспечивает самый простой способ интеграции проектов Python 3.8+ с Ollama.

Предварительные условия

Оллама должен быть установлен и запущен.
Извлеките модель для использования с библиотекой: ollama pull <model> , например ollama pull llama3.2
- Посетите сайт Ollama.com для получения дополнительной информации о доступных моделях.

Установить

pip install ollama

Использование

 from ollama import chat
from ollama import ChatResponse

response : ChatResponse = chat ( model = 'llama3.2' , messages = [
  {
    'role' : 'user' ,
    'content' : 'Why is the sky blue?' ,
  },
])
print ( response [ 'message' ][ 'content' ])
# or access fields directly from the response object
print ( response . message . content )

См. _types.py для получения дополнительной информации о типах ответов.

Потоковая передача ответов

Потоковую передачу ответов можно включить, stream=True .

 from ollama import chat

stream = chat (
    model = 'llama3.2' ,
    messages = [{ 'role' : 'user' , 'content' : 'Why is the sky blue?' }],
    stream = True ,
)

for chunk in stream :
  print ( chunk [ 'message' ][ 'content' ], end = '' , flush = True )

Пользовательский клиент

Пользовательский клиент может быть создан путем создания экземпляра Client или AsyncClient из ollama .

Все дополнительные аргументы ключевого слова передаются в httpx.Client .

 from ollama import Client
client = Client (
  host = 'http://localhost:11434' ,
  headers = { 'x-some-header' : 'some-value' }
)
response = client . chat ( model = 'llama3.2' , messages = [
  {
    'role' : 'user' ,
    'content' : 'Why is the sky blue?' ,
  },
])

Асинхронный клиент

Класс AsyncClient используется для выполнения асинхронных запросов. Его можно настроить с теми же полями, что и класс Client .

 import asyncio
from ollama import AsyncClient

async def chat ():
  message = { 'role' : 'user' , 'content' : 'Why is the sky blue?' }
  response = await AsyncClient (). chat ( model = 'llama3.2' , messages = [ message ])

asyncio . run ( chat ())

stream=True изменяет функции для возврата асинхронного генератора Python:

 import asyncio
from ollama import AsyncClient

async def chat ():
  message = { 'role' : 'user' , 'content' : 'Why is the sky blue?' }
  async for part in await AsyncClient (). chat ( model = 'llama3.2' , messages = [ message ], stream = True ):
    print ( part [ 'message' ][ 'content' ], end = '' , flush = True )

asyncio . run ( chat ())

API

API библиотеки Ollama Python разработан на основе Ollama REST API.

Чат

 ollama . chat ( model = 'llama3.2' , messages = [{ 'role' : 'user' , 'content' : 'Why is the sky blue?' }])

Генерировать

 ollama . generate ( model = 'llama3.2' , prompt = 'Why is the sky blue?' )

Список

 ollama . list ()

Показывать

 ollama . show ( 'llama3.2' )

Создавать

 modelfile = '''
FROM llama3.2
SYSTEM You are mario from super mario bros.
'''

ollama . create ( model = 'example' , modelfile = modelfile )

Копировать

 ollama . copy ( 'llama3.2' , 'user/llama3.2' )

Удалить

 ollama . delete ( 'llama3.2' )

Тянуть

 ollama . pull ( 'llama3.2' )

Толкать

 ollama . push ( 'user/llama3.2' )

Встроить

 ollama . embed ( model = 'llama3.2' , input = 'The sky is blue because of rayleigh scattering' )

Встроить (пакетно)

 ollama . embed ( model = 'llama3.2' , input = [ 'The sky is blue because of rayleigh scattering' , 'Grass is green because of chlorophyll' ])

пс

 ollama . ps ()

Ошибки

Ошибки возникают, если запросы возвращают статус ошибки или если во время потоковой передачи обнаруживается ошибка.

 model = 'does-not-yet-exist'

try :
  ollama . chat ( model )
except ollama . ResponseError as e :
  print ( 'Error:' , e . error )
  if e . status_code == 404 :
    ollama . pull ( model )