Download uni api - Download de código fonte da uni api

uni-api

Inglês | chinês

Introdução

Para uso pessoal, um/novo-api é muito complexo, com muitos recursos comerciais que os indivíduos não precisam. Se você não deseja uma interface de front-end complicada e preferir suporte para mais modelos, você pode experimentar o Uni-API. Este é um projeto que unifica o gerenciamento de grandes APIs de modelo de linguagem, permitindo que você ligue para vários serviços de back -end através de uma única interface de API unificada, convertendo todos em formato OpenAI e suportando o balanceamento de carga. Os serviços de back -end atualmente suportados incluem: OpenAI, Antrópico, Gêmeos, Vertex, Coere, Groq, Cloudflare, OpenRouter e muito mais.

Características

Nenhum arquivo de configuração puro e front-end, para configurar canais de API. Você pode executar sua própria estação de API apenas escrevendo um arquivo, e a documentação possui um guia de configuração detalhado, adequado para iniciantes.
Gerenciamento unificado de vários serviços de back -end, fornecedores de suporte como OpenAI, Deepseek, OpenRouter e outras APIs no formato Openai. Suporta geração de imagem OpenAi Dalle-3.
Simultaneamente, suporta a IA antrópica, Gêmeos, Vertex, Coere, Groq, Cloudflare. O vértice suporta simultaneamente a API de Claude e Gêmeos.
Apoie o OpenAI, Anthropic, Gêmeos, vértice, as chamadas de função de ferramenta.
Apoie a API de reconhecimento de imagem nativa Openi, Antrópica, Gêmeos, Gêmeos.
Apoie quatro tipos de balanceamento de carga.
1. Suporta o balanceamento de carga ponderado no nível do canal, permitindo que as solicitações sejam distribuídas de acordo com diferentes pesos do canal. Não é ativado por padrão e requer configurar pesos de canal.
2. Apoie o balanceamento regional da carga da vértice e a alta concorrência, que podem aumentar a simultaneidade de Gêmeos e Claude até (número de APIs * Número de regiões) vezes. Ativado automaticamente sem configuração adicional.
3. Exceto pelo balanceamento de carga no nível da região da Região Vertex, todas as APIs suportam o balanceamento de carga seqüencial no nível do canal, melhorando a experiência de tradução imersiva. Não está ativado por padrão e requer configurar SCHEDULING_ALGORITHM como round_robin .
4. Suporte o balanceamento automático de carga de carga redonda-robin de nível de chave automática para várias teclas de API em um único canal.
Suportar a tentativa automática, quando uma resposta do canal da API falhar, tente novamente o próximo canal da API.
Resfriamento do canal de suporte: quando uma resposta do canal da API falhar, o canal será automaticamente excluído e resfriado por um período de tempo, e solicitações ao canal serão interrompidas. Após o término do período de resfriamento, o modelo será restaurado automaticamente até que falhe novamente, quando será resfriado novamente.
Suporte as configurações de tempo limite do modelo de granulação fina, permitindo diferentes durações de tempo limite para cada modelo.
Apoie o controle de permissão de granulação fina. Suporte usando curingas para definir modelos específicos disponíveis para canais -chave da API.
Limitação da taxa de suporte, você pode definir o número máximo de solicitações por minuto como um número inteiro, como 2/min, 2 vezes por minuto, 5/hora, 5 vezes por hora, 10/dia, 10 vezes por dia, 10/mês, 10 vezes por mês, 10/ano, 10 vezes por ano. O padrão é 60/min.
Suporta várias interfaces de formato OpenAI padrão: /v1/chat/completions , /v1/images/generations , /v1/audio/transcriptions , /v1/moderations , /v1/models .
Apoie a Open Modeation Moral Review, que pode realizar revisões morais das mensagens do usuário. Se forem encontradas mensagens inadequadas, uma mensagem de erro será retornada. Isso reduz o risco de a API de back -end ser proibida pelos provedores.

Método de uso

Para iniciar o Uni-API, um arquivo de configuração deve ser usado. Existem duas maneiras de começar com um arquivo de configuração:

O primeiro método é usar a variável de ambiente CONFIG_URL para preencher o URL do arquivo de configuração, que será baixado automaticamente quando o Uni-API iniciar.
O segundo método é montar um arquivo de configuração chamado api.yaml no contêiner.

Método 1: Monte o arquivo de configuração `api.yaml` para iniciar Uni-API

Você deve preencher o arquivo de configuração com antecedência para iniciar uni-api e deve usar um arquivo de configuração chamado api.yaml para iniciar uni-api . Abaixo está um exemplo do arquivo de configuração api.yaml mínimo que pode ser executado:

 providers :
  - provider : provider_name # Service provider name, such as openai, anthropic, gemini, openrouter, can be any name, required
    base_url : https://api.your.com/v1/chat/completions # Backend service API address, required
    api : sk-YgS6GTi0b4bEabc4C # Provider's API Key, required, automatically uses base_url and api to get all available models through the /v1/models endpoint.
  # Multiple providers can be configured here, each provider can configure multiple API Keys, and each API Key can configure multiple models.
api_keys :
  - api : sk-Pkj60Yf8JFWxfgRmXQFWyGtWUddGZnmi3KlvowmRWpWpQxx # API Key, user request uni-api requires API key, required
  # This API Key can use all models, that is, it can use all models in all channels set under providers, without needing to add available channels one by one.

Configuração avançada detalhada da api.yaml :

 providers :
  - provider : provider_name # Service provider name, such as openai, anthropic, gemini, openrouter, can be any name, required
    base_url : https://api.your.com/v1/chat/completions # Backend service API address, required
    api : sk-YgS6GTi0b4bEabc4C # Provider's API Key, required
    model : # Optional, if model is not configured, all available models will be automatically obtained through base_url and api via the /v1/models endpoint.
      - gpt-4o # Usable model name, required
      - claude-3-5-sonnet-20240620 : claude-3-5-sonnet # Rename model, claude-3-5-sonnet-20240620 is the provider's model name, claude-3-5-sonnet is the renamed name, you can use a simple name to replace the original complex name, optional
      - dall-e-3

  - provider : anthropic
    base_url : https://api.anthropic.com/v1/messages
    api : # Supports multiple API Keys, multiple keys automatically enable polling load balancing, at least one key, required
      - sk-ant-api03-bNnAOJyA-xQw_twAA
      - sk-ant-api02-bNnxxxx
    model :
      - claude-3-5-sonnet-20240620 : claude-3-5-sonnet # Rename model, claude-3-5-sonnet-20240620 is the provider's model name, claude-3-5-sonnet is the renamed name, you can use a simple name to replace the original complex name, optional
    tools : true # Whether to support tools, such as generating code, generating documents, etc., default is true, optional

  - provider : gemini
    base_url : https://generativelanguage.googleapis.com/v1beta # base_url supports v1beta/v1, only for Gemini model use, required
    api : # Supports multiple API Keys, multiple keys automatically enable polling load balancing, at least one key, required
      - AIzaSyAN2k6IRdgw123
      - AIzaSyAN2k6IRdgw456
      - AIzaSyAN2k6IRdgw789
    model :
      - gemini-1.5-pro
      - gemini-1.5-flash-exp-0827 : gemini-1.5-flash # After renaming, the original model name gemini-1.5-flash-exp-0827 cannot be used, if you want to use the original name, you can add the original name in the model, just add the line below to use the original name
      - gemini-1.5-flash-exp-0827 # Add this line, both gemini-1.5-flash-exp-0827 and gemini-1.5-flash can be requested
    tools : true
    preferences :
      api_key_rate_limit : 15/min # Each API Key can request up to 15 times per minute, optional. The default is 999999/min. Supports multiple frequency constraints: 15/min,10/day
      # api_key_rate_limit: # You can set different frequency limits for each model
      #   gemini-1.5-flash: 15/min,1500/day
      #   gemini-1.5-pro: 2/min,50/day
      #   default: 4/min # If the model does not set the frequency limit, use the frequency limit of default
      api_key_cooldown_period : 60 # Each API Key will be cooled down for 60 seconds after encountering a 429 error. Optional, the default is 0 seconds. When set to 0, the cooling mechanism is not enabled. When there are multiple API keys, the cooling mechanism will take effect.
      api_key_schedule_algorithm : round_robin # Set the request order of multiple API Keys, optional. The default is round_robin, and the optional values are: round_robin, random. It will take effect when there are multiple API keys. round_robin is polling load balancing, and random is random load balancing.
      model_timeout : # Model timeout, in seconds, default 100 seconds, optional
        gemini-1.5-pro : 10 # Model gemini-1.5-pro timeout is 10 seconds
        gemini-1.5-flash : 10 # Model gemini-1.5-flash timeout is 10 seconds
        default : 10 # Model does not have a timeout set, use the default timeout of 10 seconds, when requesting a model not in model_timeout, the timeout is also 10 seconds, if default is not set, uni-api will use the default timeout set by the environment variable TIMEOUT, the default timeout is 100 seconds
      proxy : socks5://[username]:[password]@[ip]:[port] # Proxy address, optional. Supports socks5 and http proxies, default is not used.

  - provider : vertex
    project_id : gen-lang-client-xxxxxxxxxxxxxx # Description: Your Google Cloud project ID. Format: String, usually composed of lowercase letters, numbers, and hyphens. How to obtain: You can find your project ID in the project selector of the Google Cloud Console.
    private_key : " -----BEGIN PRIVATE KEY----- n xxxxx n -----END PRIVATE " # Description: Private key for Google Cloud Vertex AI service account. Format: A JSON formatted string containing the private key information of the service account. How to obtain: Create a service account in Google Cloud Console, generate a JSON formatted key file, and then set its content as the value of this environment variable.
    client_email : [email protected] # Description: Email address of the Google Cloud Vertex AI service account. Format: Usually a string like "[email protected]". How to obtain: Generated when creating a service account, or you can view the service account details in the "IAM and Admin" section of the Google Cloud Console.
    model :
      - gemini-1.5-pro
      - gemini-1.5-flash
      - gemini-1.5-pro : gemini-1.5-pro-search # Only supports using the gemini-1.5-pro-search model to request uni-api when using the Vertex Gemini API, to automatically use the Google official search tool.
      - claude-3-5-sonnet@20240620 : claude-3-5-sonnet
      - claude-3-opus@20240229 : claude-3-opus
      - claude-3-sonnet@20240229 : claude-3-sonnet
      - claude-3-haiku@20240307 : claude-3-haiku
    tools : true
    notes : https://xxxxx.com/ # You can put the provider's website, notes, official documentation, optional

  - provider : cloudflare
    api : f42b3xxxxxxxxxxq4aoGAh # Cloudflare API Key, required
    cf_account_id : 8ec0xxxxxxxxxxxxe721 # Cloudflare Account ID, required
    model :
      - ' @cf/meta/llama-3.1-8b-instruct ' : llama-3.1-8b # Rename model, @cf/meta/llama-3.1-8b-instruct is the provider's original model name, must be enclosed in quotes, otherwise yaml syntax error, llama-3.1-8b is the renamed name, you can use a simple name to replace the original complex name, optional
      - ' @cf/meta/llama-3.1-8b-instruct ' # Must be enclosed in quotes, otherwise yaml syntax error

  - provider : other-provider
    base_url : https://api.xxx.com/v1/messages
    api : sk-bNnAOJyA-xQw_twAA
    model :
      - causallm-35b-beta2ep-q6k : causallm-35b
      - anthropic/claude-3-5-sonnet
    tools : false
    engine : openrouter # Force the use of a specific message format, currently supports gpt, claude, gemini, openrouter native format, optional

api_keys :
  - api : sk-KjjI60Yf0JFWxfgRmXqFWyGtWUd9GZnmi3KlvowmRWpWpQRo # API Key, required for users to use this service
    model : # Models that can be used by this API Key, required. Default channel-level polling load balancing is enabled, and each request model is requested in sequence according to the model configuration. It is not related to the original channel order in providers. Therefore, you can set different request sequences for each API key.
      - gpt-4o # Usable model name, can use all gpt-4o models provided by providers
      - claude-3-5-sonnet # Usable model name, can use all claude-3-5-sonnet models provided by providers
      - gemini/* # Usable model name, can only use all models provided by providers named gemini, where gemini is the provider name, * represents all models
    role : admin

  - api : sk-pkhf60Yf0JGyJxgRmXqFQyTgWUd9GZnmi3KlvowmRWpWqrhy
    model :
      - anthropic/claude-3-5-sonnet # Usable model name, can only use the claude-3-5-sonnet model provided by the provider named anthropic. Models with the same name from other providers cannot be used. This syntax will not match the model named anthropic/claude-3-5-sonnet provided by other-provider.
      - <anthropic/claude-3-5-sonnet> # By adding angle brackets on both sides of the model name, it will not search for the claude-3-5-sonnet model under the channel named anthropic, but will take the entire anthropic/claude-3-5-sonnet as the model name. This syntax can match the model named anthropic/claude-3-5-sonnet provided by other-provider. But it will not match the claude-3-5-sonnet model under anthropic.
      - openai-test/text-moderation-latest # When message moderation is enabled, the text-moderation-latest model under the channel named openai-test can be used for moderation.
      - sk-KjjI60Yd0JFWtxxxxxxxxxxxxxxwmRWpWpQRo/* # Support using other API keys as channels
    preferences :
      SCHEDULING_ALGORITHM : fixed_priority # When SCHEDULING_ALGORITHM is fixed_priority, use fixed priority scheduling, always execute the channel of the first model with a request. Default is enabled, SCHEDULING_ALGORITHM default value is fixed_priority. SCHEDULING_ALGORITHM optional values are: fixed_priority, round_robin, weighted_round_robin, lottery, random.
      # When SCHEDULING_ALGORITHM is random, use random polling load balancing, randomly request the channel of the model with a request.
      # When SCHEDULING_ALGORITHM is round_robin, use polling load balancing, request the channel of the model used by the user in order.
      AUTO_RETRY : true # Whether to automatically retry, automatically retry the next provider, true for automatic retry, false for no automatic retry, default is true. Also supports setting a number, indicating the number of retries.
      rate_limit : 15/min # Supports rate limiting, each API Key can request up to 15 times per minute, optional. The default is 999999/min. Supports multiple frequency constraints: 15/min,10/day
      # rate_limit: # You can set different frequency limits for each model
      #   gemini-1.5-flash: 15/min,1500/day
      #   gemini-1.5-pro: 2/min,50/day
      #   default: 4/min # If the model does not set the frequency limit, use the frequency limit of default
      ENABLE_MODERATION : true # Whether to enable message moderation, true for enable, false for disable, default is false, when enabled, it will moderate the user's message, if inappropriate messages are found, an error message will be returned.

  # Channel-level weighted load balancing configuration example
  - api : sk-KjjI60Yd0JFWtxxxxxxxxxxxxxxwmRWpWpQRo
    model :
      - gcp1/* : 5 # The number after the colon is the weight, weight only supports positive integers.
      - gcp2/* : 3 # The size of the number represents the weight, the larger the number, the greater the probability of the request.
      - gcp3/* : 2 # In this example, there are a total of 10 weights for all channels, and 10 requests will have 5 requests for the gcp1/* model, 2 requests for the gcp2/* model, and 3 requests for the gcp3/* model.

    preferences :
      SCHEDULING_ALGORITHM : weighted_round_robin # Only when SCHEDULING_ALGORITHM is weighted_round_robin and the above channel has weights, it will request according to the weighted order. Use weighted polling load balancing, request the channel of the model with a request according to the weight order. When SCHEDULING_ALGORITHM is lottery, use lottery polling load balancing, request the channel of the model with a request according to the weight randomly. Channels without weights automatically fall back to round_robin polling load balancing.
      AUTO_RETRY : true

preferences : # Global configuration
  model_timeout : # Model timeout, in seconds, default 100 seconds, optional
    gpt-4o : 10 # Model gpt-4o timeout is 10 seconds, gpt-4o is the model name, when requesting models like gpt-4o-2024-08-06, the timeout is also 10 seconds
    claude-3-5-sonnet : 10 # Model claude-3-5-sonnet timeout is 10 seconds, when requesting models like claude-3-5-sonnet-20240620, the timeout is also 10 seconds
    default : 10 # Model does not have a timeout set, use the default timeout of 10 seconds, when requesting a model not in model_timeout, the default timeout is 10 seconds, if default is not set, uni-api will use the default timeout set by the environment variable TIMEOUT, the default timeout is 100 seconds
    o1-mini : 30 # Model o1-mini timeout is 30 seconds, when requesting models starting with o1-mini, the timeout is 30 seconds
    o1-preview : 100 # Model o1-preview timeout is 100 seconds, when requesting models starting with o1-preview, the timeout is 100 seconds
  cooldown_period : 300 # Channel cooldown time, in seconds, default 300 seconds, optional. When a model request fails, the channel will be automatically excluded and cooled down for a period of time, and will not request the channel again. After the cooldown time ends, the model will be automatically restored until the request fails again, and it will be cooled down again. When cooldown_period is set to 0, the cooling mechanism is not enabled.
  error_triggers : # Error triggers, when the message returned by the model contains any of the strings in the error_triggers, the channel will return an error. Optional
    - The bot's usage is covered by the developer
    - process this request due to overload or policy

Monte o arquivo de configuração e inicie o contêiner Uni-Api Docker:

docker run --user root -p 8001:8000 --name uni-api -dit 
-v ./api.yaml:/home/api.yaml 
yym68686/uni-api:latest

Método dois: inicie o Uni-API usando a variável de ambiente `CONFIG_URL`

Depois de escrever o arquivo de configuração de acordo com o método um, envie-o para o disco da nuvem, obtenha o link direto do arquivo e use a variável de ambiente CONFIG_URL para iniciar o contêiner Uni-API Docker:

docker run --user root -p 8001:8000 --name uni-api -dit 
-e CONFIG_URL=http://file_url/api.yaml 
yym68686/uni-api:latest

Variável de ambiente

Config_url: o endereço de download do arquivo de configuração, que pode ser um arquivo local ou um arquivo remoto, opcional
Tempo limite: o tempo limite da solicitação, o padrão é de 100 segundos. O tempo limite pode controlar o tempo necessário para alternar para o próximo canal quando um canal não responder. Opcional
Desabille_database: se deve desativar o banco de dados, o padrão é falso, opcional

Implantação remota de vercel

Depois de clicar no botão de implantação de um clique acima, defina a variável de ambiente CONFIG_URL no link direto do arquivo de configuração, DISABLE_DATABASE como true e clique em Criar para criar o projeto. Após a implantação, você precisa definir manualmente a duração máxima da função como 60 segundos no painel do Projeto Vercel em Configurações -> Funções e clique no menu de implantações e clique em ReMobiar para reimplementar, que definirá o tempo limite para 60 segundos. Se você não reimplantar, o tempo limite padrão permanecerá nos 10 segundos originais. Observe que você não deve excluir o projeto Vercel e recriá -lo; Em vez disso, clique em ReMobrar no menu de implantações no projeto Vercel atualmente implantado para fazer com que a modificação da duração máxima da função entra em vigor.

Implantação do Ubuntu

Nos lançamentos do armazém, encontre a versão mais recente do arquivo binário correspondente, por exemplo, um arquivo chamado Unii-Api-Linux-X86_64-0.0.99.Pex. Baixe o arquivo binário no servidor e execute -o:

wget https://github.com/yym68686/uni-api/releases/download/v0.0.99/uni-api-linux-x86_64-0.0.99.pex
chmod +x uni-api-linux-x86_64-0.0.99.pex
./uni-api-linux-x86_64-0.0.99.pex

Implantação remota do serv00 (FreeBSD 14.0)

Primeiro, faça login no painel, em serviços adicionais, clique na guia Execute seus próprios aplicativos para permitir a opção de executar seus próprios programas e depois vá para a reserva da porta do painel para abrir aleatoriamente uma porta.

Se você não tiver seu próprio nome de domínio, vá para o painel www sites e exclua o nome de domínio padrão fornecido. Em seguida, crie um novo domínio com o domínio sendo o que você acabou de excluir. Depois de clicar em configurações avançadas, defina o tipo de site como domínio proxy e a porta proxy deve apontar para a porta que você acabou de abrir. Não selecione Use HTTPS.

SSH Login no servidor servidor, execute o seguinte comando:

git clone --depth 1 -b main --quiet https://github.com/yym68686/uni-api.git
cd uni-api
python -m venv uni-api
tmux new -s uni-api
source uni-api/bin/activate
export CFLAGS= " -I/usr/local/include "
export CXXFLAGS= " -I/usr/local/include "
export CC=gcc
export CXX=g++
export MAX_CONCURRENCY=1
export CPUCOUNT=1
export MAKEFLAGS= " -j1 "
CMAKE_BUILD_PARALLEL_LEVEL=1 cpuset -l 0 pip install -vv -r requirements.txt
cpuset -l 0 pip install -r -vv requirements.txt

Ctrl+BD para sair do TMUX, aguarde algumas horas para a instalação concluída e, após a conclusão da instalação, execute o seguinte comando:

tmux attach -t uni-api
source uni-api/bin/activate
export CONFIG_URL=http://file_url/api.yaml
export DISABLE_DATABASE=true
# Modify the port, xxx is the port, modify it yourself, corresponding to the port opened in the panel Port reservation
sed -i ' ' ' s/port=8000/port=xxx/ ' main.py
sed -i ' ' ' s/reload=True/reload=False/ ' main.py
python main.py

Use Ctrl+BD para sair do TMUX, permitindo que o programa seja executado em segundo plano. Neste ponto, você pode usar o Uni-API em outros clientes de bate-papo. script de teste de curl:

curl -X POST https://xxx.serv00.net/v1/chat/completions 
-H ' Content-Type: application/json ' 
-H ' Authorization: Bearer sk-xxx ' 
-d ' {"model": "gpt-4o","messages": [{"role": "user","content": "Hello"}]} '

Documento de referência:

https://docs.serv00.com/python/

https://linux.do/tpic/201181

https://linux.do/tpic/218738

Docker Deployment Local

Inicie o contêiner

docker run --user root -p 8001:8000 --name uni-api -dit 
-e CONFIG_URL=http://file_url/api.yaml  # If the local configuration file has already been mounted, there is no need to set CONFIG_URL
-v ./api.yaml:/home/api.yaml  # If CONFIG_URL is already set, there is no need to mount the configuration file
-v ./uniapi_db:/home/data  # If you do not want to save statistical data, there is no need to mount this folder
yym68686/uni-api:latest

Ou se você quiser usar o Docker Compose, aqui está um exemplo do Docker-comPpose.yml:

 services :
  uni-api :
    container_name : uni-api
    image : yym68686/uni-api:latest
    environment :
      - CONFIG_URL=http://file_url/api.yaml # If a local configuration file is already mounted, there is no need to set CONFIG_URL
    ports :
      - 8001:8000
    volumes :
      - ./api.yaml:/home/api.yaml # If CONFIG_URL is already set, there is no need to mount the configuration file
      - ./uniapi_db:/home/data # If you do not want to save statistical data, there is no need to mount this folder

Config_url é o URL do arquivo de configuração remota que pode ser baixado automaticamente. Por exemplo, se você não estiver confortável modificando o arquivo de configuração em uma determinada plataforma, poderá fazer upload do arquivo de configuração em um serviço de hospedagem e fornecer um link direto para o Uni-API para download, que é o config_url. Se você estiver usando um arquivo de configuração montado local, não há necessidade de definir config_url. Config_url é usado quando não é conveniente montar o arquivo de configuração.

Run Docker compor contêiner em segundo plano

docker-compose pull
docker-compose up -d

Docker Build

docker build --no-cache -t uni-api:latest -f Dockerfile --platform linux/amd64 .
docker tag uni-api:latest yym68686/uni-api:latest
docker push yym68686/uni-api:latest

Imagem de reiniciar com um clique

 set -eu
docker pull yym68686/uni-api:latest
docker rm -f uni-api
docker run --user root -p 8001:8000 -dit --name uni-api 
-e CONFIG_URL=http://file_url/api.yaml 
-v ./api.yaml:/home/api.yaml 
-v ./uniapi_db:/home/data 
yym68686/uni-api:latest
docker logs -f uni-api

Teste de Curl RESTful

curl -X POST http://127.0.0.1:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-H " Authorization: Bearer ${API} " 
-d ' {"model": "gpt-4o","messages": [{"role": "user", "content": "Hello"}],"stream": true} '

Embalagem PEX Linux:

VERSION= $( cat VERSION )
pex -D . -r requirements.txt 
    -c uvicorn 
    --inject-args ' main:app --host 0.0.0.0 --port 8000 ' 
    --platform linux_x86_64-cp-3.10.12-cp310 
    --interpreter-constraint ' ==3.10.* ' 
    --no-strip-pex-env 
    -o uni-api-linux-x86_64- ${VERSION} .pex

MacOS embalagem:

VERSION= $( cat VERSION )
pex -r requirements.txt 
    -c uvicorn 
    --inject-args ' main:app --host 0.0.0.0 --port 8000 ' 
    -o uni-api-macos-arm64- ${VERSION} .pex

Patrocinadores

Agradecemos aos seguintes patrocinadores por seu apoio:

@PowerHunter: ¥ 2000
@ioi ： ¥ 50

Como nos patrocinar

Se você deseja apoiar nosso projeto, pode nos patrocinar das seguintes maneiras:

PayPal
USDT-TRC20, USDT-TRC20 Endereço da carteira: TLFbqSv5pDu5he43mVmK1dNx7yBMFeN7d8
WeChat
Alipay

Obrigado pelo seu apoio!

Perguntas frequentes

Por que a Error processing request or performing moral check: 404: No matching model found sempre aparece?

Configurar enable_moderação como false corrigirá esse problema. Quando o Enable_moderação é verdadeiro, a API deve ser capaz de usar o modelo mais com moderação de texto e se você não forneceu o texto mais disposto a texto nas configurações do modelo do provedor, ocorrerá um erro indicando que o modelo não pode ser encontrado.

Como priorizar solicitações para um canal específico, como definir a prioridade de um canal?

Defina diretamente a ordem do canal nas API_Keys. Nenhuma outra configuração é necessária. Arquivo de configuração de amostra:

 providers :
  - provider : ai1
    base_url : https://xxx/v1/chat/completions
    api : sk-xxx

  - provider : ai2
    base_url : https://xxx/v1/chat/completions
    api : sk-xxx

api_keys :
  - api : sk-1234
    model :
      - ai2/*
      - ai1/*

Dessa forma, solicite o AI2 primeiro e, se falhar, solicite AI1.

Qual é o comportamento por trás de vários algoritmos de agendamento? Por exemplo, fixo_priority, ponded_round_robin, loteria, aleatória, round_robin?

Todos os algoritmos de agendamento precisam ser ativados definindo API_KEYS. (API) .Preferences.Scheduling_algorithm No arquivo de configuração para qualquer um dos valores: fixa_priority, ponded_round_robin, loteria, aleatória, Round_robin.

FILL_PRIORIDADE: Agendamento prioritário corrigido. Todas as solicitações são sempre executadas pelo canal do modelo que primeiro possui uma solicitação de usuário. Em caso de erro, ele mudará para o próximo canal. Este é o algoritmo de agendamento padrão.
PESOD_ROUND_ROBIN: Balanceamento de carga de robina redonda ponderada, solicita canais com o modelo solicitado pelo usuário de acordo com a ordem de peso definida no arquivo de configuração API_KEYS. (API) .Model.
Loteria: desenhe balanceamento de carga redondo-robin, solicite aleatoriamente o canal do modelo com solicitações de usuário de acordo com o peso definido no arquivo de configuração API_KEYS. (API) .Model.
Round_robin: balanceamento de carga redondo-robin, solicita o canal que possui o modelo solicitado pelo usuário de acordo com a ordem de configuração no arquivo de configuração api_keys. (API) .model. Você pode verificar a pergunta anterior sobre como definir a prioridade dos canais.

Como o base_url deve ser preenchido corretamente?

Exceto por alguns canais especiais mostrados na configuração avançada, todos os provedores de formato do OpenAI precisam preencher completamente o BASE_URL, o que significa que o base_url deve terminar com/v1/chat/conclusões. Se você estiver usando os modelos Github, o BASE_URL deve ser preenchido como https://models.inference.ai.azure.com/chat/completions, não o URL do Azure.

Como funciona o tempo de tempo limite do modelo? Qual é a prioridade da configuração de tempo limite no nível do canal e da configuração de tempo limite do modelo global?

A configuração do tempo limite no nível do canal tem maior prioridade que a configuração de tempo limite do modelo global. A ordem de prioridade é: Configuração do tempo limite do modelo no nível do canal> Configuração do tempo limite padrão no nível do canal> Configuração do tempo limite do modelo global> Configuração do tempo limite padrão> Timeout da variável do ambiente.

Ao ajustar o tempo de tempo limite do modelo, você pode evitar o erro de alguns canais. Se você encontrar o erro {'error': '500', 'details': 'fetch_response_stream Read Response Timeout'} , tente aumentar o tempo de tempo limite do modelo.

Como funciona API_KEY_RATE_LIMIT? Como defino o mesmo limite de taxa para vários modelos?

Se você deseja definir o mesmo limite de frequência para os quatro modelos Gemini-1.5-Pro-Lates, Gemini-1.5-Pro, Gemini-1.5-Pro-001, Gemini-1.5-Pro-002 Simultaneamente, você pode defini-lo assim:

 api_key_rate_limit :
  gemini-1.5-pro : 1000/min

Isso corresponderá a todos os modelos que contêm a string Gemini-1.5-Pro. O limite de frequência para esses quatro modelos, Gemini-1.5-Pro-Latest, Gemini-1.5-Pro, Gemini-1.5-Pro-001, Gemini-1.5-Pro-002, será todos definidos como 1000/min. A lógica para configurar o campo API_KEY_RATE_LIMIT é a seguinte, aqui está um arquivo de configuração de amostra:

 api_key_rate_limit :
  gemini-1.5-pro : 1000/min
  gemini-1.5-pro-002 : 500/min

No momento, se houver uma solicitação usando o modelo Gemini-1.5-Pro-002.

Primeiro, o Uni-API tentará corresponder com precisão ao modelo no api_key_rate_limit. Se o limite de taxa para Gemini-1.5-Pro-002 estiver definido, o limite de taxa para Gemini-1.5-Pro-002 será 500/min. Se o modelo solicitado neste momento não for Gemini-1.5-Pro-002, mas Gemini-1.5-Pro-Latest, já que o api_key_rate_limit não possui um limite de taxa para o mesmo prefixo para gemini-1.5-pro-latest que será definido, portanto, o Setting for the Swet Gemini-1.5. 1000/min.

História da estrela

Expandir

uni api

uni-api

Introdução

Características

Método de uso

Método 1: Monte o arquivo de configuração `api.yaml` para iniciar Uni-API

Método dois: inicie o Uni-API usando a variável de ambiente `CONFIG_URL`

Variável de ambiente

Implantação remota de vercel

Implantação do Ubuntu

Implantação remota do serv00 (FreeBSD 14.0)

Docker Deployment Local

Patrocinadores

Como nos patrocinar

Perguntas frequentes

História da estrela

evolution api

Universidade Europa

Feiticeiro Uni

Uni

União Quebrada

Tanque Uni

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

chat.petals.dev

waymo open dataset

termwind

wp functions

uni api

uni-api

Introdução

Características

Método de uso

Método 1: Monte o arquivo de configuração api.yaml para iniciar Uni-API

Método dois: inicie o Uni-API usando a variável de ambiente CONFIG_URL

Variável de ambiente

Implantação remota de vercel

Implantação do Ubuntu

Implantação remota do serv00 (FreeBSD 14.0)

Docker Deployment Local

Patrocinadores

Como nos patrocinar

Perguntas frequentes

História da estrela

Método 1: Monte o arquivo de configuração `api.yaml` para iniciar Uni-API

Método dois: inicie o Uni-API usando a variável de ambiente `CONFIG_URL`