Téléchargement de google cloud gcp openai api - Téléchargement du code source de l'API google cloud gcp openai api

google cloud gcp openai api

Code Source AI

1.0.0

Télécharger

API OpenAI pour Google Cloud Vertex AI

Ce projet est une API REST de remplacement pour Vertex AI ( PaLM 2, Codey, Gemini ) compatible avec les spécifications de l'API OpenAI.

Exemples :

Discutez avec Gemini dans l'interface utilisateur de Chatbot	Obtenez de l'aide de Gemini dans VSCode

Ce projet s'inspire de l'idée de LocalAI mais a pour objectif de rendre Google Cloud Platform Vertex AI PaLM plus accessible à tous.

Un service Google Cloud Run est installé pour traduire les appels de l'API OpenAI en Vertex AI (PaLM 2, Codey, Gemini).

Schéma : OpenAI, Google Cloud Run et Vertex AI

Services API OpenAI pris en charge :

OpenAI	API	Soutenu
Liste des modèles	`/v1/models`	✅
Achèvements des discussions	`/v1/chat/completions`	✅
Achèvements (héritage)	`/v1/completions`
Intégrations	`/v1/embeddings`

Le logiciel est développé en Python et basé sur FastAPI et LangChain.

Tout est conçu pour être très simple, afin que vous puissiez facilement ajuster le code source à vos besoins individuels.

Guide étape par étape

Un notebook Jupyter Vertex_AI_Chat.ipynb avec des instructions étape par étape est préparé. Il vous aidera à déployer le backend de l'API et l'interface utilisateur de Chatbot en tant que service Google Cloud Run.

Ouvrir dans Colab
Ouvrir dans Vertex AI Workbench

Déploiement sur Cloud Run

Exigences:

Votre utilisateur (celui utilisé pour le déploiement) doit disposer des autorisations appropriées dans le projet. Pour un déploiement rapide et sans tracas, le rôle « Propriétaire » est recommandé.

De plus, le compte de service de calcul par défaut ( [PROJECT_NR][email protected] ) doit avoir le rôle « Role Vertex AI User » ( roles/aiplatform.user ).

Authentifier:

gcloud auth login

Définir le projet par défaut :

gcloud config set project [PROJECT_ID]

Exécutez le script suivant pour créer une image de conteneur et déployer ce conteneur en tant qu'API publique (qui autorise les appels non authentifiés) dans Google Cloud Run :

bash deploy.sh

Remarque : Vous pouvez modifier la fausse clé API OpenAI générée et la région Google Cloud avec des variables d'environnement :
 export OPENAI_API_KEY= " sk-XYZ "
export GOOGLE_CLOUD_LOCATION= " europe-west1 "
bash deploy.sh

Exécution locale

Le logiciel a été testé sur GNU/Linux et macOS avec Python 3.11 et 3.12.3 (3.12.4 ne fonctionne actuellement pas). Si vous souhaitez utiliser le logiciel sous Windows, vous devez définir les variables d'environnement avec set au lieu de export .

Vous devez également créer un environnement virtuel avec la version de Python que vous souhaitez utiliser et l'activer avant de continuer.

Vous avez également besoin de Google Cloud CLI. Google Cloud CLI inclut l'outil de ligne de commande gcloud .

Lancez un environnement virtuel Python et installez les exigences :

python3 -m venv .venv && 
source .venv/bin/activate && 
pip install -r requirements.txt

Authentifier:

gcloud auth application-default login

Définir le projet par défaut :

gcloud auth application-default set-quota-project [PROJECT_ID]

Exécuter avec le modèle par défaut :

 export DEBUG= " True "
export OPENAI_API_KEY= " sk-XYZ "
uvicorn vertex:app --reload

Exemple pour Windows :

set DEBUG = True
set OPENAI_API_KEY = sk - XYZ
uvicorn vertex:app -- reload

Exécuter avec le modèle Gemini gemini-pro :

 export DEBUG= " True "
export OPENAI_API_KEY= " sk-XYZ "
export MODEL_NAME= " gemini-pro "
uvicorn vertex:app --reload

Exécutez avec le modèle Codey codechat-bison-32k :

 export DEBUG= " True "
export OPENAI_API_KEY= " sk-XYZ "
export MODEL_NAME= " codechat-bison-32k "
export MAX_OUTPUT_TOKENS= " 16000 "
uvicorn vertex:app --reload

L'application va maintenant s'exécuter sur votre ordinateur local. Vous pouvez y accéder en ouvrant un navigateur Web et en accédant à l'adresse suivante :

 http://localhost:8000/

Usage

Les formats de requête et de réponse HTTP sont cohérents avec l'API OpenAI.

Par exemple, pour générer une complétion de chat, vous pouvez envoyer une requête POST au point de terminaison /v1/chat/completions avec l'instruction comme corps de la requête :

curl --location ' http://[ENDPOINT]/v1/chat/completions ' 
--header ' Content-Type: application/json ' 
--header ' Authorization: Bearer [API-KEY] ' 
--data ' {
    "model": "gpt-3.5-turbo",
    "messages": [
      {
        "role": "user",
        "content": "Say this is a test!"
      }
    ]
  } '

Réponse:

{
  "id" : " cmpl-efccdeb3d2a6cfe144fdde11 " ,
  "created" : 1691577522 ,
  "object" : " chat.completion " ,
  "model" : " gpt-3.5-turbo " ,
  "usage" : {
    "prompt_tokens" : 0 ,
    "completion_tokens" : 0 ,
    "total_tokens" : 0
  },
  "choices" : [
    {
      "message" : {
        "role" : " assistant " ,
        "content" : " Sure, this is a test. "
      },
      "finish_reason" : " stop " ,
      "index" : 0
    }
  ]
}

Client API Bruno

Capture d'écran : client API Bruno

Télécharger l'export pour le client API Bruno : bruno-export.json

Configuration

La configuration du logiciel peut se faire avec des variables d'environnement.

Capture d'écran : exécution de Google Cloud

Les variables suivantes avec des valeurs par défaut existent :

Variable	Défaut	Description
DÉBOGUER	FAUX	Afficher les messages de débogage qui aident pendant le développement.
GOOGLE_CLOUD_LOCATION	nous-central1	Région Google Cloud Platform pour les appels d'API.
GOOGLE_CLOUD_PROJECT_ID	[DEFAULT_AUTH_PROJECT]	Identifiant de votre projet. S'il n'est pas précisé, le projet d'authentification est utilisé.
HÔTE	0.0.0.0	Liez le socket à cet hôte.
MAX_OUTPUT_TOKENS	512	La limite de jetons détermine la quantité maximale de texte affiché à partir d'une invite. Peut être remplacé par l'utilisateur final comme l'exige la spécification de l'API OpenAI.
MODEL_NAME	chat-bison	L'un des modèles de base disponibles dans Vertex AI.
OPENAI_API_KEY	sk-[RANDOM_HEX]	Fausse clé API OpenAI auto-générée utilisée pour l'authentification auprès de l'application.
PORT	8000	Liez le socket à ce port.
TEMPÉRATURE	0,2	Température d'échantillonnage, il contrôle le degré de caractère aléatoire dans la sélection des jetons. Peut être remplacé par l'utilisateur final comme l'exige la spécification de l'API OpenAI.
TOP_K	40	Comment le modèle sélectionne les jetons pour la sortie, le jeton suivant est sélectionné.
TOP_P	0,8	Les jetons sont sélectionnés du plus probable au moins jusqu'à la somme de leurs. Peut être remplacé par l'utilisateur final comme l'exige la spécification de l'API OpenAI.

Bibliothèque cliente OpenAI

Si votre application utilise les bibliothèques clientes fournies par OpenAI, il vous suffit de modifier la variable d'environnement OPENAI_API_BASE pour qu'elle corresponde à l'URL de votre point de terminaison Google Cloud Run :

 export OPENAI_API_BASE= " https://openai-api-vertex-XYZ.a.run.app/v1 "
python your_openai_app.py

Interface utilisateur du chatbot

Lors du déploiement de l'application Chatbot UI, les variables d'environnement suivantes doivent être définies :

Variable	Valeur
OPENAI_API_KEY	Clé API générée lors du déploiement
OPENAI_API_HOST	URL de Google Cloud Run

Capture d'écran : conteneur de l'interface utilisateur du chatbot

Déployer l'interface utilisateur de Chatbot sur Cloud Run

Exécutez le script suivant pour créer une image de conteneur à partir du code source GitHub et déployer ce conteneur en tant que site Web public (qui autorise les appels non authentifiés) dans Google Cloud Run :

 export OPENAI_API_KEY= " sk-XYZ "
export OPENAI_API_HOST= " https://openai-api-vertex-XYZ.a.run.app "
bash chatbot-ui.sh

Boîte de discussion

Définissez les paramètres de chatbox suivants :

Paramètre	Valeur
Fournisseur d'IA	API OpenAI
Clé API OpenAI	Clé API générée lors du déploiement
Hôte API	URL de Google Cloud Run

Capture d'écran : conteneur de l'interface utilisateur du chatbot

VSCode-OpenAI

L'extension VSCode-OpenAI est un outil puissant et polyvalent conçu pour intégrer les fonctionnalités OpenAI de manière transparente dans votre éditeur de code.

Pour activer la configuration, vous avez deux options :

soit utilisez la commande "vscode-openai.configuration.show.quickpick" soit
accédez-y via la barre d'état vscode-openai située dans le coin inférieur gauche de VSCode.

Capture d'écran : paramètres VSCode

Sélectionnez openai.com et saisissez l'URL de Google Cloud Run avec /v1 lors de la configuration.

Bot Discord ChatGPT

Lors du déploiement de l'application Discord Bot, les variables d'environnement suivantes doivent être définies :

Variable	Valeur
OPENAI_API_KEY	Clé API générée lors du déploiement
OPENAI_API_BASE	URL Google Cloud Run avec `/v1`

ChatGPT dans Slack

Lors du déploiement de ChatGPT dans l'application Slack, les variables d'environnement suivantes doivent être définies :

Variable	Valeur
OPENAI_API_KEY	Clé API générée lors du déploiement
OPENAI_API_BASE	URL Google Cloud Run avec `/v1`

Bot de télégramme ChatGPT

Lors du déploiement de l'application ChatGPT Telegram Bot, les variables d'environnement suivantes doivent être définies :

Variable	Valeur
OPENAI_API_KEY	Clé API générée lors du déploiement
OPENAI_API_BASE	URL Google Cloud Run avec `/v1`

Contribuer

Avez-vous un patch qui profitera à ce projet ? Génial! Suivez ces étapes pour le faire accepter.

Veuillez lire comment contribuer.
Forkez ce référentiel Git et apportez vos modifications.
Créez une demande de tirage.
Intégrez les commentaires des critiques à vos modifications.
Accepté!

Licence

Tous les fichiers de ce référentiel sont sous la licence Apache, version 2.0, sauf indication contraire.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2024-12-15
taille 2.33MB
Provenant de Github

Applications connexes

openai realtime console

2024-11-05
Application GCP pour la chaîne médicale

2024-05-21
carte Google

2023-08-09
Application JinKO Cloud

2023-07-13
Jardins de nuages

2022-11-30
Évasion des nuages

2022-07-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout