L'objectif de GPTTools est d'étendre GPTStudio pour les développeurs de package R pour intégrer plus facilement l'utilisation de modèles de gros langues (LLM) dans leurs flux de travail de projet. Ces modèles semblent être un changement d'étape dans notre utilisation du texte pour le travail de connaissances, mais vous devez soigneusement considérer les implications éthiques de l'utilisation de ces modèles. L'éthique des LLM (également appelées modèles de fondation) est un domaine de discussion très active.
{pak}
# install.packages("pak")
pak :: pak( " JamesHWade/gpttools " )
# Enable repository from jameshwade
options( repos = c(
jameshwade = " https://jameshwade.r-universe.dev " ,
CRAN = " https://cloud.r-project.org "
))
# Download and install gpttools in R
install.packages( " gpttools " )
# Browse the gpttools manual pages
help( package = " gpttools " )
Service d'IA | Modèles | Documentation | Installation |
---|---|---|---|
Openai | GPT-4-Turbo, GPT-4, GPT-3.5-Turbo (derniers modèles) | Docs API Openai | Configuration Openai |
Étreinte | divers | Docs API d'inférence HF | Configuration HF |
Anthropique | Claude-2.1, Claude-Instant-1.2 | Docs API anthropiques | Configuration anthropique |
Ollla | Mistral, Llama2, Mixtral, Phi (derniers modèles) | Docs API Olllama | Configuration de l'ollama |
Perplexité | PPLX-7B-CHAT, PPLX-70B-CHAT, PPLX-7B-ONLINE, PPLX-70B-ONLINE, LLAMA-2-70B-CHAT, CODELLAMA-34B-INSTRUCT, Mistral-7B-Instruct et Mixtral-8x7B-intruct | Docs API Perplexity | Configuration de la perplexité |
Google AI Studio | Gémeaux et paume (héritage) | Google AI Studio Docs | Configuration de Google AI Studio |
Azure Openai | GPT-4, GPT-3.5-Turbo (derniers modèles) | Docs API Azure Openai | Configuration Azure Openai |
Pour commencer, vous devez d'abord configurer un service API. Le package est configuré pour fonctionner avec plusieurs fournisseurs de services AI, permettant la flexibilité et le choix en fonction de vos besoins spécifiques. La configuration par défaut est définie pour utiliser les services d'Openai. Pour l'utiliser, vous avez besoin:
Faites un compte Openai. Inscrivez-vous ici.
Créez une touche API OpenAI à utiliser avec le package.
Définissez la clé de l'API dans RStudio. Voir la section ci-dessous sur la configuration de la touche API.
Pour interagir avec l'API OpenAI, il est nécessaire d'avoir une variable d'environnement OPENAI_API_KEY
valide. Voici les étapes pour la configurer.
Vous pouvez établir cette variable d'environnement à l'échelle mondiale en l'incluant dans le fichier .renviron de votre projet. Cette approche garantit que la variable d'environnement persiste à toutes les sessions au fur et à mesure que l'application brillante s'exécute en arrière-plan.
Voici un ensemble de commandes pour ouvrir le fichier .renviron pour la modification:
require( usethis )
edit_r_environ()
Pour un paramètre persistant qui se charge chaque fois que vous lancez ce projet, ajoutez la ligne suivante à .renviron, en remplaçant "<APIKEY>"
par votre clé API réelle:
OPENAI_API_KEY= " <APIKEY> "
ATTENTION: Si vous utilisez des systèmes de contrôle de version comme GitHub ou GitLab, n'oubliez pas d'inclure .Renviron dans votre fichier .gitignore pour éviter d'exposer votre clé API!
Remarque importante: L'API OpenAI ne fonctionnera pas sans les détails de paiement valides entrés dans votre compte OpenAI. Il s'agit d'une restriction imposée par OpenAI et n'est pas liée à ce package.
Alors que OpenAI est la valeur par défaut et actuellement considérée comme l'une des options les plus robustes, gpttools
est également compatible avec d'autres fournisseurs de services d'IA. Ceux-ci incluent anthropic, HuggingFace, Google AI Studio, Azure Openai et Perplexity. Vous pouvez sélectionner l'un de ces fournisseurs en fonction de votre préférence ou de vos exigences spécifiques. Vous pouvez également exécuter des modèles locaux avec Olllama. Cela nécessite plus de configuration mais au profit de ne pas partager vos données avec un tiers.
Pour utiliser un autre fournisseur, vous devrez obtenir la clé API ou les informations d'accès pertinentes auprès du fournisseur choisi et de les configurer de la même manière.
Cet avis de confidentialité est applicable au package R qui utilise des modèles de langage populaires comme GPT-4 Turbo et Claude-2.1. En utilisant ce package, vous acceptez d'adhérer aux termes et conditions de confidentialité définis par le service API.
Lorsque vous utilisez ce package R, tout texte ou code que vous mettez en surbrillance / sélectionnez avec votre curseur, ou l'invite que vous entrez dans les applications intégrées, sera envoyée au fournisseur de services AI sélectionné (par exemple, Openai, Anthropic, HuggingFace, Google AI Studio, Azure OpenAI) dans le cadre d'une demande API. Ce partage de données est régi par l'avis de confidentialité, les règles et les exceptions que vous avez accepté avec le fournisseur de services respectif lors de la création d'un compte.
Nous ne pouvons garantir la sécurité des données que vous envoyez via l'API à un fournisseur de services d'IA, et nous ne pouvons pas fournir de détails sur la façon dont chaque service traite ou utilise vos données. Cependant, ces fournisseurs indiquent souvent qu'ils utilisent des invites et des résultats pour améliorer leurs modèles d'IA, comme indiqué dans leurs conditions d'utilisation. Assurez-vous d'examiner directement les conditions d'utilisation du fournisseur de services d'IA respectif.
Le package R est conçu pour partager uniquement le texte ou le code que vous mettez spécifiquement en surbrillance / sélectionnez ou incluez dans une invite via nos applications intégrées. Aucun autre élément de votre environnement R ne sera partagé, sauf si vous allumez ces fonctionnalités. Il est de votre responsabilité de vous assurer de ne pas partager accidentellement des données sensibles avec un fournisseur de services d'IA.
Important: pour maintenir la confidentialité de vos données, ne mettez pas en surbrillance, n'incluez pas dans une invite, ou ne téléchargez pas autrement des données, du code ou du texte sensibles qui devraient rester confidentiels.
Veuillez noter que le projet GPTTOOLS est publié avec un code de conduite de contributeur. En contribuant à ce projet, vous acceptez de respecter ses conditions.