Téléchargement archgw - Téléchargement du code source archgw

archgw

Autre code source

release 0.1.5 ?

Télécharger

Construisez des agents d'IA rapidement, observables et personnalisés.

Arch est un proxy distribué de couche 7 intelligent conçu pour protéger, observer et personnaliser les agents d'IA avec vos API.

Engagée avec des LLMS spécialement conçues, Arch gère les tâches critiques mais indifférenciées liées à la manipulation et au traitement des invites, notamment en détectant et en rejetant les tentatives de jailbreak, en appelant intelligemment les API "backend" pour répondre à la demande de l'utilisateur représenté dans une invite, un routage vers et offrir une récupération de catastrophe entre les LLM en amont et la gestion de l'observabilité des invites et des interactions LLMIM dans une voie centrale.

Arch est construit sur (et par les principaux contributeurs de) l'envoyé proxy avec la conviction que:

Les invites sont des demandes d'utilisateurs nuancés et opaques, qui nécessitent les mêmes capacités que les demandes HTTP traditionnelles, y compris la manipulation sécurisée, le routage intelligent, l'observabilité robuste et l'intégration avec les systèmes backend (API) pour la personnalisation - toutes les logiques commerciales en dehors. *

Caractéristiques de base :

Construit sur Envoy: Arch s'exécute aux côtés de serveurs d'applications et s'appuie sur les fonctionnalités éprouvées de gestion et d'évolutivité HTTP de l'envoi pour gérer le trafic d'entrée et de sortie lié aux invites et aux LLM.
Fonction appelant à des applications d'agence et de chiffon rapides. Organisé avec des LLMS spécialement conçues pour gérer des tâches basées sur des invites rapides, rentables et précises comme l'appel de fonction / API, et l'extraction des paramètres à partir d'invites.
Garde rapide: l'arc centralise les garde-corps rapides pour empêcher les tentatives de jailbreak et assurer des interactions utilisateur sûres sans écrire une seule ligne de code.
Gestion du trafic: Arch gère les appels LLM, offrant des tentatives intelligentes, une coupe automatique et des connexions en amont résilientes pour une disponibilité continue.
Observabilité basée sur les normes: Arch utilise la norme de contexte de trace W3C pour permettre le traçage complet des demandes à travers les applications, assurer la compatibilité avec les outils d'observabilité, et fournit des mesures pour surveiller la latence, l'utilisation des jetons et les taux d'erreur, aidant à optimiser les performances des applications d'IA.

Sautez dans nos documents pour savoir comment utiliser Arch pour améliorer la vitesse, la sécurité et la personnalisation de vos applications Genai.

Important

Aujourd'hui, la fonction appelant LLM (arc-fonction) conçu pour les scénarios agentiques et chiffon est hébergée gratuitement dans la région américaine-centrale. Pour offrir des latences et un débit cohérents, et pour gérer nos dépenses, nous permettons d'accès à la version hébergée via les clés de développeurs et vous donnerons la possibilité d'exécuter ce LLM localement. Pour plus de détails, voir ce numéro # 258

Contact

Pour nous contacter, veuillez rejoindre notre serveur Discord. Nous surveillerons cela activement et offrirons un soutien là-bas.

Démos

Prévisions météorologiques - Parcourez la fonction principale d'appel des capacités d'Arch Gateway en utilisant le service de prévision météorologique
Agent d'assurance - Construisez un agent d'assurance complet avec Arch
Agent de réseau - Construire un agent co-pilote / agent de réseautage avec Arch

Start

Suivez ce guide pour apprendre à configurer rapidement Arch et à l'intégrer dans vos applications Génératives d'IA.

Condition préalable

Avant de commencer, assurez-vous d'avoir ce qui suit:

Docker & Python installé sur votre système
API Keys pour les fournisseurs de LLM (si vous utilisez des LLM externes)

Étape 1: Installer Arch

La CLI d'Arch vous permet de gérer et d'interagir efficacement avec la passerelle Arch. Pour installer la CLI, exécutez simplement la commande suivante: Conseil: Nous recommandons aux développeurs de créer un nouvel environnement virtuel Python pour isoler les dépendances avant d'installer Arch. Cela garantit que ArchGW et ses dépendances n'interfèrent pas avec d'autres packages sur votre système.

Assurez-vous que les services publics suivants ont été installés avant de continuer,

Docker System (V24)
Docker Compose (v2.29)
Python (v3.12)
Poésie (V1.8.3. Remarque: nécessaire uniquement pour le développement local )

$ python -m venv venv
$ source venv/bin/activate   # On Windows, use: venvScriptsactivate
$ pip install archgw

Étape 2: Configurez Arch avec votre application

Arch fonctionne basé sur un fichier de configuration où vous pouvez définir des fournisseurs LLM, des cibles d'invite, des garde-corps, etc. Vous trouverez ci-dessous un exemple de configuration pour vous démarrer:

 version : v0.1
listener :
  address : 127.0.0.1
  port : 8080 # If you configure port 443, you'll need to update the listener with tls_certificates
  message_format : huggingface

# Centralized way to manage LLMs, manage keys, retry logic, failover and limits in a central way
llm_providers :
  - name : OpenAI
    provider : openai
    access_key : $OPENAI_API_KEY
    model : gpt-3.5-turbo
    default : true

# default system prompt used by all prompt targets
system_prompt : |
  You are a network assistant that helps operators with a better understanding of network traffic flow and perform actions on networking operations. No advice on manufacturers or purchasing decisions.

prompt_targets :
    - name : device_summary
      description : Retrieve network statistics for specific devices within a time range
      endpoint :
        name : app_server
        path : /agent/device_summary
      parameters :
        - name : device_ids
          type : list
          description : A list of device identifiers (IDs) to retrieve statistics for.
          required : true  # device_ids are required to get device statistics
        - name : days
          type : int
          description : The number of days for which to gather device statistics.
          default : " 7 "
    - name : reboot_devices
      description : Reboot a list of devices
      endpoint :
        name : app_server
        path : /agent/device_reboot
      parameters :
        - name : device_ids
          type : list
          description : A list of device identifiers (IDs).
          required : true
        - name : days
          type : int
          description : A list of device identifiers (IDs)
          default : " 7 "

# Arch creates a round-robin load balancing between different endpoints, managed via the cluster subsystem.
endpoints :
  app_server :
    # value could be ip address or a hostname with port
    # this could also be a list of endpoints for load balancing
    # for example endpoint: [ ip1:port, ip2:port ]
    endpoint : host.docker.internal:18083
    # max time to wait for a connection to be established
    connect_timeout : 0.005s

Étape 3: Utilisation du client Openai avec Arch comme passerelle de sortie

Faites des appels sortants via Arch

 from openai import OpenAI

# Use the OpenAI client as usual
client = OpenAI (
  # No need to set a specific openai.api_key since it's configured in Arch's gateway
  api_key = '--' ,
  # Set the OpenAI API base URL to the Arch gateway endpoint
  base_url = "http://127.0.0.1:12000/v1"
)

response = client . chat . completions . create (
    # we select model from arch_config file
    model = "--" ,
    messages = [{ "role" : "user" , "content" : "What is the capital of France?" }],
)

print ( "OpenAI Response:" , response . choices [ 0 ]. message . content )

Observabilité

Arch est conçu pour soutenir l'observabilité de la meilleure classe en soutenant les normes ouvertes. Veuillez lire nos documents sur l'observabilité pour plus de détails sur le traçage, les métriques et les journaux

texte alt

Contribution

Nous aimerions les commentaires sur notre feuille de route et nous accueillons des contributions à Arch ! Que vous corrigez des bogues, que vous ajoutiez de nouvelles fonctionnalités, améliorez la documentation ou créez des tutoriels, votre aide est très appréciée. Veuillez visiter notre guide de contribution pour plus de détails

Développer

Informations supplémentaires

Version release 0.1.5 ?
Type Autre code source
Date de mise à jour 2025-03-02
taille 4.63MB
Provenant de Github

Applications connexes

waymo open dataset

2024-11-18
chat.petals.dev

2024-11-30
Sunamu

2024-12-14
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
chat.petals.dev

Autre code source

1.0.0
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout