Un marco de modelos de acción grande para desarrollar agentes web de IA
Lavague es un marco de código abierto diseñado para desarrolladores que desean crear agentes web de IA para automatizar procesos para sus usuarios finales.
Nuestros agentes web pueden tomar un objetivo, como "Pasos de instalación de impresión para abrazar la biblioteca de difusores de Face", y generar y realizar las acciones necesarias para lograr el objetivo.
Los agentes de Lavague están formados por:
? Construido en Lavague
Lavague QA es una herramienta diseñada para ingenieros de control de calidad que aprovechan nuestro marco.
Le permite automatizar la escritura de pruebas convirtiendo las especificaciones de Gherkin en pruebas fáciles de integrar. Lavague QA es un proyecto que aprovecha el marco de Lavague detrás de escena para hacer que las pruebas web sean 10 veces más eficientes.
Para obtener información detallada e instrucciones de configuración, visite la documentación del control de calidad de Lavague.
Aquí hay un ejemplo de cómo Lavague puede tomar múltiples pasos para lograr el objetivo de "Go On The Quicktour of Peft":
Puedes hacer esto con los siguientes pasos:
pip install lavague
from lavague . core import WorldModel , ActionEngine
from lavague . core . agents import WebAgent
from lavague . drivers . selenium import SeleniumDriver
selenium_driver = SeleniumDriver ( headless = False )
world_model = WorldModel ()
action_engine = ActionEngine ( selenium_driver )
agent = WebAgent ( world_model , action_engine )
agent . get ( "https://huggingface.co/docs" )
agent . run ( "Go on the quicktour of PEFT" )
# Launch Gradio Agent Demo
agent . demo ( "Go on the quicktour of PEFT" )
Para obtener más información sobre este ejemplo y cómo usar Lavague, consulte nuestro tour rápido.
Tenga en cuenta que estos ejemplos usan nuestra configuración de API de OpenAI predeterminada y deberá establecer la variable OpenAI_API_KEY en su entorno local con una clave API válida para que estos funcionen.
Para un ejemplo de extremo a extremo de Lavague en Google Colab, consulte nuestro cuaderno de tour rápido
Admitimos tres opciones de controlador:
Tenga en cuenta que no todos los controladores admiten todas las características del agente:
Característica | Selenio | Dramaturgo | Extensión de cromo |
---|---|---|---|
Agentes sin cabeza | ✅ | ⏳ | N / A |
Manejar iframes | ✅ | ✅ | |
Abrir varias pestañas | ✅ | ⏳ | ✅ |
Resaltar elementos | ✅ | ✅ | ✅ |
✅ Apoyado
⏳ Próximamente
no compatible
Si está experimentando algún problema para comenzar con Lavague, puede:
Nos encantaría su ayuda y apoyo en nuestra búsqueda para construir un modelo de acción grande y confiable para la automatización web.
Para evitar que varias personas trabajen en las mismas cosas y no puedan fusionar su trabajo, hemos esbozado el siguiente proceso de contribución:
GitHub issues
: recomendamos revisar los problemas con las etiquetas de primer tema help-wanted
y good first issue
community assigned
Consulte nuestra contributing guide
para obtener más detalles.
Para mantenerse al día con nuestro proyecto de línea de proyecto aquí.
Lavague usa LLM (por defecto, gpt4-o
de OpenAI, pero esto es completamente personalizable), debajo del capó.
El costo de estas llamadas LLM depende de:
Consulte nuestra documentación dedicada sobre el conteo de tokens y las estimaciones de costos para aprender cómo puede rastrear todos los tokens y estimar los costos para administrar a sus agentes.
Queremos crear un conjunto de datos que pueda ser utilizado por la comunidad de IA para construir mejores modelos de acción grandes para mejores agentes web. Puede ver nuestro trabajo hasta ahora en la construcción de conjuntos de datos de la comunidad en nuestra página Bigaction Huggingface.
Es por eso que Lavague recopila la siguiente telemetría de datos del usuario de forma predeterminada:
Tenga cuidado de nunca incluir información personal en sus objetivos y los datos adicionales del usuario. Si tiene la intención de incluir información personal en sus objetivos/datos adicionales del usuario, se recomienda desactivar la telemetría.
Si desea desactivar toda la telemetría, debe establecer la variable de entorno LAVAGUE_TELEMETRY
en "NONE"
.
Para obtener orientación sobre cómo establecer su variable de entorno LAVAGUE_TELEMTRY
, consulte nuestra guía aquí.