LaVague下载 - LaVague源代码下载

LaVague

其他源码

1.0.0

下载

欢迎来到Lavague

开发AI Web代理的大型动作模型框架

Lavague：建筑商的Web代理框架

Lavague是一个开源框架，专门为想要创建AI Web代理以自动化最终用户的流程的开发人员而设计。

我们的Web代理可以采用一个目标，例如“拥抱Face的扩散器库的打印安装步骤”，并生成并执行实现目标所需的操作。

Lavague代理由：

具有目标状态和当前状态（又称当前网页）并输出适当的指令的世界模型。
将这些说明“编译”到动作代码的动作引擎，例如，硒或剧作家并执行它们

Lavague QA：QA工程师的专用工具

？建立在Lavague上

Lavague QA是为QA工程师量身定制的工具，利用我们的框架。

它使您可以通过将小黄瓜规格转变为易于整合的测试来自动化测试写作。 Lavague QA是一个利用幕后的Lavague框架的项目，使网络测试效率更高。

有关详细信息和设置说明，请访问Lavague QA文档。

入门

演示

这是Lavague如何采取多个步骤来实现“ Quick of peft的速度”目标的一个示例：

代理商的演示

动手

您可以通过以下步骤执行此操作：

下载Lavague：

pip install lavague

使用我们的框架来构建Web代理并实施目标：

 from lavague . core import  WorldModel , ActionEngine
from lavague . core . agents import WebAgent
from lavague . drivers . selenium import SeleniumDriver

selenium_driver = SeleniumDriver ( headless = False )
world_model = WorldModel ()
action_engine = ActionEngine ( selenium_driver )
agent = WebAgent ( world_model , action_engine )
agent . get ( "https://huggingface.co/docs" )
agent . run ( "Go on the quicktour of PEFT" )

# Launch Gradio Agent Demo
agent . demo ( "Go on the quicktour of PEFT" )

有关此示例以及如何使用Lavague的更多信息，请参阅我们的快速旅行。

请注意，这些示例使用我们的默认OpenAI API配置，您需要在本地环境中使用有效的API键在本地环境中设置OpenAI_API_KEY变量。

有关Google Colab中Lavague的端到端示例，请参阅我们的快速笔记本

关键功能

✅内置上下文（又称配置）
✅可自定义的配置
✅测试和测试Lavague的测试和基准测试者
✅估计令牌使用和成本的代币计数器
✅记录工具
✅可选的互动级界面
✅调试工具
✅镀铬扩展

支持司机

我们支持三个驱动程序选项：

Selenium Webdriver
剧作家网络驱动程序
镀铬驱动器

请注意，并非所有驱动程序都支持所有代理特征：

特征	硒	剧作家	铬扩展
无头代理商	✅	⏳	N/A。
处理iframe	✅	✅
打开几个选项卡	✅	⏳	✅
突出显示元素	✅	✅	✅

✅支持
⏳即将来临
不支持

？支持

如果您遇到的任何问题都开始使用Lavague，则可以：

查看我们的故障排除指南，在其中列出了信息并解决常见问题。
打开一个描述您问题的GitHub问题
在我们的Discord服务器上的“ #support频道”中向我们发送信息

？贡献

我们希望您的帮助和支持，以建立一个强大而可靠的大型动作模型来进行Web自动化。

为了避免让多个人从事相同的事情并无法合并您的工作，我们概述了以下贡献过程：

？我们使用GitHub issues概述任务：我们建议您查看help-wanted和good first issue标签的问题
？‍♀️如果您有兴趣从事其中一项任务，请对此问题发表评论！
？我们将与您讨论，并将任务分配给community assigned标签
然后，我们将与您讨论此任务
⬆️您应该将工作提交公关
✅我们将审查并合并您的代码或请求更改/提供反馈

请查看我们的contributing guide以获取更多详细信息。

？️路线图

在这里保持最新的项目积压。

？经营代理商多少钱？

Lavague使用LLM（默认情况下OpenAI的gpt4-o ，但这是完全可自定义的），在引擎盖下。

这些LLM调用的成本取决于：

选择运行给定代理的模型
目标的复杂性
您正在与之互动的网站。

请参阅我们有关令牌计数和成本估算的专用文档，以了解如何跟踪所有令牌并估算运行代理的成本。

？数据收集

我们想构建一个数据集，该数据集可以被AI社区使用，以为更好的Web代理构建更好的大型动作模型。您可以在我们的Bigaction HuggingFace页面上看到我们在构建社区数据集的过程中看到我们的工作。

这就是为什么Lavague默认收集以下用户数据遥测：

安装了Lavague的版本
为每个Web操作步骤生成的代码 /操作列表
过去的行动
“观察”（用于检查当前页面的方法）
LLM使用（即GPT4）
多模态LLM使用（IE GPT4）
随机生成的匿名用户ID
无论您是使用CLI命令（例如Lavague-QA），Gradio演示还是我们的库。
使用的目标
关于代理商的思想链
页面上的交互区（边界框）
浏览器的视口尺寸
当前步骤
生成的指令和使用的当前引擎
令牌成本和用法
您执行了动作的URL
动作是失败还是成功
指定的额外使用的数据
错误消息，相关的地方
源节点（从网页检索到HTML代码的块以执行此操作）

请注意，永远不要在您的目标和额外的用户数据中包含个人信息。如果您打算在目标/额外的用户数据中包含个人信息，则强烈建议关闭遥测。

关闭所有遥测

如果要关闭所有遥测，则应将LAVAGUE_TELEMETRY环境变量设置为"NONE" 。

有关如何设置LAVAGUE_TELEMTRY环境变量的指导，请参见我们的指南。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-02-27
大小 54.62MB
来自于 Github

LaVague

欢迎来到Lavague

Lavague：建筑商的Web代理框架

Lavague QA：QA工程师的专用工具

入门

演示

动手

关键功能

支持司机

？支持

？贡献

？️路线图

？经营代理商多少钱？

？数据收集

关闭所有遥测

waymo open dataset

Sunamu

MySchedule.py

SmartTube

chat.petals.dev

viptools for eslam

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

MySchedule.py

waymo open dataset

termwind

wp functions