开发AI Web代理的大型动作模型框架
Lavague是一个开源框架,专门为想要创建AI Web代理以自动化最终用户的流程的开发人员而设计。
我们的Web代理可以采用一个目标,例如“拥抱Face的扩散器库的打印安装步骤”,并生成并执行实现目标所需的操作。
Lavague代理由:
?建立在Lavague上
Lavague QA是为QA工程师量身定制的工具,利用我们的框架。
它使您可以通过将小黄瓜规格转变为易于整合的测试来自动化测试写作。 Lavague QA是一个利用幕后的Lavague框架的项目,使网络测试效率更高。
有关详细信息和设置说明,请访问Lavague QA文档。
这是Lavague如何采取多个步骤来实现“ Quick of peft的速度”目标的一个示例:
您可以通过以下步骤执行此操作:
pip install lavague
from lavague . core import WorldModel , ActionEngine
from lavague . core . agents import WebAgent
from lavague . drivers . selenium import SeleniumDriver
selenium_driver = SeleniumDriver ( headless = False )
world_model = WorldModel ()
action_engine = ActionEngine ( selenium_driver )
agent = WebAgent ( world_model , action_engine )
agent . get ( "https://huggingface.co/docs" )
agent . run ( "Go on the quicktour of PEFT" )
# Launch Gradio Agent Demo
agent . demo ( "Go on the quicktour of PEFT" )
有关此示例以及如何使用Lavague的更多信息,请参阅我们的快速旅行。
请注意,这些示例使用我们的默认OpenAI API配置,您需要在本地环境中使用有效的API键在本地环境中设置OpenAI_API_KEY变量。
有关Google Colab中Lavague的端到端示例,请参阅我们的快速笔记本
我们支持三个驱动程序选项:
请注意,并非所有驱动程序都支持所有代理特征:
特征 | 硒 | 剧作家 | 铬扩展 |
---|---|---|---|
无头代理商 | ✅ | ⏳ | N/A。 |
处理iframe | ✅ | ✅ | |
打开几个选项卡 | ✅ | ⏳ | ✅ |
突出显示元素 | ✅ | ✅ | ✅ |
✅支持
⏳即将来临
不支持
如果您遇到的任何问题都开始使用Lavague,则可以:
我们希望您的帮助和支持,以建立一个强大而可靠的大型动作模型来进行Web自动化。
为了避免让多个人从事相同的事情并无法合并您的工作,我们概述了以下贡献过程:
GitHub issues
概述任务:我们建议您查看help-wanted
和good first issue
标签的问题community assigned
标签请查看我们的contributing guide
以获取更多详细信息。
在这里保持最新的项目积压。
Lavague使用LLM(默认情况下OpenAI的gpt4-o
,但这是完全可自定义的),在引擎盖下。
这些LLM调用的成本取决于:
请参阅我们有关令牌计数和成本估算的专用文档,以了解如何跟踪所有令牌并估算运行代理的成本。
我们想构建一个数据集,该数据集可以被AI社区使用,以为更好的Web代理构建更好的大型动作模型。您可以在我们的Bigaction HuggingFace页面上看到我们在构建社区数据集的过程中看到我们的工作。
这就是为什么Lavague默认收集以下用户数据遥测:
请注意,永远不要在您的目标和额外的用户数据中包含个人信息。如果您打算在目标/额外的用户数据中包含个人信息,则强烈建议关闭遥测。
如果要关闭所有遥测,则应将LAVAGUE_TELEMETRY
环境变量设置为"NONE"
。
有关如何设置LAVAGUE_TELEMTRY
环境变量的指导,请参见我们的指南。