開發AI Web代理的大型動作模型框架
Lavague是一個開源框架,專門為想要創建AI Web代理以自動化最終用戶的流程的開發人員而設計。
我們的Web代理可以採用一個目標,例如“擁抱Face的擴散器庫的打印安裝步驟”,並生成並執行實現目標所需的操作。
Lavague代理由:
?建立在Lavague上
Lavague QA是為QA工程師量身定制的工具,利用我們的框架。
它使您可以通過將小黃瓜規格轉變為易於整合的測試來自動化測試寫作。 Lavague QA是一個利用幕後的Lavague框架的項目,使網絡測試效率更高。
有關詳細信息和設置說明,請訪問Lavague QA文檔。
這是Lavague如何採取多個步驟來實現“ Quick of peft的速度”目標的一個示例:
您可以通過以下步驟執行此操作:
pip install lavague
from lavague . core import WorldModel , ActionEngine
from lavague . core . agents import WebAgent
from lavague . drivers . selenium import SeleniumDriver
selenium_driver = SeleniumDriver ( headless = False )
world_model = WorldModel ()
action_engine = ActionEngine ( selenium_driver )
agent = WebAgent ( world_model , action_engine )
agent . get ( "https://huggingface.co/docs" )
agent . run ( "Go on the quicktour of PEFT" )
# Launch Gradio Agent Demo
agent . demo ( "Go on the quicktour of PEFT" )
有關此示例以及如何使用Lavague的更多信息,請參閱我們的快速旅行。
請注意,這些示例使用我們的默認OpenAI API配置,您需要在本地環境中使用有效的API鍵在本地環境中設置OpenAI_API_KEY變量。
有關Google Colab中Lavague的端到端示例,請參閱我們的快速筆記本
我們支持三個驅動程序選項:
請注意,並非所有驅動程序都支持所有代理特徵:
特徵 | 硒 | 劇作家 | 鉻擴展 |
---|---|---|---|
無頭代理商 | ✅ | ⏳ | N/A。 |
處理iframe | ✅ | ✅ | |
打開幾個選項卡 | ✅ | ⏳ | ✅ |
突出顯示元素 | ✅ | ✅ | ✅ |
✅支持
⏳即將來臨
不支持
如果您遇到的任何問題都開始使用Lavague,則可以:
我們希望您的幫助和支持,以建立一個強大而可靠的大型動作模型來進行Web自動化。
為了避免讓多個人從事相同的事情並無法合併您的工作,我們概述了以下貢獻過程:
GitHub issues
概述任務:我們建議您查看help-wanted
和good first issue
標籤的問題community assigned
標籤請查看我們的contributing guide
以獲取更多詳細信息。
在這裡保持最新的項目積壓。
Lavague使用LLM(默認情況下OpenAI的gpt4-o
,但這是完全可自定義的),在引擎蓋下。
這些LLM調用的成本取決於:
請參閱我們有關令牌計數和成本估算的專用文檔,以了解如何跟踪所有令牌並估算運行代理的成本。
我們想構建一個數據集,該數據集可以被AI社區使用,以為更好的Web代理構建更好的大型動作模型。您可以在我們的Bigaction HuggingFace頁面上看到我們在構建社區數據集的過程中看到我們的工作。
這就是為什麼Lavague默認收集以下用戶數據遙測:
請注意,永遠不要在您的目標和額外的用戶數據中包含個人信息。如果您打算在目標/額外的用戶數據中包含個人信息,則強烈建議關閉遙測。
如果要關閉所有遙測,則應將LAVAGUE_TELEMETRY
環境變量設置為"NONE"
。
有關如何設置LAVAGUE_TELEMTRY
環境變量的指導,請參見我們的指南。