scrapeghost
0.6.0
使用風險自負。該庫進行相當昂貴的調用(在中等大小的頁面上進行 GPT-4 調用為 0.36 美元)。
該庫的目的是提供一個方便的介面來探索 GPT 的網頁抓取。
雖然大部分工作是由 GPT 模型完成的, scrapeghost
提供了許多功能以使其更易於使用。
基於 Python 的模式定義- 將要提取的資料的形狀定義為任何 Python 對象,並根據需要提供盡可能多或更少的詳細資訊。
預處理
後處理
pydantic
模式來驗證響應。成本控制