智慧通用 Web Scrapper 是一款由生成式 AI 提供支援的智慧資料擷取工具。它允許用戶提供網站連結和所需的資料字段,從而簡化了從任何網站抓取資料的過程。憑藉其多功能功能,該工具可以無縫提取資料並以表格格式呈現,並且可以以 Excel、JSON 或 Markdown 等多種格式下載。其智慧、使用者友善的介面可確保高效、準確的資料擷取,滿足您的所有網路抓取需求。
Python:
Python 是一種流行的多功能程式語言,以其簡單性和可讀性而聞名。它廣泛用於各種應用程序,包括 Web 開發、數據分析、機器學習和自動化任務。 Python 廣泛的函式庫和框架生態系統使其成為開發人員的強大工具。
LLaMA 3.1 (70b):
LLaMA(精實大語言模型)是 Meta AI 開發的一系列大語言模型。 3.1 (70b) 版本是指具有 700 億個參數的特定模型變體。像 LLaMA 這樣的大型語言模型經過大量文本資料的訓練,使它們能夠理解並產生類似人類的文本,以執行各種自然語言處理任務。
Groq API:
Groq API 提供對 Groq 強大的 AI 推理平台的存取。它使開發人員能夠利用其先進的硬體和軟體來快速有效地執行人工智慧模型。
Streamlit:
Streamlit 是一個開源 Python 函式庫,可簡化建立互動式資料視覺化和機器學習 Web 應用程式的過程。它允許開發人員透過編寫 Python 腳本來創建使用者介面,從而更輕鬆地與其他人共享資料驅動的應用程式。
使用 Git 將此儲存庫分叉或複製到本機。
安裝必要的庫。
pip install -r requirements.txt
在專案目錄中建立一個.env
檔案並新增任何所需的 API 金鑰(例如 Google API 金鑰、Groq API 金鑰)。
streamlit run app.py
GNU 通用公共授權 v3.0