易得網站資料擷取系統通用版,透過編寫或下載規則,對所選網站進行資料擷取的系統,可以擷取大部分網站的數據,並保存圖片檔案。是建站不可或缺的資料採集利器。而且採集器為開源程式碼,符中文註釋,方便修改學習。此採集系統有以下特點:主流語言- 採用php+mysql編寫而成,安裝對應伺服器即可。完全開源- 開源程式碼,且程式碼均有中文註釋,方便管理與學習交流。規則自訂- 可以自訂採集規則,可以採集大部分網站內容。資料修改- 自訂修改規則,優化資料內容。資料保存- 陣列形態,系列化資料儲存至檔案或資料庫,方便上傳、呼叫。圖片讀取- 可以讀取內容的圖片,並保持至本地。編碼控制- 轉換編碼,可以保存gb2312,gbk等編碼至utf-8。標籤清理- 可以自訂保留的標籤,清理掉不必要標籤。安全性能- 透過密碼控制讀取,遠端讀取亦安全。操作簡單- 一鍵讀取操作,可以按規則分組讀取,或指定規則id讀取,單一id讀取。規則分組- 按規則分組讀取數據,及時更新採集數據。自訂讀取- 按自訂規則id讀取數據,有效更及時。 JS讀取- 運用js控制讀取時效,降低伺服器負載。逾時控制- 可設定頁面執行時間, 減少timeout錯誤。多次讀取- 可設定對網頁多次讀取控制,可以更有效的讀取資料。錯誤控制- 如果多次出錯,可以停止讀取,減少伺服器資源佔用。負載控制- 多資料夾保存數據,可以有效的解決多文件下伺服器負載。數據修改- 不僅可以瀏覽數據,而且可以對主體數據進行修改。規則分析- 可以向其他人分享您的規則,讓更多人使用。規則下載- 下載分享規則,快速取得所需的內容。
展開