功能特點:
******************************************
1.採用asp.net開發,運行於IIS下。
2、可依入庫設置,自動掛接到現有的網站系統,與現有系統實現無縫集成,補充或取代現有系統的採集程式。
3.採集調度,即規劃任務,可為每個採集規則設定時間定時重複採集,多個採集任務可同時運行,到了設定時間採集程序在Web伺服器後台自動執行,真正實現了無須人工幹預的自動更新。
4.可自動歸類,對採集的資訊實現自動分類,當目標分類不存在時可自動建立該分類,也可透過分類映射將目標分類與目前網站內容分類合併。無需為每個類別建立一個採集任務。
5.採集規則設定簡單易懂,程式具有2種運作方式,前台運作或後台定時運作。
6.可實現多層網頁深度的採集,例如內容分頁、部分資訊在另外的頁面、小說連載等類型的有主從表關聯的資訊收集。
7.獨創的斷點續採,目標網站有更新,採集程序才進行採集,僅採集更新的部分,效率高。 此功能對採集連載性質的網站特別有用,例如連載小說、連續劇等。
8.自動下載相關的外部檔案到本機伺服器或替換為遠端路徑,如圖片、FLASH、下載檔案等,無需再手動上傳到伺服器。
9.支持採集模型的定義,可依需求定義任意要採集的資料項,每個模型還可包含子模型。
10.自動辨識絕大多數採集站的網頁編碼。例如常見的:GB2312,GBK,UTF-8,windows-1252,iso646-us等。
11、支援從清單頁擷取縮圖及其他附加資訊。
12.多執行緒非同步採集,採集效率高,佔用伺服器資源較低。
v1.5.4
改善:修改了採集網址佇列數超過5000,自動重啟時無法停止的問題2008-2-29
改善:採集項進階過濾設定中,可進行替換。格式為在原過濾規則後加入"[to]" 2008-2-29
增加:增加了採集時間間隔的設置,避免給採集站伺服器帶來較大壓力增加:增加了採集網址需要登陸驗證的情況,需設置登陸及驗證地址2008-3-1
增加:列表JS提交方式(Post)分頁。使用方法:在提交位址上追加參數"?fc_action=post&參數1={$pageid}",如果提交頁已包含"?",則為:"&fc_action=post&參數1={$pageid}" 2008-3 -1