新乙王垂直搜尋引擎入口網站系統
v2.0
本垂直搜尋引擎系統需要獨立伺服器支援,也可以用你本地電腦做伺服器來調試,基於lucence+mysql+asp.net,支援資料索引,中文分詞,模糊查詢,爬蟲採集,精確採集規則模式和模糊採集規則模式相混合(模糊採集不用為每個站定義採集規則,只定義一個總的)
目錄結構:
網站檔案--上傳這個到伺服器
|
|----spider_bin 這裡為爬蟲系統目錄
|----ShangPu_zhida_data商家直達欄位資料
|----Main_set_dats 精確採集規則和模糊採集規則的採集規則文件,每個欄位建立一個目錄
|----Lanmu_Index_templete 欄位首頁範本檔案目錄