HiGo垂直搜索引擎系统开源版 v2.2
v0
HiGo垂直搜索引擎开源版系统需要独立服务器支持,也可以用你本地电脑做服务器来调试,基于lucence+mysql+asp.net,
支持数据索引,中文分词,模糊查询,爬虫采集,精确采集规则模式和模糊采集规则模式相混合(模糊采集不用为每个站定义采集规则,只定义一个总的)
目录结构:
网站文件--上传这个到服务器
|
|----spider_bin这里为爬虫系统目录
|----ShangPu_zhida_data商家直达栏目数据
|----Main_set_dats精确采集规则和模糊采集规则的采集规则文件,每个栏目建立一个目录
|----Lanmu_Index_templete栏目首页模板文件目录
本次公开了所有源码,并命名为HiGo