새로운 이왕 수직 검색 엔진 포털 시스템
v2.0
이 수직 검색 엔진 시스템은 독립적인 서버 지원이 필요합니다. 또한 디버깅을 위해 로컬 컴퓨터를 서버로 사용할 수도 있습니다. 이는 lucence+mysql+asp.net을 기반으로 하며 데이터 인덱싱, 중국어 단어 분할, 퍼지 쿼리, 크롤러 수집, 정밀성을 지원합니다. 수집 규칙 모드와 퍼지 수집 규칙 모드의 혼합(퍼지 수집은 각 스테이션에 대한 수집 규칙을 정의할 필요가 없으며 일반 규칙만 정의함)
디렉토리 구조:
웹사이트 파일--이 파일을 서버에 업로드합니다.
|
|----spider_bin 크롤러 시스템 디렉터리입니다.
|----ShangPu_zhida_data 가맹점 직접 열 데이터
|----Main_set_dats 정확한 수집 규칙 및 퍼지 수집 규칙을 위한 수집 규칙 파일, 각 열에 대한 디렉터리 생성
|----Lanmu_Index_templete 열 홈 페이지 템플릿 파일 디렉터리