금융위기의 영향으로 검색엔진 시장이 크게 활성화된 올해는 검색엔진의 해라고 합니다. 수직 검색의 개념은 한때 매우 인기가 있었습니다. 구형의 신형 교체와 관련하여 많은 수직형 엔진이 정지되어 현재는 2009년 하반기입니다. 이제 이러한 전설적인 수직형 검색 엔진의 개발 과정을 살펴보겠습니다. 우리는 과거 사용자 요구를 기반으로 수직 검색 엔진의 품질을 측정하기 위해 주로 다음과 같은 기준을 가지고 있습니다.
A. 데이터 업데이트 빈도
이름에서 알 수 있듯이 크롤러가 대상 웹사이트에서 데이터를 크롤링하는 빈도입니다.
B. 해당 산업에 대한 정보의 양이 포괄적인가?
정보의 출처는 깊이 있고 집중되어 있는지 여부에 관계없이 광범위하고 업계에 구체적입니다.
C.쿼리 정보 속도
질의 속도 측정은 검색 후 검색 결과의 속도와 대상 정보를 획득하는 데 걸리는 시간입니다.
D. 정보 추출의 완전성 및 정확성
이 지표의 중요성은 자명합니다. 정보의 정확성과 완전성은 전체 검색 엔진 검색 결과의 품질과 직접적인 관련이 있습니다.
개발 후 기존 수직 검색 크롤러는 두 가지 기본 모드로 구분됩니다.
1. 방향성 크롤러는 정보를 획득하고 이를 수동 또는 자동 템플릿과 일치시키고 정보의 형식을 지정하고 분석하고 저장합니다.
장점: 템플릿 기반 정보 추출 기술은 보다 정확한 정보를 제공하고 정크 정보를 줄일 수 있습니다. 가격, 집 면적, 시간, 직위, 회사명 등
단점: 템플릿 매칭 기반의 정보 추출 기술은 템플릿 구성에 수동 참여가 필요하기 때문에 대상 웹 사이트의 넓은 영역을 커버하기가 어렵습니다. 템플릿에는 인건비도 많이 필요합니다.
2. 의미론적 크롤러는 전체 웹을 크롤링하며 의미론적 인식을 기반으로 정보를 자동으로 형식화하고 분석하고 저장합니다.
장점:
1. 전체 네트워크에 걸쳐 대상 웹사이트를 무방향으로 크롤링하여 정보의 양을 효과적으로 보장합니다.
2. 템플릿 사용자 정의 및 유지 관리에 수동으로 참여할 필요가 없으므로 자체 인력 및 유지 관리 비용이 효과적으로 보장됩니다.
단점:
의미론을 사용하여 데이터를 캡처하는 첫 번째 유형의 템플릿 일치와 비교하면 정확도가 약간 낮고 스팸 및 중복 정보가 더 많습니다.
아래에 A를 전달하세요. 데이터 업데이트 빈도 나. 정보 포괄성 다. 정보 획득 속도 라. 정보 추출의 완전성 및 정확성 E. 제품 사용 편의성, 5가지 측면에서 수평적 평가.
또한 다양한 산업 분야의 대표적인 카테고리 검색엔진을 몇 개 더 선정하여 별도의 평가를 실시했습니다.
이름: 섬유 검색
웹사이트: http://search.texnet.com.cn
종합 평가: Wangsheng의 웹사이트는 현재 전 세계 80,000개 이상의 섬유 사이트와 공식 소개가 포함된 110,000개 이상의 제품 정보를 포함하여 상대적으로 전문적인 섬유 제품 데이터베이스를 보유하고 있으며 비즈니스 기회, 국제 구매, 섬유 할당량, 뉴스 센터, 정책 및 규정을 다루고 있습니다. 및 기타 섬유 산업의 측면은 상대적으로 포괄적이지만 검색된 제품 및 기타 정보는 다른 B2B 페이지와 통합되어 정보 내용을 빠르게 얻는 것이 B2B 현장 검색에 가깝습니다.
종합평가: ★★★
이름: Hengzhe 전자상거래 검색 엔진
웹사이트: http://www.hengzhe.com
전체 테스트 검토: 이 검색 엔진은 3년 넘게 레이더에 포착되었습니다. 여전히 비즈니스 정보 검색 카테고리의 선두주자입니다. 포괄적인 정보와 비교적 높은 빈도의 정보 업데이트가 이루어졌습니다. 몇 번의 수정 끝에 홈페이지는 즉시 B2B 웹사이트처럼 보입니다. 테스트 결과 대도시를 제외한 일부 중소도시에서는 정보량이 만족스럽지 못한 것으로 나타났다. 정보의 정확성에 관해서는 여전히 매우 좋습니다. 매우 유용한 도구입니다. 검색 속도가 빠릅니다.
종합평가: ★★★★
이름: 하나의 호출, 100개의 응답
웹사이트: http://www.youboy.com
종합적 평가: 정보의 관점에서 보면 데이터 추출의 정확도가 상당히 높다. 그리고 상품, 수급정보, 매장, 뉴스 등 다양한 형태의 정보를 결합합니다. 사용자에게는 매우 편리합니다. One Call Baiying은 상업 검색과 B2B 분야에서 매우 훌륭한 성과를 거두었다고 할 수 있습니다. 이는 사용자가 전자상거래 정보를 홍보하는 데 큰 도움을 주는 상점에 매우 유용한 기능입니다.
종합평가: ★★★★
이름 : 지유지
홈페이지: http://www.jobui.com
종합 평가: Zhiyouji는 진로 탐색에 중점을 둡니다. 여러 번의 수정 후. 상당한 진전도 있었습니다. 하지만 데이터 업데이트 빈도로 볼 때 업데이트 속도가 상당히 빠릅니다. 재판 과정에서 저자는 정보 처리 측면이 상당히 좋고 비교적 포괄적이라는 것을 발견했습니다. 나는 그것이 대부분의 사용자의 요구를 충족시킬 수 있다고 믿습니다.
종합평가: ★★★
이름: SouShang.com
웹사이트: http://www.28844.com
종합 평가: SouShang.com의 정보 검색 효율성과 정확성은 상당히 높습니다. 기업정보, 수급정보, 전문지식, 비즈니스지식, 금융지식 등의 수집이 상대적으로 포괄적이며, 검색 내용과 일치하는 첫 번째 항목이 사용자에게 즉시 제시된다는 점은 타의 추종을 불허합니다. 검색 엔진. 사용자에게는 매우 편리합니다. 데이터 업데이트 빈도는 기본적으로 실시간 업데이트가 가능합니다. 또한 사용자는 비즈니스 정보를 게시할 수 있어 검색 및 게시가 매우 편리합니다. 이는 3세대 검색 엔진 모델로 구체화되기 시작했으며 상업적 가치가 매우 높습니다.
총평 : ★★★★★
이름: 쿠나르
웹사이트: http://www.qunar.com
종합 평가: Qunar는 항공권 검색 분야에서 비교적 대표적인 수직 검색 엔진입니다. 72개 웹사이트를 실시간으로 검색해 보면 타겟 크롤링을 사용하고 있는 것을 알 수 있다. 검색 결과도 상당히 정확합니다. 작성자는 이 애플리케이션에 상당히 만족하고 있습니다. 마찬가지로 Qunar의 결과 필터링 기능도 매우 편리합니다.
종합평가: ★★★★
이 기사는 수직 검색 엔진에 초점을 맞춘 기존 수직 검색 엔진에 대한 종합적인 평가일 뿐입니다. 다음 기사에서 저자는 수직 검색의 비즈니스 모델, 브랜드 가치, 마케팅 개념 및 시장에 대해 심층 분석 및 논의를 수행할 것입니다. 엔진. 계속해서 관심을 가져주시는 모든 분들을 환영합니다.