由於金融危機影響,極大的推動了搜尋引擎市場,都說今年是搜尋引擎年。垂直搜尋的概念一度抄來的很火。對於新舊交替,不少垂直引擎已經掛了,現在已經到了2009年下半年。讓我們現在來看看這些傳說中的垂直搜尋引擎的發展。我們對於衡量一個垂直搜尋引擎的好壞根據以往用戶需求整理主要有以下幾個標準。
A.數據的更新頻率
顧名思義,就是爬蟲從目標網站爬取資料的頻率。
B.所在產業資訊數量是否全面
資訊來源是廣泛,針對產業是否深入專注。
C.查詢資訊速度
查詢速度的衡量是針對搜尋後搜尋結果的速度,取得目的資訊時間。
D.資訊抽取完整率與準確率
此項指標的重要性不言而喻。資訊的準確率和完整率直接關係到整個搜尋引擎搜尋結果的品質。
經過發展現有垂直搜尋爬蟲分為2種基本模式。
一、定向爬蟲獲取信息,配上手工或自動的模版進行信息匹配,將信息進行格式化分析存儲。
優點:基於模版的資訊擷取技術,能提供更精準的資訊以及垃圾資訊比較少。例如價格,房屋面積,時間,職位,公司名等等。
缺點:目標網站難以大面積覆蓋,因為基於模版匹配的資訊擷取技術,需要人工的參與配置模版,欲要大面積覆蓋各個目標網站,需要大量的人力成本,同樣維護模板也需要很大的人力成本。
二、語意爬蟲全網爬取,爬蟲依語意識別,自動進行資訊格式化分析,並儲存。
優勢:
1、全網非定向抓取目標網站,有效的保證資訊數量。
2、不需要人工參與客製化和維護模板,有效的保證了自身的人力和維護成本。
劣勢:
相對於第一種模板匹配,根據語意來進行資料抓取,準確率略有下降、垃圾資訊及重複資訊比較多。
下面通過A。資料的更新頻率B.資訊全面性C.取得資訊速度D。資訊抽取完整率和準確率E.產品易用性,5個方面進行橫向測評。
並從各行業中挑選了幾個比較有代表性的垂直搜尋引擎,進行分別測評。
名稱:紡織搜尋
網址:http://search.texnet.com.cn
綜合評估:網盛旗下網站,目前擁有的還是比較專業的紡織產品資料庫,以官方介紹內含全球80,000多個紡織站點和110,000餘條產品信息,內容涵蓋商業機會、國際求購、紡織配額、新聞中心、政策法規等紡織業的面向資訊比較全面,不過搜尋的產品等資訊等等是整合他B2B的頁面,想要快速取得資訊內容方面有點難度,更像是B2B的站內搜尋。
綜合評價:★★★
名稱:亨者電子商務搜尋引擎
網址:http://www.hengzhe.com
測試總評:此搜尋引擎關注3年多了,在商業資訊搜尋類還算是個佼佼者,資訊全面,資訊更新頻率還算高,但是經過幾次改版顯得有點浮躁了,首頁馬上像B2B網站了。經過測試發現,除大城市之外,一些中小城市的資訊量並不能讓人滿意。對於資訊的準確度來說,做的還是非常好的。很實用的工具。搜尋速度很快。
綜合評價:★★★★
名稱:一呼百應
網址:http://www.youboy.com
綜合評價:從資訊上看資料擷取的準確率是相當高的。而且結合產品、供需資訊、商店、新聞等多種類型的資訊。對使用者來說是非常方便的。可以說一呼百應在商業搜尋及B2B這方面做的是很不錯的。對於商舖是一個非常不錯的功能,極大的方便了使用者對於電子商務資訊的推廣。
綜合評價:★★★★
名稱:職友集
網址:http://www.jobui.com
綜合評價:職友集專注於職業搜尋。經過幾次改版之後。也是有著相當大的進步。但從數據更新頻率分析更新速度挺快。筆者試用中發現,資訊處理方面還是不錯的,比較全面。相信可以滿足大部分使用者的需求。
綜合評價:★★★
名稱:搜商網
網址:http://www.28844.com
綜合評價:搜商網從資訊搜尋效率和準確率是相當高的。蒐集整理的企業資訊、供需資訊、專業知識、商務知識、金融知識等等資訊比較全面,值得稱道的是有符合搜尋的內容的第一個立即呈現給用戶,這個是其他搜素引擎無法比擬。對使用者來說是非常方便的。數據的更新頻率方面,基本上能保持即時更新。用戶也可以發布商務訊息,對用戶來說搜尋和發布極為方便,初具第三代搜尋引擎模式,有著非常高的商業價值。
綜合評價:★★★★★★
名稱:去哪裡
網址:http://www.qunar.com
綜合評價:去哪裡在機票搜尋上是比較具代表性的一家垂直搜尋引擎。即時搜尋72個網站,可以看出它採用的是定向抓取。搜尋結果也是相當精準的。對此筆者的適用還是相當的滿意的。同樣去哪裡的結果過濾功能也是非常方便的。
綜合評價:★★★★
本篇文章只是對現有的比較專注垂直搜尋引擎做了綜合的評比,下一篇筆者將對垂直搜尋引擎的商業模式、品牌價值、行銷理念和市場進行深入分析和討論。歡迎大家繼續關注。