-
在圈子裡有一句笑話是說站長每天早上起床第一件事是什麼?答案是查百度收錄、看快照時間、看排名!雖然有些誇張,卻也非常形像地說明了站長對網站在百度搜尋中優化情況的重視程度。在這些要素之中,網站快照、排名、收錄數量共同構成了一個網站的優化效果,反映出網站在搜尋引擎之中佔據的「分量」也就是我們常說的「權重」如何。權重越高,越容易帶來更好的最佳化效果。提升網站優化效果能夠獲得更多的搜尋流量,也意味著更多的用戶和潛在的收益來源!下面我們就從百度spider(百度蜘蛛)的工作原理來看如何提升網站的整體優化效果。
一、從百度spider的“職責”看如何讓其頻繁“光顧”
百度spider其實屬於一種自動運行的機器人程序,它的任務就是和網站伺服器建立連結之後,抓取網站的內容頁面,事實上是下載網站的內容資料到百度的伺服器之中。通俗些說,百度spider就是為百度廣泛搜羅各種互聯網中存在的信息,存儲起來經過篩選向用戶提供相關的搜索結果。明白了它的工作職責,要想讓其更加頻繁,保持至少一天一次的頻率來光顧網站,需要的就是不斷豐富和填充網站的內容,用不斷更新的新鮮內容來吸引它,使網站成為為百度提供資訊來源的一個「供應商」。
二、從百度spider抓取頁面的優先順序看如何獲得更佳收錄
百度spider在抓取互聯網中數量“多如牛毛”的網站內容時,會遵循“深度優先”和“廣度優先”的原則,它會首先從一些“起始站點”,往往就是那些質量高、權重高的大型入口網站資訊網站開始抓取,把抓取來的內容儲存到百度伺服器之中,再進行進一步的篩選,最後決定最後放出來的收錄頁面。因此,你的網站注定要被拿來與一些「大站」的內容進行對比,同樣的內容如果出現在大型網站和個人網站上,自然會優先放出大網站的收錄。這就告訴我們要使內容更好地被收錄並放出來,創造低重複率、高品質的原創內容是關鍵!
三、從百度spider抓取內容的篩選機制看如何提升權重與排名
在百度spider抓取完網站內容之後,這些被抓取的內容會被儲存到百度不同的伺服器之中,分成「檢索區」和「補充資料區」。 「檢索區」是指已經根據百度那套複雜的演算法進行過計算之後,篩選出來的內容,就是用來響應用戶的搜索,匹配之後提供給用戶的。而「補充資料區」就用來存放新抓取的內容,等待經過演算法計算檢驗篩選的內容。因而,對於一般的中小網站來說,被抓取的內容往往是被放入到“補充資料區”,要想從中快速提升權重,在更短的時間內順利進入到“檢索區”,需要按照百度的演算法規則,利用更多數量、更高品質的反向連結來提升網站的權重和排名,這也是我們常說的單向、高品質外鏈的作用!一旦提升了權重,那麼就意味著被收錄的內容會更快進入“檢索區”,提供給搜尋使用者了。
四、從百度spider對網頁重要性的評估方法看如何引導其抓取和收錄
在百度spider的抓取過程中,它會對網站的各個不同頁面的重要性進行評估,具體的方法就是衡量不同的頁面所獲得的指向數量。例如,有越多的頁面指向某個頁面,包括網站首頁的指向,父頁面的指向等等都能提高該頁的權重,從而使spider了解到不同頁面所具有的不同重要性,進而有區別地進行對待,優先抓取重要性高的頁面。因此,要做好網站內部的鏈接優化,對於一些質量高、內容豐富的頁面要給予更多的指向鏈接,使spider能夠快速找到這些高重要性的頁面並及時抓取。同時,善於利用網站地圖這一工具,它能為百度spider提供索引和指向,使其更快、更順利地了解網站的各個頁面結構及其重要性,從而大大提升網站對於搜尋引擎的友好度,有利於網站獲得更好的抓取與收錄等。
綜上所說,看似簡單的百度spider對網站進行爬行和抓取的背後,其實隱藏著百度獨特的一套運行機制和演算法體系,只有做到了對這些「門道」有了更加清楚和深刻的理解之後,才能在對網站的優化過程中,特別是網站日常的建設過程中,做到“有的放矢”,按照其喜好的“牌理”出牌,讓網站在搜尋引擎優化中獲得更佳的結果!本文由痔瘡的治療方法http://www.cqtaihai.com/原始首發,轉載請保留版權出處。
站長網第十三期SEO訓練班開始報名http://www.admin5.com/article/20110616/352917.shtml
責任編輯:強子作者andygogo 的個人空