首先,你必須了解爬蟲很喜歡文字。頁面上的每段資訊最終都轉化為一串單字。網域網站的名字)、.URL(網路位址,全名為:Uniform Resource Locator)、檔案名稱(你所建立的檔案的名字)或頁面標題,這些都是文字區塊。而頁面meta標籤(表述頁面訊息的元素)、標籤、頁面文本,甚至就連圖片的alt標籤(用於描述圖片的信息,為爬蟲或者視覺有障礙的人士提供)也都是文本塊。就連每個頁面的上的入鍊和出鏈也都是文字區塊。
做得更多一點,它需要查看所有鏈向你的頁面(或被你鏈向)的所有頁面的文本塊。簡而言之,對Googlebot來說,萬物都是文字區塊。
如果你在論壇裡面看到有人說“網域不重要”,或“alt標籤被高估了”,請忽略這些觀點。就像SEO葵花寶典http://www.seo-seo.com.cn說過的,SEO就像往一面牆上丟泥巴,你每丟一塊,牆上多少都會沾上一些。
你丟得越多,沾滿的就越多。在你追求成功的時候,不要忽略任何一個文字塊。
每個文字區塊都有開始、結束和中間的模式。 Google會單獨檢查每個文字區塊,並將其放在索引當中作為頁面收錄的一部分。可以做一個實驗,在搜尋引擎上透過intitle:
或inurl:anykeyword運算子(例如intitle:antiques或~inurl:antiques)來搜索,你將會看到,對於每個文字區塊,Google將其放在單獨的索引中(權重也是分別計算的)。在評價一個文字區塊的時候,Google假定相關關鍵字在每個文字區塊中的前部出現;一起出現;經常出現。簡單來說,就是爬蟲關注突出度、鄰近度和密度。