網址規範化一直是困擾站長以及搜尋引擎的問題。據估計,網路上有10%-30%的URL是內容相同但URL不一樣的非規範化網址。這就造成幾個問題。比如:
對站長來說,多個URL存在分散了頁面權重,不利於排名。
對搜尋引擎來說,浪費資源,浪費頻寬。
當搜尋引擎發現多個網址內容相同時,不會懲罰,而會盡可能找出那個應該是規範化的網址。但程序畢竟只是程序,可能出錯,挑出來的可能不是站長想要的那個規範化網址。
網站上網址規範化問題太嚴重的話,也可能影響收錄。一個權重不很高的域名,能收錄的總頁數是有限的。搜尋引擎把資源花在收錄不規範的網址上,留下給真正不同內容的資源就減少了。
要解決URL規範化問題也有很多選項,例如:在Google管理員工具中設定帶3W和不帶3W的,哪一個是規範化版本使用301轉向,把不規範化URL全部轉向到規範化URL,確保使用的CMS系統只產生規範化網址,確保網站上所有內部連結都指向規範化網址,在提交給搜尋引擎的網站地圖中全部指定規範化網址,但這些方法都各有局限。
Google管理員工具不適用於其他搜尋引擎,有的站長因為某些原因做不了301轉向,CMS系統大部分情況下不受自己控制,內部連結自己可以控制,但其他人連結到自己網站上就不受控制了,總之,雖然有解決方法備選,但網址規範化到目前為止還是個不小的問題。
前幾天Google,雅虎,微軟共同發布了一個新的標籤canonical tag,用於解決網址規範化問題。
簡單說,就是在HTML檔案的頭部加上這樣一段程式碼:
意義就是這個網頁的標準化網址應該是:
http://www.example.com/product.php?item=swedish-fish
下面這些URL都可以加上這段程式碼:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
這些URL的真正規範化網址就都成為:
http://www.example.com/product.php?item=swedish-fish
簡單說,這個標籤相當是一個頁面內的301轉向。差別在於用戶並不被轉向,還是停留在不變網址上,而搜尋引擎會把它當作是301轉向處理,也就是說把頁面連結的權重都集中到代碼中所指明的規範化網址上。
另外有幾個細節站長要注意:
這個標籤只是一種建議或暗示,而不是指令,它不像robots檔案那樣是個指令。所以搜尋引擎會很大程度上考慮這個代碼,但並不是百分之百,還會考慮其他情況來判斷規範化網址。這也防止站長有可能把網址弄錯。
這段程式碼既可以使用絕對位址,也可以使用相對位址。通常還是建議使用絕對地址比較保險。指定的規範化網址上的內容,與其他使用這段程式碼的非規範化網址內容可以有些不同,不一定完全一樣。例如在電子商務網站上有很多按價錢、顏色,、尺寸升降排序,生成的URL全都不一樣,但內容大致相同,只有細小差別,就可以使用這個標籤。
指定的規範化網址可以是不存在頁面,回傳404,也可以是還沒有被收錄的頁面。但不建議這麼做,別沒事找事。這個標籤適用於同一個網域內,包括二級域名。但不適用於不同網域之間,防止有人劫持。別把這個標籤當救命草,首先還是得把網站結構做好,盡量避免出現URL規範化問題。這只是最後萬不得已的方法。
敏感的人大概能從這個新標準看到建立大量外部連結的機會。最後提一句,這個標準被3大搜尋引擎Google,雅虎,微軟同時支持,為什麼沒提百度呢?記得看到報道,從搜尋量來看,百度是世界上第二大搜尋引擎,為什麼不帶著我們一起玩?
作者: Zac@SEO每天一貼
原載: 點石互動搜尋引擎優化博客