大部分的網站管理員都已經知道重複內容能為網站的排名帶來負面效應。但是怎麼才能檢查某個特定的網站是否有這個問題,並且怎樣才能減少或避免它呢?
從一開始,可以將重複內容分為兩個主要的種類:
網站結構導致的重複內容
內容盜竊導致的重複內容
關於網站結構導致的重複內容
有些網站結構本身會造成重複內容,實例如下所示:
列印友善(ptint-friendly)的頁面
在多個頁面上具有大致相似的內容,而能透過不同的URL位址訪問
頁面上有非常類似的單元,例如在一個電子商務種類中,一連串不同顏色的襯具有相似的描述
頁面是一個追蹤應用程式的會員程式的一部分,而這個程式配置不正確
多個頁面有重複的標題或重複的meta標籤值
在URL位址中使用會話ID
標準化問題
為了找出網站結構所導致的重複內容,可以使用site:www.yingyuxuexi.org.cn查詢串來檢查已被搜尋引擎索引過的網站的URL位址。所有主要的搜尋引擎(Google,Yahoo!,Microsoft Live Search)都支援這個功能。通常,「列印友善」的頁面如果被索引的話,就會很快顯示出來。
Google經常將它認為是重複內容的內容放在「補充索引(supplemental index)」中。在搜尋引擎結果的最底下有個補充資料的標記,放置的就是這些內容。當然,現在Google已經將這個標識隱藏起來了。如果某個Web網站有很多頁面出現在補充索引中,可能表示這些頁面是重複內容——至少Google這麼認為。如果可能的話,研究這幾個頁面的URL位址,並找出有沒有前述的情形。特別要看位於結果後面的頁面。如果不注意就特別容易產生重複內容問題,因此以有利於搜尋引擎的觀點去看將會很有用處。
關於內容盜竊導致的重複內容
內容盜竊產生的是完全不同的問題。正如盜賊能偷走真實的財產一樣,他們也能竊取內容。毫無疑義,這就是為什麼它被稱為內容盜竊的原因。而這為搜尋引擎帶來了問題,因為搜尋引擎努力從搜尋結果之中(也從不同的網站之中)過濾重複內容,難免有時會對哪些是原創權威內容做出一些錯誤認定。
在某些情況下,這是一個隱藏的問題,並且可能會對排名造成災難性的影響。如果你是內容盜竊的犧牲品,並且想要有所行動,那麼首先要給那個使用非法內容的人發送一封要求暫停併中止的信。可以使用該網站提供的聯絡資訊,或該網域在WHOIS記錄中的聯絡資訊。如果這個方式失敗,那麼可以找主流搜尋引擎來警告他們的內容盜竊行為。
以下是主流搜尋引擎負責此事的URL位址:
Google:http://www.google.com/dmca.html
Yahoo!:http://docs.yahoo.com/info/copyrighffcopyright.html
基本上只要一個網站是堅持不斷的更新原創內容,百度、Google、雅虎等搜尋引擎已經能夠很好的識別原創內容的原始出處。網站管理員需要做的就是,每天堅持更新高品質的網站內容。
作者:街舞者-街舞-HipHop-中國最大舞者的交流平台來源:http://www.jiewuzhe.com