1.適當阻止搜尋引擎存取:與其讓我們的演算法來確定一個檔案的」最佳」版本,你也許希望指引Google選取你的首選版本。譬如說,如果你不想我們索引你網站文章的印刷版,你可以在你的robots.txt檔案中寫上目錄名或正則表達式來禁止谷歌對那些印刷版的抓取。
2、使用301重定向:如果你已經重構你的網站,請在你的原網站的.htaccess中使用301重定向(永久性重定向)來重定向你的用戶、Google爬蟲、以及其他搜尋引擎蜘蛛等。
3.鏈接要一致:努力使你的內部鏈接保持一致; 千萬不要既有/page/,又有/page和/page/index.htm 的內部鏈接,可以將/page/index.htm用301重定向到/page/。
4、使用頂級域名:為了讓我們總是使用最合適的文件版本, 請盡可能使用國家特定的頂級域名。與諸如example.com/de或de.example.com的URL相比,Google肯定更清楚地知道example.de是以德文為核心的內容。
5.小心辛迪加式的聯合供文:如果你為其他網站上也提供你的內容,請在每一個其他網站的文章中包括連回原文章的連結。注意:即使是這樣,對一個查詢,谷歌總是顯示我們認為是最適合的(沒被網站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
6.使用Google網站管理員工具的首選網域功能:如果其他網站連結你的URL時既使用www版本又使用無www的版本,你可以用谷歌網站管理員工具讓我們知道你想要哪種索引方式。
7.減少範本網頁上的重複內容:拿版權聲明來說,你有兩種選擇,一種是在你的每個頁面底部都有一個冗長的版權聲明。另一種是設立一個專門的版權詳細聲明頁,然後在每頁底部寫一個非常簡短的總結,並連結到版權聲明頁。
8.避免發布無內容頁:使用者不喜歡看到無實際內容的頁面。要盡量避免空白架頁。以房地產網頁為例,不要發布(或至少要阻止)沒有點評的點評網頁,或者沒有房地產列表的房地產羅列網站等。只有這樣,網站使用者(以及Google爬蟲)才不會看到無窮多的寫著「以下是在【某城市名】中不可錯失的待租房清單…」但其實根本沒有什麼列表的網頁。
9、了解你的內容管理系統:確保你熟悉你的網站是怎樣顯示內容的,尤其是當它包括了博客,論壇,或相關的系統。往往在這些系統中同一內容會以多種形式出現。
10、不要擔心,保持快樂:不要過度受搜刮(挪用和轉載)你內容站點的干擾。雖然很惱人, 它們幾乎不可能對你在谷歌中的存在產生負面影響。如果你實在忍無可忍, 歡迎你提出千禧年著作權法案申請來聲明對你的內容的所有權。
總之, 如果你對內容複製問題有一個大體的認識,又能花上幾分鐘有見地地預防性維護一下你的網站,這將既幫助你們,也幫助我們為用戶提供獨特而相關的內容。想和更多的優化高手們交流嗎?那就加入我們,QQ群:31845298
本文由www.qysem.com進行編輯整理,轉載請註明版權,謝謝合作!