現在網路上的內容五花八門無奇不有。有時您發表了一些不該發表的內容-例如一氣之下發了篇博文,事後卻後悔不已;又如無意間洩露了保密資料等。大多數情況下,只要刪除內容或限制訪問,內容就不再出現在搜尋結果中了。然而,如果您迫不及待地想刪除一些不願為人所知、但已經被Google索引的內容,可以使用我們的URL刪除工具;只要符合特定條件(下面將討論),就能將內容從我們的搜尋結果中迅速刪除。我們將發表一系列博文,教您如何成功地刪除各種內容以及如何避免常見錯誤。在第一篇部落格文章中,我將討論一些基本情況:刪除單一URL,刪除整個目錄或網站,重新新增已刪除的內容。
刪除單一URL
一般而言,為了成功執行刪除請求,相關URL的主人——無論是您本人還是其他人——必須表示同意刪除該內容。對於單一URL而言,可以有三種方式表示同意:
透過robots.txt file攔截頁面阻止其被搜索
透過noindex元標籤攔截頁面阻止其被索引
透過傳回一個404或410狀態碼表示目前頁面不存在
在提交刪除請求之前,可以先查看一下該URL是否已經被攔截:
robots.txt: 使用站長工具中的Fetch as Googlebot或Test robots.txt功能,查看該URL是否已被拒絕存取。
noindex元標籤: 您可以使用Fetch as Googlebot來確保元標籤出現在標籤之間。若想檢視一個使用站長工具無法核對的頁面,可以在瀏覽器中開啟該URL,點選檢視>網頁資源,確保元標籤位於標籤之間。
404 / 410狀態碼:可以使用Fetch as Googlebot,或是Live HTTP Headers或web-sniffer.net之類的工具來確認該URL確實回傳了正確的程式碼。有時,「已刪除」的頁面可能會顯示“404”或“無法找到該頁面”,但卻在頁頭回傳一個200狀態碼。因此最好使用適當的頁頭核對工具複查一遍。
如果您已經從網頁上刪除了不想要的內容,但還沒有用以上方法攔截該頁面,還是無法將該URL從我們的搜尋結果中完全刪除。如果發表該內容的網站不屬於您,上述情況就會很常見,在刪除URL系列文章的第二部分中我們將談到如何應對這種情況。
如果一個URL符合以上任一條件,您可以造訪http://www.google.com/webmasters/tools/removals ,輸入您想要刪除的URL,選擇「站長已經攔截該頁面」選項,就能將其刪除。注意:應輸入包含該內容的URL,而非Google搜尋出顯示內容的URL。比如,應該輸入
http://www.example.com/embarrassing-stuff.html
而非
http://www.google.com/search ? q=embarrassing+stuff
本文也詳細介紹如何確保輸入正確的URL。請記住,如果您沒有告訴我們給困擾您的準確URL,我們也無法刪除您不想要的內容。
刪除整個目錄或網站
若要成功地刪除整個目錄或網站,必須在該網站的robots.txt file中拒絕存取該目錄或網站。例如,要刪除http://www.example.com/secret/目錄,robots.txt file需要包含:
User-agent: *
Disallow: /secret/
根目錄傳回一個404狀態碼,但這還不夠,因為即使目錄回傳了一個404狀態碼,但仍然有可能在下面顯示檔案。使用robots.txt攔截一個目錄(或整個網站)能確保該目錄(或網站)下的所有URL都被攔截。可以使用站長工具中的Fetch as Googlebot或Test robots.txt功能來測試目錄是否被完全攔截。
只有通過驗證的網站所有人才能要求刪除站長工具中的整個網站或目錄。想要要求刪除目錄或網站,先進入相關網站,然後點選網站配置》 抓取工具訪問》 刪除網址。如果您進入了網站的根目錄,並且希望刪除該URL,您需要確認希望刪除整個網站。如果您進入的是子目錄,應選擇下拉式選單中的「刪除目錄」選項。
重新添加內容
您可以隨時取消刪除自己網站的請求,包括其他人提交的請求。為此,您必須是站長工具中通過驗證的網站所有人。一旦您通過驗證,可以進入網站配置》 抓取工具訪問》 刪除URL(或》他人提交),點擊您想取消的請求旁邊的「取消」按鈕。
還有問題嗎?我們將發表其他關於如何將內容從Google搜尋結果中刪除的系列博文,請靜候更新。