筆者於6月25日發表了一篇《巧用301重定向將404錯誤轉化為網站外鏈》的文章,談了一下如何通過301重定向的方式,將從外部得到錯誤URL轉化為可訪問的URL,從而達到傳遞權重的文章。
今天在A5看到了一篇《淺談利用301重定向將404頁面轉移成自己外鏈的危害》,反駁了我之前那篇文章中的觀點。我覺得非常好,SEO產業正應該有這種質疑的精神和獨立思考的能力。仔細拜讀了文章,發現作者誤解了我的意思。所以再寫一篇文章澄清一下其中的觀點,以及介紹一下301重定向的作用。首先我明確兩個在《使用301重定向將404錯誤轉換為網站外鏈》一文中的想法:
文章所講述的是將404錯誤URL,透過301重新導向回到原文的URL。這點需要說明,我沒有在文章中提到任何301到首頁或其他頁面的意思,文章中的例子,講述的是從外部(B網站)鏈入自身網站(A網站),在過程中有可能出現的URL錯誤拼字、連結添加錯誤甚至故意產生錯誤URL的行為。而不是A網站本身出現的404錯誤。
原文一直都在那裡,有質疑的朋友可以再仔細閱讀。以下我再反駁一下這位朋友的觀點(藍字是有反駁意見朋友的觀點):
反駁第一段
原作者,將外鏈指向中的404錯誤歸結於是網站外部造成的,這句話無可厚非,但是這種404錯誤的出現,也是由於自己網站程序所決定的,既然出現了就沒有辦法逃避,就比如在A5上頁面也可以出現很多這樣活著那樣的後綴404頁面,直接在後面加入1.html,2.html,就可以了,如此而已,但是如果有人處心積慮的用外鏈的形式來進行鏈接這樣的網頁,那也是為網站帶來鏈接,如此而已,頂多產生一個404頁面,而不會有其他。
網站出現404錯誤,不一定是網站內部程式的問題。蜘蛛透過外部網站(以B網站為例)一個錯誤的URL爬行到自身網站(以A網站為例),同樣會造成404錯誤,即:錯誤的URL導致了錯誤的頁面。蜘蛛是不會管你連結URL存在於網站內部還是外部,只要在順著URL爬行的過程中出現了「頁面不存在」的情況,就會記錄一個404錯誤。
這點我們在Google管理員工具的「運作狀況」 — “抓取錯誤” – “找不到” 一欄中可以明確的看到。 404錯誤被Google分為「在sitemap」 (內因)和「連結到您網站網頁的網域」 (外因)兩個項目。
顧名思義,其中「連結到您網站網頁的網域」是指從B網站連結到A網站的URL。
反駁第二段
而原作者的意思是如何把握這一方面的權重,想要將這種外鏈的權重直接倒回去,而不是放掉,這裡呢,筆者也有自己的觀點,本身這種外鏈「http:/ /www.xxxxx.com/rich-snippets.htmlGFQ”,這種外鏈所連結過來的就是404頁面,如果你將這些頁面301掉,這種情況就和網站中出現大量的404頁面,然後直接將404頁面301到一個頁面的情況是一樣的;那麼如果你的網站有404頁面,那麼為了防止這些權重的流失,難道將這些頁面全部301到首頁?這完全就是不符合搜尋引擎的要求,如果想知道清楚的話,就直接百度一下「404頁301到首頁的危害就」就可以明白更多。
首先,對於“自身行為”還是“外部行為”,顯然搜尋引擎有著明確的區分。拿連結建設來說,內鍊和外鏈在權重方面的效果是不同的。這點大家都很清楚。其核心思想就是外鍊是網站站長無法控制的,而內鍊是站長可以自行設定的。雖然在搜尋引擎的發展過程中,出現「可被站長控制的外鏈」這一因素(就是平常的外鏈建設)。但無論可控或不可控,有一個想法是明確的,即誰也不會在別人的網站可以發布正確URL的前提下,卻去發錯誤的URL,導致用戶無法正常訪問自己的網站或在自己的網站上出現「該網頁不存在」的字眼。
其次,對於301到原網頁還是301到首頁。這點我不想多說,大家都原文就可以明白我的意思。我這裡想說的是搜尋引擎如何甄別原文的出處的一些訊號:
搜尋引擎最先在哪裡看到內容
諸多同樣內容所在的網域信任度
指向哪裡的連結最多(原文中的內鏈)
拷貝是否連結回原始出處(版權連結)
由於第二條訊號的存在,我們原創作者許多發布或被轉載在其他網站的內容,無法獲得好的排名。很多作者也對此有抱怨。但我們可以利用1、3、4點訊號將這個錯誤修正過來。
百度在這方面做的還不是很好,但Google已經可以很快且很準的辨識出原文的出處。這就得益於以上3條。而其中「拷貝是否連結回原始出處」這一因素,也是我在《使用301重定向將404錯誤轉化為網站外鏈》這篇文章中所闡述的目的之一,還有一個目的大家也看到了就是傳遞權重。
最後,將一個使用者無法存取的錯誤URL,合理的透過301的方式重新導向到正確的URL。也對使用者體驗有所幫助。我們同樣在Google管理員工具的「抓取錯誤」中看到了這句話。
Googlebot 無法抓取該網址,因為它指向的網頁不存在。通常,404 不會影響您的網站在搜尋結果中的排名,但您可以藉助它改善使用者體驗。
解決404錯誤的方式無非是透過robots.txt屏蔽,或透過301重定向。我不認為屏蔽後可以改善使用者體驗。 robots.txt的方式只能改善蜘蛛體驗。因為使用者點選錯誤URL後,造訪的還是一個不存在的頁面和看到404錯誤。
反駁第三段
直接複製原話「如果針對不存在的網頁返回404 或410 以外的代碼(或將使用者重定向至首頁等其他網頁,而不是返回404),則可能會出現問題。首先,這樣就等於告訴搜尋引擎透過該網址可以找到實際的網頁。造訪這些網址,也無法頻繁地存取這些網址,從而影響對您網站內容的抓取量(另外,您一定也不希望自己的網站經常出現在[未找到文件] 的搜尋查詢中)。 404頁面的原話,如果你不按照要求繼續錯誤頁面的跳轉的話,可能出現的情況就是你的網站上出現大量的相同頁面,相同標題,相同描述,相同內容,等等,然後這就是不同的URL和相同的內容之間的故事,至於以後會發生什麼?這個大家可以自己去百度,自己去google上找找就知道了。
反駁的朋友既然提到了google管理員指南,就千萬別忘記摘錄另外一段文字:
一般來說,404 錯誤不會影響您的網站在Google 中的排名,因此您可以放心忽略這些錯誤。這些錯誤通常是由於以下原因導致的:拼字有誤、配置有誤(例如由內容管理系統自動產生的連結)或Google 加強了識別和抓取javascript 等嵌入式內容中的連結的力度。
若要查看無效連結的來源,請點選相關網址。在錯誤對話框中,點選連結自以下網頁標籤。如果相關連結來自您的網站,請修復或刪除這些連結。如果這些連結來自外部網站,您可以使用這些資料改善網站的使用者體驗。例如,如果某人本來打算連結到您的網站但卻輸錯了網址,那麼就會出現拼字有誤的合法網址(如www.example.com/awesome拼字成了www.example.com/awsome )。您可以將拼字有誤的網址301 重新導向到正確的網址並透過該連結取得預期流量,而不是傳回404 錯誤。您也可以在將使用者導向404 網頁後,確保幫助他們找到所需內容,而不是僅顯示「404 未找到」。不過,我們只建議您在錯誤連結可產生較高流量的情況下採取上述措施。
來源連結: https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
很遺憾的是,這位朋友只看到了其一,卻沒有看到其二。我們在做SEO時,官方的資料非常重要,很多細節都隱藏在其中,需要花大量的時間去仔細閱讀和理解。
實際上,Google管理員工具中許多設定和說明文字都是有其道理的。只是我們有些SEO不願意去理解。就像404產生的內因和外因這種事情,在「抓取錯誤」一項中將它區分開來也是有其道理的。而不是閒著沒事幹就那麼做了。
總結:身為SEO,我們要吸取很多知識,同時開拓自己的思路和分析問題的辦法。但需要確保你學習的知識是先進的而不是陳舊的。否則自己的思路很容易被誤導,從而產生不好的效果。
對觀點的爭論也是SEO工作中非常重要的一環。沒有人可以肯定的說自己的理解是正確的,我們只能拿官方透露出來的一些資料和自己透過數據分析得出來的結論來證明自己思路和理論的正確性。
本文由楊帆原創於楊氏SEO,轉載請保留連結: http://www.seoyangs.com/404-301-original-page.html
(責任編:陳龍) 作者AimarYang 的個人空