百度收錄永遠是SEOER著討論的關鍵話題,在網站優化戰爭中,穩定的收錄直接影響了網站的流量、收入。為何網站首頁快照更新很快,可就是不收錄內頁?相信許多朋友與我一樣在尋找問題的答案。本文落拓一起探討下網站內頁百度不收錄的原因分析與對策。
原因1:百度已經索引了但還沒放出來排名。百度對文章的收錄需要審核時間,蜘蛛抓取成功索引內容錄入資料庫,需要經過二次審查是否為SPAM然後才放出參與排名,放出的時間與網站權重高低有著直接的關係,百度週期更新才放出收錄是新站最常見的現象。
對策:我們要做的就是確保定期定量的更新、觀察網站日誌,只要蜘蛛正常爬行,就靜心等待著,會有驚喜的。
原因2:robots設定問題導致內頁不受引擎蜘蛛爬行索引
對策:檢查是否語法錯誤屏蔽了蜘蛛爬行,其中包括meta robots與nofollow等標籤的設定。
原因3:文章原創度問題,頭部標籤的設定導致頁面類似重複,或者採集頁面太多,因百度資料庫中已經存在大量的相似資訊而不收錄,長期地操作會導致百度降權。
對策:應該保持文章的原創度(偽原創相信朋友們都熟悉),品質比數量更重要,最好是能每天定時更新讓百度對你網站抓取也有守時的好習慣。
原因4:網站內部鏈接存在問題,例如有大量錯誤鏈接、不良的網站鏈接,蜘蛛爬行不通暢無法抓取,不良網址鏈接導致網站降權。
對策:針對首頁、頻道等各個重要頁面做錯誤鏈接檢查(可以觀察谷歌站長工具的抓取錯誤),檢查留言板、評論等網友互動功能的不良鏈接,避免與不良網站互鏈。
原因5:網站使用了黑帽手段,百度辨識了欺騙手段整站降權。
對策:遠離關鍵字堆積、群發,黑鍊等黑帽行為,網站的長期穩定少懂歪腦筋,百度一有動作就沒很難挽回了!
原因6:伺服器無法訪問,速度緩慢、被掛馬等情況。百度蜘蛛索引內容時,多次識別網站有著大量錯亂代碼或遇到伺服器無法訪問,網站被列入觀察名單。
對策:做好網站程式碼優化提高頁面讀取速度,選擇負責任的安全空間服務商,成熟的網站程式並定期更新補丁,定期對修改文件痕跡做好追蹤。
除了踏實地做好以上6點,落拓特別提出幾點值得去做的:1、首頁做好全站的網站地圖,讓蜘蛛順利爬行到內頁;2、內頁的相關連結調用一定要規則化,讓每個頁面的主題更突出;3、外部連結可適當地做一些內頁的蜘蛛引導。每個細節把握好讓自己放下心,相信百度不會遠離我們內頁的收錄。
作者:落拓,部落格( www.seo173.com )堅持在SEO的路上,歡迎交流!
感謝落拓的投稿