首先我在談百度對網站新發佈內容快速收錄問題上,給大家說下百度對站點收錄抓取原理,方便大家更好的理解下面的列舉的實例。
關於百度的收錄問題
很多朋友在論壇裡發文說自己的網站看了IIS日誌後有被百度蜘蛛爬過但是沒有收錄的問題,這跟百度的搜尋引擎的原理是有關係的
首先,搜尋引擎會建立一個網頁地圖(Webmap),記錄網路的連結結構,再使用網頁抓取程式(Robot)根據網頁地圖來抓取(Crawl)品質好的網頁,儲存到網頁快照資料庫。然後,索引程式(Indexer)會將快照資料庫中的網頁編號儲存到網頁索引資料庫中,在這個過程中,會利用相關技術去掉作弊網頁(Spam)。當使用者輸入一個查詢詞搜尋時,查詢程式會使用這個查詢詞到索引資料庫中比較,經過相關性計算後,依照相關程度對網頁進行排序,相關性越高的排得越靠前。相關性的計算是包含各種因素的綜合結果,例如:網站標題或網頁內容對查詢詞的匹配、網頁被連結的次數等。所以大家只要耐心等待搜尋引擎的下次更新就可以看到自己的頁面了
同時百度對新內容收錄問題還出現這樣情況:「如果之前做了競價的,現在不做了。但是不做了以後,百度就沒有收錄了」。
這個問題曾經有SEOer問過百度的工作人員,他們是這麼說的:
1.如果你之前做過,但如果用作弊行為,即使在做竟價也不會被百度收錄了。
2.如果你做竟價,停掉後,收錄也沒有了,表示你做的時間短,他們說如果做半年以上是一定可以收錄的,但我不相信他們這樣說。還要看你自己站點的狀況,是新站,還是老站,是一直都沒收錄,還是收錄過,根據具體情況做分析。
以上是遇到的一些SEOer問題總結,希望給大家參考學習。
以下我針對個案分析下「如何讓baidu快速收錄新發佈內容」:
首先看下58生活服務導航站點生活指南部分內容,09年高考剛結束,想到面臨高考分數查詢的朋友很多,所以就新開了一個高考分數查詢欄目類別:
下午花了半個小時的左右時間把這個欄目的類容填補了進去,然後推薦到北京導航首頁,右側看台位置,大約時間是在下午3點左右,半個小時後,我在百度site: 010.58.com/gaokao/發現已經百度收錄了將近33篇文章,機會是90%的收錄率。
大家一定很疑惑吧!為什麼這短時間會被百度收錄,同時收錄率是相當高的,下面看看我透過這個百度快速收錄的問題總結如下幾點提供參考:
1,首先我是在生活導航首頁推薦了這個新開的欄目,北京生活導航首頁,pr5,alexa從08年的1120提升到659位相信這個首頁的權重是相當的可觀的,我把新開的專欄推薦到首頁得到高權重的外鏈支持,會被百度快速收錄。這點我覺得沒有疑問,大家在未來發布新內容可以拿自己站首頁推薦試試看效果。
2,然後具體看我推薦和發布的時間,大家看看我推薦的時間是在下午3點左右,具發現百度一般更新時間有在下午3到4點左右對數據庫更新,我這個點正好是他們更新資料庫就吧我剛發布的內容收錄並顯示出來了。
曾經我也懷疑過我判斷的這個時間點有錯誤,特意做了一個實踐,我不在他們更新的時間內我推薦了一個頁面到北京生活導航首頁,半個小時候後我查看過,但是沒有被百度收錄,這點我不敢100%根據這一個時間就肯定說百度數據庫更新時間在下午4點左右這個點,因為任何事物不能一篇概全,就如我說半個小時收錄了90%,但是其中還有10%的沒有被收錄一樣,或許我實踐的這個頁面正好是那個10%之中的一個呢!所以我判斷的這個百度資料庫更新時間點只能提供大家參考,希望大家也多實踐來證明這點存在準確性。
3,最後是我另做了一個小的實踐,證明我第一點的判斷,我在做生活指南中醫療這個欄目的內容的時候:“北京301醫院地址電話乘車路線一覽”
http://010.58.com/yiyuan/4255.shtml,這裡的文章內容都是手工整理並非複製粘貼,所以算是偽原創是符合搜尋引擎抓取的內容,但是我沒有把它推薦生活導航首頁,已經發布了一個星期了,仍然沒有被百度收錄,然後上午我稍微推薦了幾個仍然是百度未收錄,我想這個應該是和百度更新數據庫的時間點有關。
相信許多站長都想自己發布的任何一篇文章都是有價值的,都能帶來流量,同時滿足用戶的需求,這裡就需要讓百度快速收錄我們發布的最新內容,最好全部被百度收錄,大家記住找準百度更新資料庫時間點,靈活掌握可用資源,例如高權重站點的外鏈支持,推薦專欄的權重支持,很多寫專欄的SEOer都有艾瑞專欄,admin5,鬥牛士等等高權重網站的專欄,不妨吧新發布的原創文章內容的URL可以利用權重高的資源外鏈支持下,待收錄了也就可以取消外鏈再次回收利用了,會讓你站點被百度快速收錄效果。
這段時間忙碌些事也沒有寫博客了,感覺失去了很多時間接觸網絡,發現自己離大家漸進了,以後得加快進度學習了,徐倩SEO博客www.hongren.org 歡迎大家常來。