百度官方站長幫忙點評-網頁收錄問題
這次百度更新前一天,搜錢site網站的時候發現
提示:找到的相關網頁數是估算值,不代表真實結果數,僅供參考。站長幫助
這個站長幫助很值得一讀,百度新增這句話也有提醒大家之意。但就我所知,很多做SEO的,甚至是百度SEO的人都沒有認真去研讀過,因此搜錢覺得有必要帶著大家去讀一讀,同時做點評。
至於為什麼要讀?舉個例子。你知道國內國外那些研究中國時事政治的人必須讀的是什麼?是《人民日報》!因為人民日報是最權威的官方報紙。特別是人民日報的社論。
那我們一起來讀下百度站長幫助,全名為百度搜尋幫助中心-網頁搜尋幫助-站長FAQ,網址:http://www.baidu.com/search/guide.html
今天的內容是網頁收錄問題,強調部分是搜錢SEO的評論。
如何讓我的網站(獨立網站或blog)被百度收錄?如何查看我的網站是否被百度收錄?
看這個標題,網站的解釋是獨立網站或blog.這裡的blog指的是站長在各大部落格網站開的部落格。以前百度對這種部落格的權重比較高,特別是百度空間和新浪部落格。但是最近百度把這種部落格權重降得比較低了。如果要用博客,還是用獨立博客比較好。
百度會收錄符合使用者搜尋體驗的網站和網頁。
這句話其實回答了上面那個問題。符合用戶搜尋體驗是關鍵。同時這裡提到了網站和網頁。那麼搜錢強調下收錄是有兩個層次的,一是網站收錄,主要衡量是收錄了主域名,如www.seolabs.net.cn;二是收錄了單一網頁。
為促使百度Spider更快的發現您的站點,您也可以向我們提交您的網站的入口網址。提交網址是:http://www.baidu.com/search/url_submit.html。您只需提交首頁即可,無需提交詳細的內容頁面。
/這句話告訴大家要去百度登陸入口提交自己的網站。更快二字說明即使你不去提交,也可能被收錄,只要百度蜘蛛能沿著某種路徑達到你的網站。
百度的網頁收錄機制,只和網頁價值有關,與競價排名等商業因素沒有任何關聯。
之所以聲明,是因為普遍認為百度的自然搜尋有貓膩。
百度是否已經收錄您的網站可以透過執行site語法查看,直接在百度搜尋中輸入site:您的域名,如site:www.baidu.com,如果site語法查詢可以查詢到結果,那您的網站就已經被百度收錄。
site語法所得到的搜尋結果數,只是一個估算的數值,僅供參考。
這句話很重要。一是告訴你怎麼判斷自己的站被沒被收錄,用site文法。有些網友直接輸入自己的網站的域名,發現沒被收錄就妄自下結論說自己的站沒被收錄或被K之類,記住site才能說明問題。二是這個例子site:www.baidu.com,這裡必須提到site:www.baidu.com和site:baidu.com是不一樣的。原因是沒有www的和有www的是兩個網域。一般site:baidu.com這樣的結果頁包括了site:www.baidu.com和其他子網域的收錄情況。三是只是一個估算的數值,僅供參考,這句話是真話,但是實際上沒用,我們不看site還能看什麼?
如何讓我的網頁不被百度收錄?
這個問題大家關心得不是很多,因為很多站是百度根本不收錄。
百度嚴格遵循搜尋引擎Robots協議(詳細內容,請參閱http://www.robotstxt.org/)。
您可以設定一個Robots檔案以限制您的網站全部網頁或部分目錄下網頁不被百度收錄。具體寫法,請參閱:如何撰寫Robots文件。
如果您的網站在被百度收錄之後才設定Robots檔案禁止抓取,那麼新的Robots檔案通常會在48小時內生效,生效以後的新網頁,將不再建入索引。需要注意的是,robots.txt禁止收錄先前百度已收錄的內容,從搜尋結果中移除可能需要數月的時間。
這句話回答了為什麼有些網址不存在了,百度還能存在幾個月。這方面google做得很好,他支援用戶自己刪除收錄頁面。
如果您的拒絕被收錄需求非常急迫,也可以寄信給[email protected]請求處理。
為什麼我的網站內一些不設連結的私密性網頁,甚至是需要存取權限的網頁,也會被百度收錄?
這個問題的重要之處其實是回答了有些站為什麼沒做外鍊和內鏈也能被收錄。
百度Spider對網頁的抓取,是透過網頁與網頁之間的連結來實現的。
網頁之間的連結類型,除了網站內部的頁面連結之外,還有不同網站之間的互相連結。因此,某些網頁即便透過您的網站內部鏈接無法訪問到,但是,如果別人的網站上有指向這些頁面的鏈接,那麼這些頁面還是會被搜尋引擎所收錄。
之所以被收錄是存在這樣的連結路徑。不一定是你能容易發現的。個人認為百度會參考網域解析的資料來爬行。所以有些人說自己的站沒做連結百度也收錄了,好像自己多牛的樣子。其實是你沒發現,連結的路徑一定有的。難道百度蜘蛛空降麼?
百度Spider的存取權限,和一般使用者是一樣的。因此,一般使用者沒有權限存取的內容,Spider也沒有權限存取。之所以看上去某些存取權限限制內容被百度收錄,原因有兩點:
A. 該內容在Spider存取時是沒有權限限制的,但抓取之後,內容的權限發生了變化
B. 該內容有權限限制,但由於網站安全漏洞問題,導致使用者可以透過某些特殊路徑直接存取。而一旦這樣的路徑被公佈在網路上,則Spider就會循著這條路徑抓出受限內容
如果您不希望這些私密性內容被百度收錄,一方面可以透過Robots協議加以限制;另一方面,也可以聯絡[email protected]進行解決。
為什麼我的網站收錄數量越來越少?
那些常被百度收錄問題困擾的站長必看。
您的網站所在的伺服器不穩定,Spider在檢查更新時抓取不到網頁而被暫時移除。
您的網站不符合使用者的搜尋體驗。
第一句告訴你伺服器穩定對收錄來說很重要,但也告訴你這是暫時的,等你伺服器穩定了會回來。所以出現這種問題的站長要馬上解決伺服器問題,然後就是心態要好,因為會回來的。第二句還是使用者體驗問題,後面詳談。
我的網頁為什麼會從百度搜尋結果中消失?
每個做百度的人必看。做百度被K是正常的事情,必須好好研究被K的原因,如果不符合以下的情況,那麼心態好點,會回來的。
百度並不允諾所有網頁都可從百度搜尋到。
如果您的網頁無法長時間從百度搜尋到,或突然從百度的搜尋結果中消失,可能的原因有:
這其實有兩個問題,一是新站百度不收錄;二是被百度K掉。
A. 您的網頁不符合使用者的搜尋體驗
B. 您的網站所在伺服器不穩定,被百度暫時性移除,穩定之後,問題會得到解決
C. 您的網頁內容有不符合國家法律和法規規定的地方
D. 其他技術性問題
A先不說,B又提到伺服器問題,那麼提醒大家伺服器空間穩定永遠是第一位的,在這個前提下再考慮速度。 C就是內容問題了,黃賭毒反動在國內是不行的。就算百度勉強收錄,也會被備案搞死。 D。其他技術問題,其實很多時候是百度的問題,百度技術不如Google,本身就不穩定。
以下的說法是錯誤的和毫無根據的:
A. 參與了百度競價排名但未續費,會從百度搜尋結果中消失
B. 參與了其他搜尋引擎的廣告項目,會從百度搜尋結果中消失
C. 與百度旗下網站產生了競爭,將從百度搜尋結果中消失
D. 從百度獲得的流量太大,會從百度搜尋結果中消失
這些東西我就不說了,據說有貓膩。
什麼樣的網頁會被百度認為是沒有價值而不被百度收錄或從現有搜尋結果中消失?
這一段其實是對符合使用者體驗的反例說明。
百度只收錄對使用者有價值的網頁。任何網頁在搜尋結果中的去留變化,都是機器演算法計算和調整的結果。下述類型的網頁,百度明確不會歡迎:
一,有價值是使用者體驗的本質;二,都是機器演算法計算和調整的結果這句我不贊同,百度人工幹預很嚴重。三是明確二字告訴大家下面的是雷區不要去碰。
A.網頁做了很多針對搜尋引擎而非使用者的處理,使得使用者從搜尋結果中看到的內容與頁面實際內容完全不同,或使得網頁在搜尋結果中獲得了不恰當的排名,從而導致使用者產生受欺騙感覺。
如果您的網站中有較多這種頁面,那麼這可能會使您的整個網站的頁面收錄和排序受到影響。
B. 網頁是複製自網路上的高度重複性的內容。
C. 網頁中有不符合中國法律和法規的內容。
A是不要作弊。 B是不要自己拷貝,至少偽原創。 C是內容合法。
如果我的網站因為作弊行為而從百度搜尋結果中消失,是否還有被重新收錄可能?
凡是作出完全修正的網站,都有機會被百度重新收錄。百度會定期對被處理站點進行自動評估,並對符合條件者重新收錄。
告訴了作弊被K的站長還是有機會的。但是定期二字就告訴你重新被收錄的時間可以沒準,因為你不知道他怎麼定期的。
需要說明的是,百度技術和產品部門只對使用者搜尋體驗負責。以下的說法都是錯誤的、毫無根據的:
A. 我成為百度的廣告客戶或聯盟網站,就可以重新被收錄
B. 我給百度若干鈔票,就可以重新被收錄
C. 我認識百度的某某人,就可以重新被收錄
我的網站更新了,可是百度收錄的內容還沒更新怎麼辦?
百度會定期自動更新所有網頁(包括去除死鏈接,更新域名變化,更新內容變化)。因此請耐心等一段時間,您的網站上的變化就會被百度察覺並修正。
百度更新問題。提到一個定期二字。其實就是我們講的更新規律。目前來看每週四小更新,月底那個週四是大更新。例如5月28日是5月底的星期四。
為什麼我的網站在百度收錄的數量和其他搜尋引擎相比相差很多?
通常情況下,這是正常的現象,不同的搜尋引擎判斷網頁價值的演算法不同。
所以很多人也要老問搜錢,為什麼自己的站百度收錄比Google還多,或者還少,原因就是演算法不一樣。
搜錢SEO會在接下來的時間內繼續點評百度站長幫助,結束之後將整理成電子書與大家分享。
轉載請註明來自SEO實驗室。