網頁收錄問題
如何讓我的網站(獨立網站或blog)被百度收錄?如何查看我的網站是否被百度收錄?
百度會收錄符合使用者搜尋體驗的網站和網頁。
為促使百度Spider更快的發現您的站點,您也可以向我們提交您的網站的入口網址。提交網址是:http://www.baidu.com/search/url_submit.html。您只需提交首頁即可,無需提交詳細的內容頁面。
百度的網頁收錄機制,只和網頁價值有關,與競價排名等商業因素沒有任何關聯。
百度是否已經收錄您的網站可以透過執行site語法查看,直接在百度搜尋中輸入site:您的域名,如site:www.baidu.com,如果site語法查詢可以查詢到結果,那您的網站就已經被百度收錄。
site語法所得到的搜尋結果數,只是一個估算的數值,僅供參考。
如何讓我的網頁不被百度收錄?
百度嚴格遵循搜尋引擎Robots協議(詳細內容,請參閱http://www.robotstxt.org/)。
您可以設定一個Robots檔案以限制您的網站全部網頁或部分目錄下網頁不被百度收錄。具體寫法,請參閱:如何撰寫Robots文件。
如果您的網站在被百度收錄之後才設定Robots檔案禁止抓取,那麼新的Robots檔案通常會在48小時內生效,生效以後的新網頁,將不再建入索引。需要注意的是,robots.txt禁止收錄先前百度已收錄的內容,從搜尋結果中移除可能需要數月的時間。
如果您的拒絕被收錄需求非常急迫,也可以寄信給[email protected]請求處理。
為什麼我的網站內一些不設連結的私密性網頁,甚至是需要存取權限的網頁,也會被百度收錄?
百度Spider對網頁的抓取,是透過網頁與網頁之間的連結來實現的。
網頁之間的連結類型,除了網站內部的頁面連結之外,還有不同網站之間的互相連結。因此,某些網頁即便透過您的網站內部鏈接無法訪問到,但是,如果別人的網站上有指向這些頁面的鏈接,那麼這些頁面還是會被搜尋引擎所收錄。
百度Spider的存取權限,和一般使用者是一樣的。因此,一般使用者沒有權限存取的內容,Spider也沒有權限存取。之所以看上去某些存取權限限制內容被百度收錄,原因有兩點:
A. 該內容在Spider存取時是沒有權限限制的,但抓取之後,內容的權限發生了變化
B. 該內容有權限限制,但由於網站安全漏洞問題,導致使用者可以透過某些特殊路徑直接存取。而一旦這樣的路徑被公佈在網路上,則Spider就會循著這條路徑抓出受限內容
如果您不希望這些私密性內容被百度收錄,一方面可以透過Robots協議加以限制;另一方面,也可以聯絡[email protected]進行解決。
為什麼我的網站收錄數量越來越少?
您的網站所在的伺服器不穩定,Spider在檢查更新時抓取不到網頁而被暫時移除。
您的網站不符合使用者的搜尋體驗。
我的網頁為什麼會從百度搜尋結果中消失?
百度並不允諾所有網頁都可從百度搜尋到。
如果您的網頁無法長時間從百度搜尋到,或突然從百度的搜尋結果中消失,可能的原因有:
A. 您的網頁不符合使用者的搜尋體驗
B. 您的網站所在伺服器不穩定,被百度暫時性移除,穩定之後,問題會得到解決
C. 您的網頁內容有不符合國家法律和法規規定的地方
D. 其他技術性問題
以下的說法是錯誤的和毫無根據的:
A. 參與了百度競價排名但未續費,會從百度搜尋結果中消失
B. 參與了其他搜尋引擎的廣告項目,會從百度搜尋結果中消失
C. 與百度旗下網站產生了競爭,將從百度搜尋結果中消失
D. 從百度獲得的流量太大,會從百度搜尋結果中消失
什麼樣的網頁會被百度認為是沒有價值而不被百度收錄或從現有搜尋結果中消失?
百度只收錄對使用者有價值的網頁。任何網頁在搜尋結果中的去留變化,都是機器演算法計算和調整的結果。下述類型的網頁,百度明確不會歡迎:
A.網頁做了很多針對搜尋引擎而非使用者的處理,使得使用者從搜尋結果中看到的內容與頁面實際內容完全不同,或使得網頁在搜尋結果中獲得了不恰當的排名,從而導致使用者產生受欺騙感覺。
如果您的網站中有較多這種頁面,那麼這可能會使您的整個網站的頁面收錄和排序受到影響。
B. 網頁是複製自網路上的高度重複性的內容。
C. 網頁中有不符合中國法律和法規的內容。
如果我的網站因為作弊行為而從百度搜尋結果中消失,是否還有被重新收錄可能?
凡是作出完全修正的網站,都有機會被百度重新收錄。百度會定期對被處理站點進行自動評估,並對符合條件者重新收錄。
需要說明的是,百度技術和產品部門只對使用者搜尋體驗負責。以下的說法都是錯誤的、毫無根據的:
A. 我成為百度的廣告客戶或聯盟網站,就可以重新被收錄
B. 我給百度若干鈔票,就可以重新被收錄
C. 我認識百度的某某人,就可以重新被收錄
我的網站更新了,可是百度收錄的內容還沒更新怎麼辦?
百度會定期自動更新所有網頁(包括去除死鏈接,更新域名變化,更新內容變化)。因此請耐心等一段時間,您的網站上的變化就會被百度察覺並修正。
為什麼我的網站在百度收錄的數量和其他搜尋引擎相比相差很多?
通常情況下,這是正常的現象,不同的搜尋引擎判斷網頁價值的演算法不同。
網頁排序問題
我的網站首頁被收錄了,但搜尋網站名稱卻排不到第一個,怎麼辦?
答:排序演算法非常複雜。我們的目標,即在於透過演算法改進,讓使用者以最小的成本,搜尋所需的資訊。這個過程中還是會有各種不盡人意的地方。我們會非常歡迎您把您遇到的困惑和問題,並回饋給我們。我們的工程師,對每一個問題都會有細緻的追蹤和分析,以期將之最終解決。百度搜尋結果頁下方的搜尋框右側,有“與百度對話”鏈接,您可以在那裡提交您的問題,或者將您的問題發送到[email protected],以協助我們改進。
我們一直在改進搜尋演算法,以使得百度的搜尋結果更符合用戶的搜尋需求。
搜尋某個關鍵字,我的網頁在百度搜尋結果的排序短期內變化劇烈,這正常嗎?
答:通常情況下,這是正常的變化。一般來說,有三類原因導致排序改變:
A. 特定關鍵字所涉及的您的網頁發生了變化
B. 特定關鍵字所涉及的其他網頁發生了變化
C. 百度的排序演算法發生了變化
搜尋某個關鍵字,我的網頁在百度的排序位置,和在其他搜尋引擎的排序位置,差異非常大,這正常嗎?
答:通常情況下,這是正常的現象。因為不同搜尋引擎的演算法,都是不同的。
我請一些「SEO」來為我的網站或網頁做優化,會有什麼後果?
答:合理的搜尋引擎優化,請參閱百度的「給站長的建站建議」。
外界很多打著SEO旗號的公司或個人,也許能為您的網站帶來短期的排序收益,但是,這會使您將面臨更大損失的風險。在您把網站資源交託給別人之後,許多SEO會使用作弊的手法來提高排名,甚至會利用您的資源進行他們個人的運營項目,最終導致您的利益受損。
不要因為SEO們以下的說法,而冒險將自己的網站託付給他們隨意處置:
A. 我跟百度的人很熟,想怎麼幹就怎麼幹,沒風險
B. 我是搜尋引擎專家,對百度的演算法一清二楚,玩玩火也不要緊
C. 我把xxx、yyy、zzz這些關鍵字都搞到第一名了,所以我是牛人啊
您也可以向百度投訴搜尋中遇到的垃圾網站或網頁,幫助百度維持搜尋結果的品質。
商業客戶相關的問題
我是百度的競價排名客戶,如果我不續費,百度是否會因此對我進行懲罰?
答:這是絕對不可能的。
百度的網頁搜尋策略的唯一標準,在於使用者的搜尋體驗。競價排名和網頁搜尋自然排名,是完全獨立的兩個技術服務系統。一個網站是否為百度競價排名客戶,對於網頁搜尋自然排序無任何影響。
如果您收到任何類似威脅的說辭,請您直接發送電子郵件至[email protected]舉報。
我是百度的競價排名客戶,為什麼停止續費後網站就從百度消失了?
答:網站能否被百度收錄只與您網站的品質有關,與競價排名沒有任何關係。網頁搜尋結果中的競價排名不代表您的網站被百度收錄。如果您的網站從百度消失了,請參考網頁收錄問題的說明。
我的網站因為作弊而從百度消失了,是否可以透過成為百度競價排名客戶、廣告客戶或聯盟網站的方式重新被百度收錄?
答:不可以。我們對網站的收錄,唯一標準是使用者搜尋體驗。被懲罰網站重新被百度收錄的說明,請參閱網頁收錄問題7的敘述。
我的網站加入百度競價排名、百度聯盟,或成為百度的廣告客戶,是否能在網頁的收錄和排序上獲得特別的照顧?
答:不可能。
回頁首
給站長的建站建議
為每個網頁添加合適的標題,如果是網站首頁,則標題建議使用網站名稱或網站代表的公司、機構名稱;其餘的內容頁面,標題建議做成與正文內容的提煉和概括,這可以讓您的潛在用戶透過搜尋引擎結果中的標題快速訪問到您的頁面。
充分利用網站首頁或頻道首頁的description 標籤,提供此網頁內容的概括說明,形式為,這將幫助用戶和搜尋引擎加強對你的網站和網頁的理解。
網站應該有明晰的導航和層次結構,網站上重要的網頁,應該能從網站比較淺層的位置找到,確保每個頁面都可以透過至少一個文字連結到達。
盡量使用文字而不是flash、Javascript等來顯示重要的內容或鏈接,百度暫時無法識別Flash、Javascript中的內容,這部分內容可能無法在百度搜索得到;僅在flash、Javascript中包含鏈接指向的網頁,百度可能無法收錄。
盡量少使用frame和iframe框架結構,透過iframe顯示的內容可能會被百度丟棄。
如果網站採用動態網頁,減少參數的數量和控制參數的長度將有利於收錄。
網站改版或網站內重要頁面連結發生變動時,應該將改版前的頁面301永久重新導向到改版後的頁面。
網站更換域名,應該將舊域名的所有頁面301永久重定向到新域名上對應的頁面。
只有當搜尋引擎、站長、網路使用者之間,能有一種默契的利益均衡,這個產業才會順暢發展。竭澤而漁式的網站建設,只會讓您與使用者、與搜尋引擎越來越遠。搜尋引擎與站長之間,宜和諧發展,共同擁抱美好的願景。
以下是我們給的一些網站品質方面的建議:
網站的內容應該是面向使用者的,搜尋引擎也只是網站的一個普通訪客,放置任何使用者不可見、或欺騙使用者的內容,都可能被搜尋引擎當做作弊行為,這些行為包括但不僅限於:在網頁中加入隱藏文字或隱藏連結;在網頁中加入與網頁內容不相關的關鍵字;具有欺騙性跳轉或重定向;專門針對搜尋引擎製作橋頁;針對搜尋引擎利用程式生成的內容;具有大量重複無價值內容;充斥大量惡意廣告或惡意程式碼等。
百度喜歡獨特的原創內容,如果您的網站內容只是從各處採集複製而成,很可能不會被百度收錄。
謹慎設置您的友情鏈接,如果您網站上的友情鏈接,多是指向一些垃圾站點,那麼您的站點可能會受到一些負面影響。
謹慎加入頻道共建、內容聯盟等不能產生或很少產生原創內容的計劃,除非您能為內容聯盟創造原創的內容。
百度會盡量收錄提供不同資訊的網頁,如果您網站上相同的內容可以透過不同形式展現(如論壇的簡版頁面、列印頁),可以使用robots.txt禁止spider抓取您不想向使用者展現的形式,這也有助於節省您的頻寬。
網路論壇收錄開放協議
《互聯網論壇收錄開放協議》是百度網頁搜尋制定的論壇內容收錄標準,論壇網站可將論壇內發布的帖子製作成遵循此開放協議的XML格式的網頁供搜尋引擎索引,將論壇發布的帖子主動、及時告知百度搜尋引擎。採用了《互聯網論壇收錄開放協議》,就相當於論壇中的帖子被搜尋引擎訂閱,透過百度--全球最大的中文搜尋引擎這個平台,網友將有可能在更大範圍內更高頻率地訪問到您網站論壇中的帖子,進而為您的網站帶來潛在的流量。
造訪網路論壇收錄開放協議頁
其他
我發給百度的線上回饋,或是發給[email protected]郵件,是否會得到及時的回覆?
答:百度負責網頁搜尋品質的工作人員,雖然無法對反饋和郵件進行回复,但對於每一個線上反饋和郵件,都會認真仔細的閱讀和歸類,並及時的轉給相應的負責部門處理。