最近很多朋友的网站都出现了同样的问题,就是网站在百度搜索结果中标题和描述显示不正常、不完整,网站快照无描述,网站的快照无法预览,但是网站快照天天更新,关于这一问题,原因何在呢?是什么原因所造成呢?在此笔者与大家谈谈造成此问题的原因及解决方法
一、robots.txt文件惹的祸
一般来说,出现这种情况就是当Robots.txt中设置某一个特定URL为“nofollow、noindex”,虽然这个指令告诉搜索引擎不要跟踪,以及收录这条链接。但是如果有一定数量的外链指向这条链接,搜索引擎也许会收录该URL。而此时的标题则有可能为URL,描述则为空。当然,出现这种情况多为GOOGLE搜索引擎。百度收录“nofollow、noindex”链接比较罕见,但也不排除这个可能。
笔者在前一个月给客户优化一个站,也曾出现过此问题,就是因为robots.txt文件被修改,造成网站标题、描述快照不完整,一直在找原因处理了好几天不见效果,也没想到会是robots.txt的问题,后来不经意之间才发现,于是立马修改过来。于是,第二天网站就恢复正常,所以,建议出现此问题的朋友,一定要检查好robots.txt文件。
二、网站内容及标题的改动
这是比较严重的情况,比如你的网站的标题、描述、或URL路径做了全部或大部分的修改调整后。这样会造成大量的死页面,就会失去搜索引擎的信任,当页面从搜索引擎消失以后,由于以前给该页面做外部链接,搜索引擎又开始收录这个页面,这个时候描述也极有可能是为空的。
在网站改版或大范围改动后,建议最好设置好robots禁止抓取错误页面及404错误页面的制作,这样一方面可以降低用户流失,另一方面可以告诉蜘蛛这是一个错误的的地址,禁止蜘蛛抓取不存在的网页,在此期间保持为网站更新原创内容及高质量的外链。
三、百度对数据的抓取能力不够
据观察,出现这种情况主要是百度对数据的抓取能力不够强。尤其是使用CDN的网站,一般来说百度爬虫缓存域名对应服务器ip的时间是超过1天,蜘蛛爬网站的时候,没有按照dns协议去缓存dns记录,而是缓存dns记录1天以上,所以当CDN换了IP,百度蜘蛛在一天内会还一直爬不能访问的旧服务器IP。这样就会造成某个节点的数据不能被抓取的现象,从而出现网站标题和描述不能正常显示。
百度对数据的分析处理能力尚有待加强。而碰到这种情况的站长们大可不必恐慌,一般会在一个星期以内恢复正常。
最后告诉站长朋友,如果当您检查网站本身以及站外的因素都没有发现问题时,那么你不要惊慌失措,也很有可能就是百度自身或数据库调整的问题,一般情况下一个星期内会恢复正常。这段时间内你应该持续分析网站内外的情况。
本文章由 http://www.gzhj-gb.com 站长供稿,希望对大家有所帮助,欢迎大家转载,转载请标明出处,多谢合作!!
责任编辑:扬扬 作者 浪里陶金 的个人空