首先我在谈百度对站点新发布内容快速收录问题上,给大家说下百度对站点收录抓取原理,方便大家更好的理解下面的列举的实例。
关于百度的收录问题
很多朋友在论坛里发帖说自己的网站看了IIS日志后有被百度蜘蛛爬过但是没有收录的问题,这跟百度的搜索引擎的原理是有关系的
首先,搜索引擎会建立一个网页地图(Webmap),记录互联网的链接结构,再使用网页抓取程序(Robot)根据网页地图来抓取(Crawl)质量好的网页,存储到网页快照数据库中。然后,索引程序(Indexer)会将快照数据库中的网页编号存储到网页索引数据库中,在这个过程中,会利用相关技术去掉作弊网页(Spam)。当用户输入一个查询词搜索时,查询程序会使用这个查询词到索引数据库中比较,经过相关性计算后,按照相关程度对网页进行排序,相关性越高的排得越靠前。相关性的计算是包括各种因素的综合结果,例如:网站标题或网页内容对查询词的匹配、网页被链接的次数等。所以大家只要耐心等待搜索引擎的下次更新就可以看到自己的页了
同时百度对新内容收录问题还出现这样情况:“如果之前做了竞价的,现在不做了。但是不做了以后,百度就没有收录了”。
这个问题曾经有SEOer问过百度的工作人员,他们是这样说的:
1、如果你之前做过,但如果用作弊行为,即使在做竟价也不会被百度收录了。
2、如果你做竟价,停掉后,收录也没有了,说明你做的时间短,他们说如果做半年以上是一定可以收录的,但我不相信他们这样说。还要看你自己站点的情况,是新站,还是老站,是一直都没收录,还是收录过,根据具体情况做分析。
以上是遇到的一些SEOer问题进行总结,希望给大家参考学习。
下面我针对个别案例分析下“如何让baidu快速收录新发布内容”:
首先看下58生活服务导航站点生活指南部分内容,09年高考刚结束,想到面临高考分数查询的朋友很多,所以就新开了一个高考分数查询栏目类别:
下午花了半个小时的左右时间把这个栏目的类容填补了进去,然后推荐到北京导航首页,右侧看台位置,大约时间是在下午3点左右,半个小时后,我在百度site:010.58.com/gaokao/发现已经百度收录了将近33篇文章,机会是90%的收录率。
大家一定很疑惑吧!为什么这短时间会被百度收录,同时收录率是相当高的,下面看看我通过这个百度快速收录的问题总结如下几点提供参考:
1,首先我是在生活导航首页推荐了这个新开的栏目,北京生活导航首页,pr5,alexa从08年的1120提升到659位相信这个首页的权重是相当的可观的,我把新开的栏目推荐到首页得到高权重的外链支持,会被百度快速收录。这点我觉得没有疑问,大家在今后发布新内容可以拿自己站首页推荐试试效果。
2,然后具体看我推荐和发布的时间,大家看看我推荐的时间是在下午3点左右,具发现百度一般更新时间有在下午3到4点左右对数据库更新,我这个点正好是他们更新数据库就吧我刚发布的内容收录并显示出来了。
曾经我也怀疑过我判断的这个时间点有错误,特意做了一个实践,我不在他们更新的时间内我推荐了一个页面到北京生活导航首页,半个小时候后我查看过,但是没有被百度收录,这点我不敢100%根据这一个时间就肯定说百度数据库更新时间在下午4点左右这个点,因为任何事物不能一篇概全,就如我说半个小时收录了90%,但是其中还有10%的没有被收录一样,或许我实践的这个页面正好是那个10%之中的一个呢!所以我判断的这个百度数据库更新时间点只能提供大家参考,希望大家也多实践来证明这点存在准确性。
3,最后是我另做了一个小的实践,证明我第一点的判断,我在做生活指南中医疗这个栏目的内容的时候:“北京301医院地址电话乘车路线一览”
http://010.58.com/yiyuan/4255.shtml,这里的文章内容都是手工整理并非复制粘贴,所以算是伪原创是符合搜索引擎抓取的内容,但是我没有把它推荐生活导航首页,已经发布了一个星期了,仍然没有被百度收录,然后上午我稍微推荐了几个仍然是百度未收录,我想这个应该是和百度更新数据库的时间点有关。
相信很多站长都想自己发布的任何一篇文章都是有价值的,都能带来流量,同时满足用户的需求,这里就需要让百度快速收录我们发布的最新内容,最好全部被百度收录,大家记住找准百度更新数据库时间点,灵活掌握可用资源,例如高权重站点的外链支持,推荐专栏的权重支持,很多写专栏的SEOer都有艾瑞专栏,admin5,斗牛士等等高权重网站的专栏,不妨吧新发布的原创文章内容的URL可以利用权重高的资源外链支持下,待收录了也就可以取消外链再次回收利用了,会让你站点被百度快速收录效果。
这段时间忙碌些事也没有写博客了,感觉失去了好多时间接触网络,发现自己离大家渐远了,以后得加快进度学习了,徐倩SEO博客www.hongren.org 欢迎大家常来。