网站首页 > 站长资讯 > 搜索&SEO > 浅谈百度收录和文章采集使用心得

浅谈百度收录和文章采集使用心得

  • 作者:互联网
  • 时间:2009-07-07 16:45:48

  大家好,我叫浮云,三天前在这里发过一个建站经历和给新手站长的建议。详情见: http://admin5.com/plus/view.php?aid=159305

  前天晚上真的很开心,为什么?因为我的80易讯网上线一天半就让百度收了,虽然只收了个主页,但这么快的速度着实让我开心,这里引用我朋友的原话"什么世道。老子一个多星期才被百度收了,你还不到两天就..." 嘿嘿。

  在这里首先说一下关于百度收录的小心得吧。

  首先到百度提交网站。

  写文章投稿A5,带上链接,但不要做AD做得太过火,带链接目的只是靠A5的百度权重,使百度蜘蛛逛的时候发现有你这么一个站,或者发到其他权重高的地方也是可以,这就不多说了。

  还有个原因我是昨天早上才发现的,应该对收录关系蛮大的。我只在A5发了这个帖子,但是我外链却多了好几个,为什么 ? 是因为采集工具,昨天早上我朋友发QQ给我说,你小子还真会写文章啊,我就说你看到了? 然后他就发了个地址给我,但不是A5的地址,我才明白为什么会突然多了那么多外链,我不清楚A5有没有防采集,但是那篇文章是跟A5上的一模一样,即使不是工具采集,那也一定是人工采集了,写软文发到大站的好处不只是因为他们百度权重高,还有个原因是他们在网友中的权重也高,是采集的首选网站。

  关于收录我也只有这一点点心得了,希望百度能多收我几页啊。

  对,上面说到采集,之前我是有点不屑的。我推崇原创,但后来发现个人站长不用采集真的很麻烦。不过我只认为采集用来采集新闻和资讯类就好了,因为这些东西不是咱们个人站长能够写出来的,所以我今天为了娱乐八卦的板块,特地去研究了一下午的采集。我用的是DE***MS5.3里附带的采集工具,简单介绍一下。

  采集总的来说分3步 :获取规则、匹配规则、过滤。

  获取规则就是说,获取文章列表网址,例如你找到XX网站的列表页。然后你看一下列表页第一页的地址还有后面几页的地址,比方说第一页地址后最是001.html 第二页后缀为002.html 第三页为003.html 那么这里就有个规则了,就是后面的比前面的+1 那么你选中批量生成网址列表,然后匹配网址里输入地址,地址里变动的地址换成(*) 你想获取几页列表那就在下面的(*)输入从1到第几页。

  匹配规则是说,列表页从哪里到哪里是你要获取的网址。那么打开列表页源代码,找到你所要的开头部分和结尾部分,要注意一点,所找的一定要是代码里唯一的,具体可以点编辑-查找。

  接下来就是过滤掉文章页里不需要的内容了,这个也不难理解,也不多说了。

  不会用的朋友稍微去研究下,其实不难的。不懂的话可以加我QQ 1040050341 小AD一下,80易讯网--年轻人的互动社区 ww***ngling.cn 欢迎常来坐坐,嘿嘿。

  本文首发ADMIN5,转载需注明,不怕转载,就怕转载删链接的,囧。