网站IIS日志是个很重要的东西之一,因为那里可以查询到搜索引擎的机器人爬行情况,也能了解到自己的网站一些情况,能分析到某些用户的来路,不一定用流量统计代码去计算,但看网站IIS日志也有的空间商限制的,得要通知开通才可以,也有的不支持,也可以到网上下载一些代码来安装,网站IIS日志存根也要点空间,网站容量不是很大的话,都会一下子超额了,所以要找好点的空间商来放网站。那我就谈谈下网站日志分析对优化有什么帮助呢?
一、了解搜索引擎蜘蛛爬行次数
蜘蛛是搜索引擎派来抓取内容的机器人,了解蜘蛛爬行次数才知道我们的网站是否搜索引擎喜欢的,反之这个网站没什么继续抓取了,能够对比的来的次数的,对比的以前的四周的操作对比能够知道蜘蛛来的多少是哪些东西引起的是网站外链还是网站的更新,从而调整的网页,蜘蛛喜欢原创内容,要是都是一些直接复制粘贴过来的转载内容,下次也许蜘蛛就不会再来了,感觉这个网站就是某个网站的镜像站。
对于有害的蜘蛛我们要是的屏蔽的(屏蔽的蜘蛛的ip)蜘蛛也是很多种,要是哪天发现多次出现某个不明的蜘蛛IP网站却被降权或被K,那我们就得必须禁止这个蜘蛛的IP访问。
蜘蛛的大量访问能够增加服务器的资源,蜘蛛的频繁访问还是对网站有帮助的,但资源消耗也是很大,所以要找个好的空间商来放,不然一下子服务器垮了,那可能就不在通知你的情况下删除你的网站掉了。
百度俱乐部:看假冒蜘蛛的识别(为了偷取别的数据),最重要的是百度蜘蛛都是显示北京那边的IP,如果是其它的地方就不是真正的蜘蛛了,也有降权和被K的蜘蛛,小心谨慎查看哦。
二、网站页面抓取程度
如果是喜欢抓取首页的话,那快照都是隔天的了,内页频繁的话也是秒收情况,如果某部分的页面没被抓取,那就查看是否禁止了蜘蛛的爬行,做外链的时候不能大部分做首页的,也要适当的做内页,不然收录就很低,还能知道我们网站出现了什么的问题,蜘蛛主要爬去的是哪些页面或哪些页面爬去是比较频繁的还有哪些页面是没有爬去的,我们要结合起来分析,那个目录收录比较多那个少进行对比(找空间商提供IIS日志)还要查看的变化,搜索引擎在不同的时期的爬去的情况是不一样的,是因为的转载,还是因为外链。
三、http状态码的分析
蜘蛛抓取完毕后一般都留下了http状态码,返回的是200不代表会直接放出,有的是一个星期更新就放出,有的是一个月才放的,只要返回了这个代码,一般这个页面都会被放出的。
两个问题:
1.我们的做的错误页面应该返回404还是200?
应该返回404四正确的,因为这样的搜索引擎才知道的网页不能访问,如果是200的话,那就可能造成降权或是被K的情况了,代表这个网页还是可以抓取的,一旦发现大量的都是访问不了的,那就会给予惩罚,所以要做好404页面的。
2.如果我们的网站要备案,我们正在建设当中,我们因该返回那个状态码是500、还是400、还是404、还是500、还是503?
要返回503(503是告诉搜索引擎暂时不能访问,马上会恢复,如果返回其他的状态码可能搜索引擎就不会访问了,404页面是代表这个页面已经不存在了,那搜索引擎就会认为你的网站已经不存在了,就直接删除了,暂时的话下次会继续来抓取的。)
网站做了301永久重定向返回的代码却没有,那就得查询下是否设置的正确,不然权重就不会转移到新的域名去了,什么事情都要做好万无一失的。
四、专业的日志分析工具
能够让我们知道的pv访问值和攻击性的访问值
pv是留住用户的体现,如果跳出率太高了,那这个网站就是打不开或是内容没可读性,网站就逃不了排名被端的命运,也查看到什么页面是访问最高的,这样就能摸索出用户的需求来改善。网站长期打不开或是打开很慢,就得看下日志里是否有不明的IP的大量访问,那可能就是被攻击了,这样我们只能妥协或是报案,不然就换别的服务器,但换汤不换药,还是不能解决问题的,最好还是采取法律的手段来保护自己的利益。
(一个网站的好和坏直接决定的是用户的点击)
用户都不点击你的网站,就说明你的网站没有说服力,也没有吸引性,就不是什么好网站,除了擦边和违法的网站,你的产品描述不够详细,图片不够清晰,客服不给力,那还有什么人会继续在你的网站留下呢?要做好用户体验是一门功课的。
日志分析工具:
(1).awstats、
(2).Webalizer
还能够分析网站的状态码
网站IIS日志对优化还是有很大帮助的,不要忽视任何一些细节,IIS日志不但可以知道你的网站是否对用户有帮助,还能让搜索引擎知道是否适合它的喜欢,能知道网站一些情况,降权和被K的预兆都能在网站IIS日志代码了解到,转载请注明 www.bole110.com 出处,谢谢合作啦!
责任编辑:陈龙 作者 wangruolun 的个人空