1、为什么说空间非常重要?
搜索引擎的爬虫(百度的爬虫叫做蜘蛛,谷歌的爬虫叫做机器人)是一种依靠网址爬取所在网址的网站的页面的程序,我们称之为爬虫,它是自动运行的,它收集网址并且下载这个网站的页面的程序并对页面上的所有链接进行统计这包括内链和外链,统计之后再次进行爬取以txt文本的形式进行保存到它的服务器。
收录是分为2个过程;1、先通过爬取到某个页面(你提交的搜索引擎的链接)收集链接,2、爬到你网页并且下载该网页。1、缓存服务器(快照)2、SITE服务器(收录)3、索引列表服务器(排名)他们不是在同一个服务器上的这也是为什么我们的快照日期不同的原因。因为在不同服务器上所以会有不同步的现象例如:我们SITE一下域名没有首页,但是直接搜索域名却又有首页,这就是数据没有进行同步。
为什么说空间的稳定性非常重要呢?因为搜索引擎爬虫是模拟用户的行为习惯的来爬去网站内容。如果服务器不稳定或者打开速度很慢,爬虫来爬取网站的时候出现数据丢失或者爬去不到内容的时候它将对这个网站失去兴趣。所以无娽提醒SEOer们服务器的不稳定是会对SEO优化有着直接负面影响的。
2、那么我们应该如何来进行预防呢?
1、一定要经常性进行网站数据备份(网页数据和数据库数据),数据库备份网站文件整体打包下载到本地。万一被攻击挂马我们可以直接恢复数据,并修改FTP密码服务器密码或空间后台控制密码,并且暂时取消网站文件夹的写入权,FTP密码越复杂越好!
2、空间打开速度超过6秒钟对SEO相当不利,如果是因为网站图片太多Flash太多的,建议你将图片压缩处理最好不要超过50KB,flash能不用就不用吧,另外建议启用服务器的压缩传送功能。还有一种原因是因为调用,尤其是调用天气预报,只要调用的网站打开网站较慢,自己的网站也会很慢,那种在线留言软件和网站统计有一个就行了,多了也会影响网站的打开速度。记住一点:调用代码用大越多打开速度越慢!如果都不是以上原因那极有可能是空间或服务器打开速度慢,请与空间商或机房沟通解决如果不能解决一定果断更换,如果更换空间或服务器请记住几个要点:
第一先把数据(网页文件和数据库)然后再转移,
第二转移前测试空间或服务器速度,
第三先启用二级域名进行调试或者用这个空间商送的三级域名进行调试,
第四进行域名解析域名解析最好在用户访问量最少的时间,
第五解析域名以后,原空间要保障24小时稳定,原空间不能关闭,原空间数据不能清除,因为DNS解析全球生效时间为5分钟到24小时,很多老用户都存有原ip的缓存且每个地区DNS解析生效时间是不同的,而且蜘蛛也是有缓存的。
3、如何选择合理的空间?
第一要支持伪静态的空间,现在大多数网站源码都是动态伪静态的,所以必须支持伪静态。
第二最好能够提供IIS日志查询,如果想了解爬虫在网站上的动向就必须查看IIS日志,并且IIS日志最好能够分每个小时生成一份。
第三最好支持 php+MySQL 空间,大部分站长用的都是php+mysql的网站源码。
第四要支持空间后台在线解压功能,如果不支持后台在线解压与压缩我们上传文件或备份将耗费我们很多很多时间。
第五要支持301重定向和404错误页面绑定,301重定向能够让我们的网站权重集中或者权重转移,404错误页面是对用户和爬虫的友好表现。
第六最好不限制IIS并发数,限制IIS并发数的空间只要被线程攻击就会直接瘫痪。
第七有问题技术能够在12小时左右能够解决。
责任编辑:陈龙 作者 無娽 的个人空