栏目设置 为网站搭建“骨架”
第一步:策划为先。网站的栏目设置是建站之初最为重要的步骤,因为一旦确定了栏目,网站的定位也就基本成形,如果运营一段时间后再进行修改,则会造成多方面的损失,诸如目标访客流失、搜索引擎权重降低等。所以说在建立网站栏目的时候一定要深思熟虑,先策划好之后再进行添加。
第二步:多加考查。确定想添加的栏目之后,还得先考查这类栏目是否受到网友欢迎,想想看,当你建立一个栏目后每天认真地维护更新,但是却因为定位偏差导致无人问津,岂不是白白浪费时间?要了解访客的爱好,第一种方法是可以考查其他类似的网站来获得灵感。另外还可以通过搜索引擎的排行榜获得某个领域的关注度,从而确定栏目的定位,如百度的风云榜就是很好的工具(图1)。
第三步:确立定位。同样的领域也会有不同的栏目定位,比如你准备做一个有关笔记本信息的栏目,是介绍笔记本行业的最新资讯,还是提供笔记本的软件下载,抑或是笔记本的导购服务呢?栏目的定位也要注意与网站统一,比如本文的例子是一个IT资讯类网站,则定位就是笔记本方面的新闻内容。
巧用采集 快速收集网站内容
网站建立初期往往都缺乏文章,而没有内容是无法留住访客的,要快速地获得优质内容,我们可以从其他网站进行转载。这里我们就以数动连线为例,将上面的文章快速地转载到自己的网站中。“火车头采集器”是一款方便实用的内容采集程序,支持采集远程文章以及图片等功能,下面我们就以该软件为例进行说明。
小提示:由于软件是基于.NET程序架构,所以使用前必须安装Microsoft .NET Framework 2.0组件,否则程序将无法正常运行。
第一步:建立站点添加规则
下载软件并解压缩后即可使用,在任务列表面板中点击右键,新建一个采集站点,接着在弹出的站点新建窗口中输入站点的名称网址等信息。而后切换到软件的“整站内容规则”页面,这是采集中最重要的一步。如果稍有设置不当就可能出现错误。一般的文章转移我们需要填写包括标题、内容、时间在内的基本信息(图2)。
要确定网页的内容规则,可以打开需要采集的内容页面,在浏览器中选择“查看→源代码”查看网页的HTML代码,在代码中寻找标题字段,如标题开始标记是,则在软件的标签编辑框中输入这两个字段。然后按照同样的方式进行文章内容、作者、来源、时间等标记的查找和添加,一般我们需要对多个文章页面进行查看核对,以避免出现标签错误的情况。
如果需要同时采集网页中的其他信息,可以点击“添加标签”按钮,进行采集对象的添加,软件不仅支持通过采集得到数据,还可以设置固定格式的数据。
小提示:初次添加数据规则时可能会觉得操作困难,但只要多试几次并仔细研读软件说明文档,理解原理后就可以很容易地进行数据规则的编写了。
第二步:建立采集任务
在刚才添加的站点名称上点击右键,选择“从该站点新建任务”选项,将出现采集网址菜单。软件提供了三种网址采集模式,如果目标网站有对应的文章列表页,则可以使用“1级链接”方式,该方式的原理是通过内容列表页面自动检测出内容页面,从而进行网页内容的采集。
如果目标网址文件名称有一定的规律,我们也可以直接添加需要采集的内容页网址。这里我们以数动连线的新闻资讯栏目为例子说明http://news.shudoo.com/,它的列表页面是http://news.shudoo.com/index.php?limitstart=16,我们就可以直接输入这个地址。
任务添加完成后可以先进行测试,点击软件右下方的“开始测试网址采集”按钮进入测试页面,软件将根据刚才填写的网址规则进行采集,待地址搜索完成后,可以选择任意文章进行测试。如果软件能正常显示所采集页面的内容,说明采集规则设置成功;如果不能显示内容,则需要重新进行规则的设置(图3)。
第三步:采集并发布内容
完成以上步骤后,还需要设置采集内容的发布方式,软件目前提供了多种内容发布方式。既可以直接发布到网站程序中,也可以保存为本地文件。如果想直接发布到网站程序中,则需要有对应的程序发布模块,软件自带了若干程序模块,包括了大多数流行的文章系统。如果没有我们需要的模块,可以到软件官方论坛进行查找。
设置完成后,就可以采集文章并发布到网站了,在软件主面板中选择需要采集的网站名称,然后点击面板上方的开始按钮,软件将自动进行内容的采集。如果需要采集的内容很多,则需要等待较长时间。等到所有的文章采集完成后,内容将自动发布。http://it.endto.com/hulianwang-news/就是我们通过火车头软件采集的演示范例。 (秋风)
注:虽然采集软件可以方便地获取大量文章,不过在使用的时候一定要注意版权,对一些允许转载的文章也要注明出处。