欄目設置為網站搭建“骨架”
第一步:策劃為先。網站的欄目設置是建站之初最為重要的步驟,因為一旦確定了欄目,網站的定位也就基本成形,如果運營一段時間後再進行修改,則會造成多方面的損失,諸如目標訪客流失、搜索引擎權重降低等。所以說在建立網站欄目的時候一定要深思熟慮,先策劃好之後再進行添加。
第二步:多加考查。確定想添加的欄目之後,還得先考查這類欄目是否受到網友歡迎,想想看,當你建立一個欄目後每天認真地維護更新,但是卻因為定位偏差導致無人問津,豈不是白白浪費時間?要了解訪客的愛好,第一種方法是可以考查其他類似的網站來獲得靈感。另外還可以通過搜索引擎的排行榜獲得某個領域的關注度,從而確定欄目的定位,如百度的風云榜就是很好的工具(圖1)。
第三步:確立定位。同樣的領域也會有不同的欄目定位,比如你準備做一個有關筆記本信息的欄目,是介紹筆記本行業的最新資訊,還是提供筆記本的軟件下載,抑或是筆記本的導購服務呢?欄目的定位也要注意與網站統一,比如本文的例子是一個IT資訊類網站,則定位就是筆記本方面的新聞內容。
巧用採集快速收集網站內容
網站建立初期往往都缺乏文章,而沒有內容是無法留住訪客的,要快速地獲得優質內容,我們可以從其他網站進行轉載。這裡我們就以數動連線為例,將上面的文章快速地轉載到自己的網站中。 “火車頭採集器”是一款方便實用的內容採集程序,支持採集遠程文章以及圖片等功能,下面我們就以該軟件為例進行說明。
小提示:由於軟件是基於.NET程序架構,所以使用前必須安裝Microsoft .NET Framework 2.0組件,否則程序將無法正常運行。
第一步:建立站點添加規則
下載軟件並解壓縮後即可使用,在任務列表面板中點擊右鍵,新建一個採集站點,接著在彈出的站點新建窗口中輸入站點的名稱網址等信息。而後切換到軟件的“整站內容規則”頁面,這是採集中最重要的一步。如果稍有設置不當就可能出現錯誤。一般的文章轉移我們需要填寫包括標題、內容、時間在內的基本信息(圖2)。
要確定網頁的內容規則,可以打開需要採集的內容頁面,在瀏覽器中選擇“查看→源代碼”查看網頁的HTML代碼,在代碼中尋找標題字段,如標題開始標記是,則在軟件的標籤編輯框中輸入這兩個字段。然後按照同樣的方式進行文章內容、作者、來源、時間等標記的查找和添加,一般我們需要對多個文章頁面進行查看核對,以避免出現標籤錯誤的情況。
如果需要同時採集網頁中的其他信息,可以點擊“添加標籤”按鈕,進行採集對象的添加,軟件不僅支持通過採集得到數據,還可以設置固定格式的數據。
小提示:初次添加數據規則時可能會覺得操作困難,但只要多試幾次並仔細研讀軟件說明文檔,理解原理後就可以很容易地進行數據規則的編寫了。
第二步:建立採集任務
在剛才添加的站點名稱上點擊右鍵,選擇“從該站點新建任務”選項,將出現採集網址菜單。軟件提供了三種網址採集模式,如果目標網站有對應的文章列表頁,則可以使用“1級鏈接”方式,該方式的原理是通過內容列表頁面自動檢測出內容頁面,從而進行網頁內容的採集。
如果目標網址文件名稱有一定的規律,我們也可以直接添加需要採集的內容頁網址。這裡我們以數動連線的新聞資訊欄目為例子說明http://news.shudoo.com/,它的列表頁面是http://news.shudoo.com/index.php?limitstart=16,我們就可以直接輸入這個地址。
任務添加完成後可以先進行測試,點擊軟件右下方的“開始測試網址採集”按鈕進入測試頁面,軟件將根據剛才填寫的網址規則進行採集,待地址搜索完成後,可以選擇任意文章進行測試。如果軟件能正常顯示所採集頁面的內容,說明採集規則設置成功;如果不能顯示內容,則需要重新進行規則的設置(圖3)。
第三步:採集並發佈內容
完成以上步驟後,還需要設置採集內容的發布方式,軟件目前提供了多種內容髮布方式。既可以直接發佈到網站程序中,也可以保存為本地文件。如果想直接發佈到網站程序中,則需要有對應的程序發布模塊,軟件自帶了若干程序模塊,包括了大多數流行的文章系統。如果沒有我們需要的模塊,可以到軟件官方論壇進行查找。
設置完成後,就可以採集文章並發佈到網站了,在軟件主面板中選擇需要採集的網站名稱,然後點擊面板上方的開始按鈕,軟件將自動進行內容的採集。如果需要採集的內容很多,則需要等待較長時間。等到所有的文章採集完成後,內容將自動發布。 http://it.endto.com/hulianwang-news/就是我們通過火車頭軟件採集的演示範例。 (秋風)
注:雖然採集軟件可以方便地獲取大量文章,不過在使用的時候一定要注意版權,對一些允許轉載的文章也要註明出處。