動態連結是指網頁中爬蟲無法辨識的連結。爬蟲的連結提取器不能從網頁中提取所有的鏈接,因為有一些可能儲存在特定格式(如JavaScript)中,而連結提取器無法對這種格式解碼。這種連結的格式直接影響到爬蟲爬取頁面的數量。下面描述了一種類型的動態連結。
早期網路中的連結只有一種簡單的格式。它們必須以“開始,以”結束。引用標記是可選的,可以插入空格符,但是一個爬蟲只需要在網頁中查找“
有效遍歷的障礙不僅包括JavaScript還包括Java和Shockwave。網站設計者需要注意:如果希望自己的網站能夠被商業搜尋引擎的爬蟲訪問,就必須保證所設計的網頁中有足夠多的「標準」連結(即HTML連結)。
本文由減重瘦吧www.jfs8.cn 站長:小時候供稿seo連結交換群:90108722