1. robots.txt & meta robots
現在大部分網站採用CMS,不需要被索引的內容肯定存在,因此robots.txt 極為重要。另外robots.txt 無法完全控制的內容也最好透過meta robots 阻止搜尋引擎的索引。千萬不要認為收錄越多越好,搜尋引擎從一個網站收錄到越多不相關的內容,相關內容被分散權重的可能性也越大。
2. 301 轉向與域名統一
有需要跳轉的內容一定要採用301轉向,302在Google那裡比較敏感,容易被判定為作弊,大部分頁面劫持就是透過302進行的。對於網域統一的問題,除了www.xxx.com 轉向至xxx.com,也應該保證www.xxx.com/a.html 能夠順利轉向至xxx.com/a.html。這個問題主要是針對百度,Google透過網站管理員工具就可以變相解決。
3. 相對路徑與管理入口
前面說了,網站大部分都採用cms。 cms的模板上的一些連結最好採取絕對路徑,否則隨著路徑變化404也會多出許多;很多CMS都預留了管理員登入入口,這個入口留在頁面上就會被搜尋引擎抓取到,即便阻止了索引像雅虎百度一類的搜尋引擎偶爾還是會將其納入收錄範圍,因此最好保證後台相關連結的孤立性,即從頁面刪除登入後台的入口。同時預留管理員連結也是一個安全隱患,容易被別有用心的人利用。
資料來源:http://yeeseo.com/html/3-neglected-seo-details.html