做搜尋引擎優化(SEO),外部連結建設當中提到比較多的就是連結的相關性的說法,畢竟呢,你的這些外部連結大部分是做給搜尋引擎看的,而搜尋引擎是靠蜘蛛程序來抓取得。
記住,“蜘蛛”是個抓取“程式”,不是“人工智慧”。他不會用人類的判斷邏輯來判斷相關性,而是一些“邏輯程序”,畢竟蜘蛛程式並不複雜(對比來說)。
明白了上述情況,我來說說我自己對「相關性」的看法和建設心得,不對之處,還請大家指正。
你的網頁和你網頁中的內容相關性,在蜘蛛程式中的判斷:
假設你的網頁是新的網頁,剛做了不到2天,剛提交,蜘蛛根據“抓取索引”,過來抓取(或通過其他形式的鏈接)。
首先,蜘蛛透過各種連結來到了你的網頁,對他來說,新的網頁特徵就是從網頁程式碼中的部分中的<head>部分中的<title>標籤裡的元素來判斷的。
假設蜘蛛來到的你這個網頁,抓取了網頁中的<title>文字:我的動漫論壇-新動漫- 動漫新主張!
蜘蛛首先會以抓取<title>中的文字做為「關鍵字」為參考,然後去從網頁程式碼中去尋找相關的「關鍵字」。
你可以放心,蜘蛛可以判斷一些JS程式碼和頁面中的標籤,他會比較重視正文和div塊中的標題部分的“關鍵字”,也就是<h1>-<h4>一系列的。這也可以驗證大家說的,為什麼<h1>-<h4>中的內容,會比其他<body>中的文字內容權重高的原因。然後蜘蛛會把<tilte>中在正文<body>部分重複次數最多的詞,定為「參考關鍵字」(當然了,有個重複限度,搜尋引擎會設定並嵌入蜘蛛程式裡)。
然後蜘蛛自己也會根據“參考關鍵字”判斷“關鍵字擴展”(根據搜尋引擎的相關類的常用數據關鍵字和title中關鍵字分析對比),綜合以上,確定大體的“關鍵字”,做為下一步頁面抓取的參考。
下一步,蜘蛛會計算(這個簡單的資料計算功能還是有的)所有關鍵字在網頁程式碼中出現的數量,作為基數。然後計算<body>標籤中「關鍵字」的數量,作為分子(汗,想不出什麼詞了,通俗第一)。然後一除,就得到了你這個頁面的關鍵字密度。
密度出來了以後,搜尋引擎自己會有個標準判斷(人為設計的參數),有個等級是最合理的,是一般的還是最差的,這個標準時刻在變,總之是根據一段時期的數據進行調整的(就是讓你隔段時間鬧一回心)。
好了,密度的判斷出來後,進行本頁的關鍵字差異比較。
以<tilte>中的關鍵字為基礎,綜合了“擴展關鍵字”的參考,對比在<body>部分中抓取的“關鍵字”,對比他們每個文字上的差別,差別也分個等級,差別不大的,成為了長尾關鍵字,差別大的,就被捨棄做為這個頁面的搜尋關鍵字,這個和「關鍵字密度」判斷方法相同。 這樣,頁面長尾詞和搜尋關鍵字就確定了下來。
當密度和頁面關鍵字差異這2項得到了2個結果後,會有個權數加的計算公式(引擎自己定的,也定期根據數據調整),得出一個對「相關性」的得分(類似baidu指數的演算法),從而判斷頁面的關鍵字,確定頁面內容和關鍵字的相關性連結程度。
頁面的關鍵字和頁面內容的相關性就這麼得出來的。
那麼,外部連結的相關性怎麼判斷?好,下面談談,進入第2部分
外部連結和網頁相關性的判斷:
單向連結:他網頁連結到你的網頁的連結。
在他的網頁上,你網站的連結錨文字描述必須是和他連結到你的這個頁面的關鍵字相關,或相近,蜘蛛的判斷方法和第一部分一樣,只不過起始的「關鍵字」參考,變成了在他網頁上,你的網頁的連結錨文字。
話說回來,這個網頁的相關性和你的網站有多高,這個蜘蛛怎麼判斷?
這個連結錨文字就成了橋樑和參考。
關係可以理解為這樣:你的網頁的關鍵字VS(相關度判斷,設為A)→ 錨文字(為鏈向你的網頁上的錨文字)←(相關度判斷,設為B)他的網頁的關鍵字。
PS:判斷A和B的方法,參考第一部分:你的網頁和你網頁中的內容相關性,在蜘蛛程式中的判斷。
A和B得出後,進行對比,差值在一定範圍內,蜘蛛會有個等級標準(人為設定)。例如A和B差10%以內,為相關度最高,2個網頁權重增加,增加為一個權數的算式結果(可能只是對網頁的品質有影響,排名的影響不太清楚,待觀察);10 %-15%........等等,我就不寫了。
友情連結:
涉及2個頁面上的錨文字,方法大同小異。
你的網頁的關鍵字VS(相關度判斷,設為A)→ 錨文字(其中一個網頁上的錨文字)←(相關度判斷,設為B)他的網頁的關鍵字
你的網頁的關鍵字VS(相關度判斷,設為C)→ 錨文字(另一個網頁上的錨文字)←(相關度判斷,設為D)他的網頁的關鍵字
A和B 比較得出一個權數算式結果:E ;
C和D 比較得出一個權數算式結果:F
E和F 最後進行對比,得出最後的權數算式結果。
從而判斷2個網頁在交換連結中,2個網頁的相關性判斷。
以上情況適合於單向的連結相關性判斷,和友情連結相關性判斷。
本人經驗,如有錯誤,歡迎大家拍磚指正!