用戶分析是網站分析中一個重要的組成部分,在分析用戶之前我們必須首先能夠識別每個用戶,分辨哪些是”New Customer”,哪些是”Repeat Customer”。這樣不但能夠更清晰地了解到底有多少用戶造訪了你的網站,分辨他們是誰(用戶ID、郵箱、性別年齡等);同時也能夠幫助你更好地追蹤你的用戶,發現它們的行為特徵、興趣愛好及個人化的設定等,以便更好地掌握使用者需求,提升使用者體驗。
通常當你的網站提供了註冊服務,而用戶註冊並登陸過你的網站,那麼用戶可以更容易地被識別,因為網站一般都會保存註冊用戶的詳細信息;但是你的網站並不需要註冊,而使用者的行為以瀏覽為主,這是使用者識別就會顯得較為困難,以下提供了幾種常用的使用者識別的方法:
識別使用者的幾種方法
當用戶並未註冊登入的情況下,識別用戶的唯一途徑就只剩下用戶瀏覽行為的點擊流數據,通常情況下它們會保存在WEB日誌裡面,關於WEB日誌的詳細說明可以參考我之前的文章——WEB日誌格式。而WEB日誌本身存在的缺陷可能導致使用者辨識的不準確性,關於WEB日誌的缺陷可以參考先前的文章-WEB日誌的作用和缺陷,所以我們在選擇使用者辨識方法的過程中,在條件允許的情況下盡量選擇較準確的方法:
1、基於ip的用戶識別
IP位址是最容易取得的訊息,任何的WEB日誌中都會包含,但其限制也較為明顯:偽IP、代理、動態IP、區域網路共享同一公網IP出口…這些情況都會影響基於IP來辨識用戶的準確性,所以IP辨識用戶的準確性比較低,目前一般不會直接採用IP來辨識用戶。
取得難度:★
準確度:★
2、基於IP+Agent的用戶識別
同樣基於最簡單形式的WEB日誌,我們可以增加一項-Agent,來提高單一IP方式辨識使用者的準確性。 Agent也是WEB日誌中一般都會包含的訊息,透過IP+Agent的方式可以適當地提高IP代理、公用IP這類情況下使用者的分辨度,同時透過Agent還可以辨識網路爬蟲等特殊“使用者”,但同樣準確度也欠高。
取得難度:★
準確度:★★
3.基於cookie的使用者識別
當你透過自訂Apache日誌格式或javaScript的方法取得使用者cookie的時候,其實你已經找到了一個更有效的使用者辨識的手段。 cookie在未被清除的其前提下可以認為是跟某個訪問客戶端電腦綁定的(一個客戶端有可能包含多個cookie),所以用cookie來標識用戶其實指的是用戶使用的客戶端電腦,而並非使用者本身。
用cookie識別使用者的方法當然也有缺陷:最常見的就是cookie被清除而導致使用者無法與原先記錄實現對應;同時由於客戶端電腦會被共用,或者使用者會在不同的電腦上造訪您的網站,這時候cookie就無法直接對應到該用戶了。
取得難度:★☆
準確度:★★☆
4.基於用戶ID的用戶識別
基於用戶ID的用戶識別是最為準確,因為一般情況下用戶不同共享他的用戶ID,所以我們可以認為數據中的userid唯一地指向該用戶,幾乎不存在偏差。當然要使用使用者ID來識別使用者是需要一定的前提條件的:網站必須是提供使用者註冊登入服務的,並且可以透過一些手段在點擊流資料中記錄userid。
取得難度:★★
準確度:★★★
所以對於一個需要使用者ID註冊登入的網站來說,使用者唯一識別碼的選擇可以遵從以下順序:當使用者註冊登入時以userid為準,當使用者在未登入狀態瀏覽時以使用者的cookie為準,當使用者未登入且cookie無法取得的情況下以IP+Agent為準;這樣就能從最大程度上辨識唯一使用者。
這裡推薦一個網站日誌中cookie項目的自訂設定方法,以便更好地識別使用者。 cookie是從用戶端存放的cookie檔案記錄中取得的,這個檔案裡面一般在包含一個cookieid的同時也會記下使用者在該網站的userid(如果你的網站需要註冊登陸並且該使用者曾經登入過你的網站且cookie未被刪除),所以在記錄日誌檔案中cookie項的時候可以優先去查詢cookie中是否含有使用者ID類的信息,如果存在則將使用者ID寫到日誌的cookie項,如果不存在則查找是否有cookieid,如果有則記錄,沒有則記為”-”,這樣日誌中的cookie就可以直接作為最有效的用戶唯一識別碼被用作統計。當然這裡要注意該方法只有網站本身才能夠實現,因為用戶ID作為用戶隱私資訊只有該網站才知道其在cookie的設定及存放位置,第三方統計工具一般很難取得。
取得使用者資訊的途徑
透過以上的方法實現使用者身分的唯一識別後,我們可以透過一些途徑來擷取使用者的基礎資訊、特徵資訊及行為訊息,然後為每位使用者建立起詳細的PRofile:
1) 用戶註冊時填寫的用戶註冊資料及基本資料;
2) 從網站日誌中得到的使用者瀏覽行為資料;
3) 從資料庫取得的使用者網站業務應用程式資料;
4) 基於使用者歷史資料的推導與預測;
5) 透過直接聯繫用戶或用戶研究的途徑所獲得的用戶資料;
6) 有第三方服務機構提供的用戶資料。
識別並獲取用戶資訊的價值
透過使用者識別及使用者基本資訊的收集,我們可以透過網站分析的各種方法在網站是實現一些有價值的應用:
基於使用者特徵資訊的使用者細分;
基於使用者的個人化頁面設定;
基於使用者行為資料的關聯推薦;
基於使用者興趣的定向行銷;
……
» 本文採用BY-NC-SA 協議,轉載請註明來源:網站資料分析» 《網站使用者的識別》