ข้อมูลทางสถิติของ Google Analytics และ Baidu Statistics นั้นแตกต่างกัน และความแตกต่างก็มีมาก เหตุผลพื้นฐานก็คือหลักการและกลไกของสถิติข้อมูลนั้นแตกต่างกัน มาแบ่งปันการวิเคราะห์หลักการของ Google Analytics และ Baidu Statistics
การวิเคราะห์หลักการทำงานของสถิติไป่ตู้
JS ที่จัดทำโดย Baidu Statistics จะแนะนำโค้ดของ hm.baidu.com/h.js ลงในเพจ เนื้อหาของโค้ดจะแตกต่างกันไปตามพารามิเตอร์ต่อไปนี้ .id ในสถิติ Baidu
ในขณะที่ได้รับโค้ด h.js ทาง Baidu Statistics จะเขียนคุกกี้ชื่อ "HMACCOUNT" ลงในเบราว์เซอร์ของคุณ เวลาหมดอายุของคุกกี้นี้คือ 2038 ดังนั้นตราบใดที่คุณไม่ล้างคุกกี้ของเบราว์เซอร์ โดยพื้นฐานแล้วมันก็จะไม่มีวันหมดอายุ
หลังจากดาวน์โหลด h.js แล้ว สคริปต์จะถูกดำเนินการเพื่อรับข้อมูลที่เกี่ยวข้องกับเบราว์เซอร์และแหล่งที่มาของการเข้าถึง ข้อมูลที่ได้รับ ได้แก่ ขนาดหน้าจอ ความลึกของสี เวอร์ชัน Flash ภาษาของผู้ใช้ ฯลฯ
จากโค้ด js พารามิเตอร์ทั้งหมดจะรวมสิ่งเหล่านี้: "cc, cf, ci, ck, cl, cm, cp, cw, ds, ep, et, fl, ja, ln, lo, lt, nv, rnd, sb , se , si, st, su, sw, sse, v” ความหมายของพารามิเตอร์เหล่านี้มีดังนี้:
cc: ไม่รู้ ปกติจะเป็น 1
cf: ค่าของพารามิเตอร์ url hmsr
ci: ค่าของพารามิเตอร์ url hmci
ck: จะรองรับคุกกี้ 1:0 หรือไม่
cl: ความลึกของสีเช่น "32 บิต"
cm: ค่าของพารามิเตอร์ url อืม
cp: ค่าของพารามิเตอร์ url hmpl
cw: ค่าของพารามิเตอร์ URL hmkw
ds: ขนาดหน้าจอ เช่น '1024×768′
ep: ค่าเริ่มต้นคือ '0' ซึ่งเป็นตัวแปรเวลาที่สะท้อนถึงเวลาพักหน้า รูปแบบน่าจะเป็น: เวลาปัจจุบัน - เวลาในการโหลด + "," + ค่าเวลาเล็กน้อยอื่น
et: ค่าเริ่มต้นคือ '0' หากตัวแปร ep time ไม่ใช่ 0 ก็จะกลายเป็นอย่างอื่น
fl: เวอร์ชันแฟลช
ja:java รองรับ 1:0
ln: ภาษา zh-cn
lo: ไม่รู้ ปกติจะเป็น 0
lt: วันที่ time.time() เช่น "1327847756" ไม่สามารถใช้ได้ในคำขอแรก
nv: ฉันไม่รู้ โดยปกติจะเป็น 1 หรือ 0
rnd: ตัวเลขสุ่มสิบตัว
sb: หากเป็นเบราว์เซอร์ 360se ค่าจะเท่ากับ '17'
se: เกี่ยวข้องกับเครื่องมือค้นหา
si: รหัสรหัสทางสถิติ
เซนต์:
su: หน้าก่อนหน้า document.referrer
sw: ฉันไม่รู้ มันอาจเกี่ยวข้องกับเครื่องมือค้นหา มันมักจะว่างเปล่า
sse: ฉันไม่รู้ มันอาจเกี่ยวข้องกับเครื่องมือค้นหา มันมักจะว่างเปล่า
v: เวอร์ชันของรหัสทางสถิติ ปัจจุบันมีค่าเป็น "1.0.17"
เมื่อพารามิเตอร์เหล่านี้ได้รับการตั้งค่าทั้งหมดแล้ว (พารามิเตอร์บางตัวไม่ได้กำหนดค่าไว้) ให้กรองพารามิเตอร์ที่กำหนดออกและใช้เป็นพารามิเตอร์ของ hm.baidu.com/hm.gif เพื่อรวม URL เข้าด้วยกัน เช่น: http://upload chinaz .com//?cc=1&ck=1&cl=32-บิต & ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn แล้วขอรูป..
เซิร์ฟเวอร์สถิติ Baidu ได้รับคำขอนี้และรับข้อมูลที่เกี่ยวข้องจากพารามิเตอร์ที่แนบมากับ URL ของรูปภาพเพื่อบันทึกบันทึกการเข้าถึงของผู้เยี่ยมชม เมื่อผู้ใช้ปิดเพจ มันจะทริกเกอร์คำขอสำหรับ hm.gif แต่สิ่งนี้ เบราว์เซอร์บางประเภทไม่รองรับขั้นตอนนี้ และไม่ใช่การดำเนินการปิดทั้งหมด
เมื่อใช้การทดสอบ Wireshark (เครื่องมือจับแพ็กเก็ตเครือข่าย) พบว่าเบราว์เซอร์ส่งคำขอทั้งหมด 4 รายการไปยังเซิร์ฟเวอร์:
ขอสคริปต์ js
เมื่อการโหลดเสร็จสมบูรณ์ ให้เริ่มคำขอและส่งพารามิเตอร์
เมื่อออกจากเพจให้ทำการร้องขอและส่งพารามิเตอร์ไปเทียบกับที่กล่าวมาข้างต้นพบว่าพารามิเตอร์ ep มีการเปลี่ยนแปลง
สถิติ Baidu ขึ้นอยู่กับคุกกี้ เมื่อมีการร้องขอสคริปต์ js คุกกี้ถาวรจะถูกบันทึกไว้ในคอมพิวเตอร์ของคุณ ซึ่งทำหน้าที่เป็น ID ผู้ใช้ของคุณ ขณะเดียวกันก็พบว่าพารามิเตอร์ ep เปลี่ยนจากค่าเริ่มต้น 0 เป็น "7289%2C115" เมื่อออกจากระบบ กลายเป็น "7289,115" ซึ่งก็คือ 2 มิลลิวินาที คือ 7.2 วินาที และ 0.1 วินาที ในเวลาเดียวกัน พารามิเตอร์ lt (เวลา, javascript: (new Date).getTime()) ยังคงไม่เปลี่ยนแปลงเมื่อร้องขอ hm.gif ในสองครั้งแรก ตัวเลขสุ่มลำดับที่ 1 จะเปลี่ยนทุกครั้ง
Google Analytics ทำงานอย่างไร
เมื่อผู้ใช้เยี่ยมชมหน้าเว็บที่มีรหัสสถิติของ Google Analytics เบราว์เซอร์ของผู้ใช้จะเรียกใช้โค้ดนี้ และหน้าที่ของโค้ดนี้คือการรวบรวมข้อมูลของผู้เข้าชม เช่น URL ของหน้าเว็บที่ดู ประเภทของเบราว์เซอร์ ระบบปฏิบัติการ , ภาษาของระบบ, ความละเอียดหน้าจอ ฯลฯ
จากนั้นรหัสสถิติของ GA จะจัดเก็บข้อมูลผู้เยี่ยมชมนี้ไว้ในคุกกี้ คุกกี้คือข้อความสั้นที่จัดเก็บไว้ในเครื่องและเชื่อมโยงกับเว็บไซต์ที่เยี่ยมชม แหล่งที่มาที่แนะนำของเพจและข้อมูลการดูเพจถัดไป ฯลฯ
สุดท้าย ข้อมูลที่รวบรวมทั้งหมดจะถูกส่งไปยังเซิร์ฟเวอร์ข้อมูลของ Google Analytics กระบวนการนี้ค่อนข้างฉลาด เรารู้ว่าไฟล์บันทึกของเซิร์ฟเวอร์จะบันทึกข้อมูลคำขอแต่ละไฟล์ และวิธีที่ Google Analytics รวบรวมข้อมูลคือการขอไฟล์รูปภาพ GIF ขนาด 1×1 แบบโปร่งใสจากเซิร์ฟเวอร์ ถูกบันทึกไว้ในบันทึกของเซิร์ฟเวอร์ และข้อมูลคำขอไฟล์ประกอบด้วยข้อมูลที่รวบรวมโดยรหัสสถิติ GA และข้อมูลคุกกี้ ด้วยวิธีนี้ เมื่อใดก็ตามที่รูปภาพ GIF นี้ได้รับการร้องขอ ข้อมูลการเข้าถึงของผู้เข้าชมจะถูกรวบรวมโดยเซิร์ฟเวอร์ข้อมูล Google Analytics .
อย่างไรก็ตาม Google Analytics จะส่งคำขอ GIF เพียงคำขอเดียว และหลายครั้งจะส่งคำขอ GIF หลายรายการ หากมีรูปภาพ GIF ที่ไม่สามารถนับได้ GA จะส่งคำขอ GIF อื่นๆ
สรุป:
Avinash ผู้เชี่ยวชาญด้านการวิเคราะห์เว็บไซต์เคยกล่าวไว้ว่า ตราบใดที่ข้อมูลมีความแม่นยำ 90% ก็สามารถดำเนินการได้ทันเวลา สิ่งสำคัญคือการสามารถดูแนวโน้ม ดำเนินการ ทดสอบ และเพิ่มประสิทธิภาพอย่างต่อเนื่อง
แหล่งที่มาของบทความ: บล็อกของ Lu Songsong โปรดระบุที่อยู่ของบทความนี้เมื่อพิมพ์ซ้ำ ขอบคุณ
(บรรณาธิการ: Yang Yang) พื้นที่ส่วนตัวของบล็อกของผู้เขียน Lu Songsong