تختلف البيانات الإحصائية لـ Google Analytics وBaidu Statistics، والاختلافات كبيرة جدًا والسبب الأساسي هو اختلاف مبادئ وآليات إحصاءات البيانات. دعونا نشارك التحليل الأساسي لـ Google Analytics وBaidu Statistics.
تحليل مبدأ عمل إحصاءات بايدو
يقدم JS الذي توفره Baidu Statistics بشكل أساسي رمز hm.baidu.com/h.js في الصفحة. وسيختلف محتوى الكود وفقًا للمعلمات التالية. هل ما تبحث عنه هو ما تبحث عنه معرف في إحصائيات بايدو.
أثناء الحصول على رمز h.js، ستكتب Baidu Statistics ملف تعريف ارتباط باسم "HMACCOUNT" إلى متصفحك. وقت انتهاء صلاحية ملف تعريف الارتباط هذا هو 2038، لذا طالما لم تقم بمسح ملف تعريف ارتباط المتصفح، فلن تنتهي صلاحيته أبدًا.
بعد تنزيل h.js، يتم تنفيذ البرنامج النصي الخاص به للحصول على بعض المعلومات المتعلقة بالمتصفح ومصادر الوصول، وتتضمن المعلومات التي تم الحصول عليها حجم الشاشة وعمق الألوان وإصدار الفلاش ولغة المستخدم وما إلى ذلك.
من كود js، تتضمن جميع المعلمات ما يلي: "cc، cf، ci، ck، cl، cm، cp، cw، ds، ep، et، fl، ja، ln، lo، lt، nv، rnd، sb ، se ، si، st، su، sw، sse، v”. معنى هذه المعلمات تقريبًا كما يلي:
نسخة إلى: لا أعرف، عادةً 1
cf: قيمة معلمة url hmsr
ci: قيمة معلمة url hmci
ck: ما إذا كان سيتم دعم ملفات تعريف الارتباط 1:0
cl: عمق الألوان مثل "32 بت"
cm: قيمة معلمة url hmmd
cp: قيمة معلمة url hmpl
cw: قيمة معلمة url hmkw
ds: حجم الشاشة، مثل "1024×768"
ep: القيمة الأولية هي '0'، وهو متغير زمني يعكس وقت بقاء الصفحة، ومن المحتمل أن يكون التنسيق: الوقت الحالي - وقت التحميل + "،" + قيمة زمنية صغيرة أخرى
et: القيمة الأولية هي '0'، إذا لم يكن متغير الوقت ep 0، فسيصبح شيئًا آخر
فلوريدا: نسخة فلاش
جا: جافا يدعم 1:0
ln: اللغة zh-cn
لو: لا أعرف، عادة 0
lt: Date time.time()، مثل "1327847756"، غير متوفر في الطلب الأول
نيفادا: لا أعرف، عادة 1 أو 0
ر: عشرة أرقام عشوائية
sb: إذا كان متصفح 360se، فإن القيمة تساوي "17"
se: المتعلقة بمحركات البحث
si: معرف الرمز الإحصائي
شارع:
su: مستند الصفحة السابقة.referrer
sw: لا أعرف، ربما يكون مرتبطًا بمحرك البحث، وعادةً ما يكون فارغًا.
sse: لا أعرف، ربما يكون مرتبطًا بمحرك البحث، وعادةً ما يكون فارغًا.
v: إصدار الكود الإحصائي، القيمة حاليًا هي "1.0.17"
عندما يتم تعيين جميع هذه المعلمات (لم يتم تعيين قيم لبعض المعلمات)، قم بتصفية المعلمات المخصصة واستخدمها كمعلمات لـ hm.baidu.com/hm.gif لتجميع عنوان URL معًا، مثل: http://upload. chinaz .com//?cc=1&ck=1&cl=32-bit & ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn. ثم اطلب الصورة
يتلقى خادم إحصائيات Baidu هذا الطلب ويحصل على المعلومات ذات الصلة من المعلمات المرفقة بعنوان URL للصورة لتسجيل سجل وصول الزائر عندما يغلق المستخدم الصفحة، وسيؤدي أيضًا إلى تشغيل طلب hm.gif، ولكن هذا الإجراء غير مدعوم من قبل جميع المتصفحات وليس جميع إجراءات الإغلاق.
باستخدام اختبار Wireshark (أداة التقاط حزم الشبكة)، يمكن العثور على أن المتصفح أرسل إجمالي 4 طلبات إلى الخادم:
طلب برنامج نصي JS.
عند اكتمال التحميل، قم ببدء طلب وتمرير المعلمات
عند الخروج من الصفحة، قم بتقديم طلب وتمرير المعلمات. وبالمقارنة مع ما ورد أعلاه، تبين أن معلمة ep قد تغيرت.
تعتمد إحصائيات Baidu على ملفات تعريف الارتباط عند طلب برنامج نصي js، سيتم حفظ ملف تعريف ارتباط دائم على جهاز الكمبيوتر الخاص بك، والذي يعمل بمثابة معرف المستخدم الخاص بك. وفي الوقت نفسه، تم اكتشاف أن المعلمة ep تغيرت من الصفر الأولي إلى "7289%2C115" عند الخروج، وكانت "7289,115"، وهي وحدتان من المللي ثانية، أي 7.2 ثانية و0.1 ثانية. في الوقت نفسه، تبقى المعلمة lt (الوقت، جافا سكريبت: (new Date).getTime()) دون تغيير عند طلب hm.gif في أول مرتين. يتغير الرقم العشوائي في كل مرة.
كيف يعمل جوجل أناليتكس
عندما يقوم مستخدم بزيارة صفحة تحتوي على رمز إحصائيات Google Analytics، سيتم تنفيذ هذا الرمز بواسطة متصفح المستخدم، ووظيفة هذا الرمز هي جمع معلومات الزائر، مثل عنوان URL للصفحة التي تم مشاهدتها، ونوع المتصفح، ونظام التشغيل ولغة النظام ودقة الشاشة وما إلى ذلك.
يقوم رمز إحصائيات GA بعد ذلك بتخزين معلومات الزائر هذه في ملف تعريف الارتباط. ملف تعريف الارتباط هو نص قصير يتم تخزينه محليًا ويرتبط بموقع الويب الذي تمت زيارته، ويتم استخدامه لتحديد ما إذا كان المستخدم يزور للمرة الأولى أم عدة مرات المصدر الموصى به للصفحة ومعلومات عرض الصفحة اللاحقة، وما إلى ذلك.
وأخيرًا، سيتم إرسال جميع المعلومات التي تم جمعها إلى خوادم بيانات Google Analytics. هذه العملية ذكية للغاية، ونحن نعلم أن ملف سجل الخادم سيسجل معلومات كل طلب ملف، والطريقة التي يجمع بها Google Analytics البيانات هي عن طريق طلب ملف صورة GIF شفاف 1 × 1 من الخادم يتم تسجيلها في سجل الخادم، وتحتوي معلومات طلب الملف على البيانات التي تم جمعها بواسطة رمز إحصائيات GA ومعلومات ملفات تعريف الارتباط بهذه الطريقة، عندما تتلقى صورة GIF هذه طلبًا، سيتم جمع معلومات وصول الزائر بواسطة خادم بيانات Google Analytics .
ومع ذلك، يرسل Google Analytics طلب GIF واحدًا فقط، وفي كثير من الأحيان يرسل طلبات GIF متعددة. إذا كانت هناك صورة GIF لا يمكن إحصاؤها، فسيرسل GA طلبات GIF أخرى.
تلخيص:
قال خبير تحليل مواقع الويب أفيناش ذات مرة إنه طالما أن البيانات دقيقة بنسبة 90%، فيمكن اتخاذ الإجراء في الوقت المناسب. الشيء المهم هو أن تكون قادرًا على رؤية الاتجاهات واتخاذ الإجراءات ثم الاختبار والتحسين المستمر.
مصدر المقال: مدونة Lu Songsong، يرجى الإشارة إلى عنوان هذه المقالة عند إعادة الطباعة، شكرًا لك.
(المحرر: يانغ يانغ) المساحة الشخصية لمدونة المؤلف لو سونج سونج