Les données statistiques de Google Analytics et de Baidu Statistics sont différentes et les différences sont très importantes. La raison fondamentale est que les principes et les mécanismes des statistiques de données sont différents. Partageons l'analyse principale de Google Analytics et Baidu Statistics.
Analyse du principe de fonctionnement des statistiques Baidu
Le JS fourni par Baidu Statistics introduit essentiellement le code de hm.baidu.com/h.js dans la page. Le contenu du code variera en fonction des paramètres suivants. Les paramètres suivant h.js sont-ils ce que vous recherchez ? .identifiant dans les statistiques Baidu.
Lors de l'obtention du code h.js, Baidu Statistics écrira un cookie nommé "HMACCOUNT" sur votre navigateur. Le délai d'expiration de ce cookie est 2038, donc tant que vous n'effacez pas le cookie du navigateur, il n'expirera pratiquement jamais.
Une fois h.js téléchargé, son script est exécuté pour obtenir certaines informations relatives au navigateur et accéder aux sources. Les informations obtenues incluent la taille de l'écran, la profondeur de couleur, la version Flash, la langue de l'utilisateur, etc.
À partir du code js, tous les paramètres incluent ceux-ci : "cc, cf, ci, ck, cl, cm, cp, cw, ds, ep, et, fl, ja, ln, lo, lt, nv, rnd, sb, se , si, st, su, sw, sse, v”. La signification de ces paramètres est à peu près la suivante :
cc : Je ne sais pas, généralement 1
cf: valeur du paramètre url hmsr
ci : valeur du paramètre url hmci
ck : S'il faut prendre en charge les cookies 1:0
cl : profondeur de couleur telle que "32 bits"
cm : valeur du paramètre url hmmd
cp : valeur du paramètre url hmpl
cw : valeur du paramètre d'URL hmkw
ds : taille de l'écran, par exemple ' 1024 × 768 ′
ep : La valeur initiale est "0", une variable de temps qui reflète le temps de séjour de la page. Le format est probablement : heure actuelle - temps de chargement + "," + une autre petite valeur de temps.
et : La valeur initiale est '0', si la variable de temps ep n'est pas 0, elle deviendra autre chose
fl:version flash
ja:java prend en charge 1:0
ln : langue zh-cn
lo : Je ne sais pas, généralement 0
lt : Date time.time(), tel que "1327847756", non disponible dans la première requête
nv : je ne sais pas, généralement 1 ou 0
rnd : dix nombres aléatoires
sb : S'il s'agit d'un navigateur 360se, la valeur est égale à '17'
se : lié aux moteurs de recherche
si : identifiant du code statistique
St:
su : page précédente document.referrer
sw : Je ne sais pas. C'est probablement lié au moteur de recherche. Il est généralement vide.
sse : Je ne sais pas. C'est probablement lié au moteur de recherche. Il est généralement vide.
v : version du code statistique, actuellement la valeur est "1.0.17"
Lorsque ces paramètres sont tous définis (certains paramètres ne reçoivent pas de valeurs), filtrez les paramètres attribués et utilisez-les comme paramètres de hm.baidu.com/hm.gif pour reconstituer une URL, telle que : http://upload. chinaz .com/?cc=1&ck=1&cl=32-bit & ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn. Demandez ensuite l'image.
Le serveur de statistiques Baidu reçoit cette demande et obtient des informations pertinentes à partir des paramètres attachés à l'URL de l'image pour enregistrer l'enregistrement d'accès du visiteur lorsque la page est fermée par l'utilisateur, il déclenchera également une demande pour hm.gif, mais ce n'est pas le cas. La procédure n'est pas prise en charge par tous les navigateurs et pas par toutes les actions de fermeture.
En utilisant le test Wireshark (un outil de capture de paquets réseau), on peut constater que le navigateur a envoyé un total de 4 requêtes au serveur :
Demandez un script js.
Une fois le chargement terminé, lancez une requête et transmettez les paramètres
En quittant la page, faites une requête et transmettez les paramètres. Par rapport à ce qui précède, on constate que le paramètre ep a changé.
Les statistiques Baidu sont basées sur des cookies Lorsqu'un script js est demandé, un cookie permanent sera enregistré sur votre ordinateur, qui sert de votre identifiant utilisateur. Dans le même temps, il a été découvert que le paramètre ep passait du 0 initial à "7289%2C115" lors de la sortie, il était "7289,115", qui sont deux unités de millisecondes, soit 7,2 secondes et 0,1 seconde. Dans le même temps, le paramètre lt (time, javascript: (new Date).getTime()) reste inchangé lors de la demande de hm.gif les deux premières fois. Le nombre aléatoire change à chaque fois.
Comment fonctionne Google Analytics
Lorsqu'un utilisateur visite une page contenant du code de statistiques Google Analytics, ce code sera exécuté par le navigateur de l'utilisateur et la fonction de ce code est de collecter les informations du visiteur, telles que l'URL de la page consultée, le type de navigateur, le système d'exploitation. , langue du système, résolution de l'écran, etc.
Le code statistique GA stocke ensuite ces informations sur les visiteurs dans un cookie. Un cookie est un court texte stocké localement et associé au site Web visité. Il est utilisé pour déterminer si un utilisateur le visite pour la première fois ou plusieurs fois. la source recommandée de la page et les informations de visualisation de la page ultérieure, etc.
Enfin, toutes les informations collectées seront envoyées aux serveurs de données de Google Analytics. Ce processus est assez intelligent. Nous savons que le fichier journal du serveur enregistrera les informations de chaque demande de fichier, et la façon dont Google Analytics collecte les données consiste à demander un fichier image GIF 1 × 1 transparent au serveur. Cette demande de fichier et l'heure de la demande le seront. être enregistré dans le journal du serveur, et les informations de demande de fichier contiennent les données collectées par le code statistique GA et les informations des cookies. De cette manière, chaque fois que cette image GIF reçoit une demande, les informations d'accès du visiteur seront collectées par le serveur de données Google Analytics. .
Cependant, Google Analytics n'envoie qu'une seule requête gif et envoie souvent plusieurs requêtes gif. S'il existe une image GIF qui ne peut pas être comptée, GA enverra d'autres demandes GIF.
Résumer:
Le maître de l'analyse de sites Web, Avinash, a déclaré un jour que tant que les données sont exactes à 90 %, des mesures peuvent être prises à temps. L’important est de pouvoir voir les tendances, agir, puis tester et optimiser en permanence.
Source de l'article : blog de Lu Songsong, veuillez indiquer l'adresse de cet article lors de la réimpression, merci.
(Editeur : Yang Yang) L'espace personnel du blog de l'auteur Lu Songsong