Los datos estadísticos de Google Analytics y Baidu Statistics son diferentes y las diferencias son muy grandes. La razón fundamental es que los principios y mecanismos de las estadísticas de datos son diferentes. Compartamos el análisis principal de Google Analytics y Baidu Statistics.
Análisis del principio de funcionamiento de las estadísticas de Baidu.
El JS proporcionado por Baidu Statistics esencialmente introduce el código de hm.baidu.com/h.js en la página. El contenido del código variará según los siguientes parámetros. ¿Los parámetros que siguen a h.js son lo que está buscando? id en Estadísticas de Baidu.
Mientras obtiene el código h.js, Baidu Statistics escribirá una cookie llamada "HMACCOUNT" en su navegador. El tiempo de vencimiento de esta cookie es 2038, por lo que, siempre que no borre la cookie del navegador, básicamente nunca caducará.
Después de descargar h.js, se ejecuta su script para obtener información relacionada con el navegador y acceder a las fuentes. La información obtenida incluye el tamaño de la pantalla, la profundidad del color, la versión de Flash, el idioma del usuario, etc.
Del código js, todos los parámetros incluyen estos: "cc, cf, ci, ck, cl, cm, cp, cw, ds, ep, et, fl, ja, ln, lo, lt, nv, rnd, sb, se , si, st, su, sw, sse, v”. El significado de estos parámetros es aproximadamente el siguiente:
cc: No lo sé, normalmente 1
cf: valor del parámetro de URL hmsr
ci:valor del parámetro de URL hmci
ck: Si se admiten cookies 1:0
cl: profundidad de color como "32 bits"
cm: valor del parámetro de URL hmmd
cp: valor del parámetro de URL hmpl
cw: valor del parámetro de URL hmkw
ds: tamaño de pantalla, como '1024×768′
ep: El valor inicial es '0', una variable de tiempo que refleja el tiempo de permanencia en la página. El formato probablemente sea: hora actual - tiempo de carga + "," + otro valor de tiempo pequeño.
et: El valor inicial es '0', si la variable de tiempo ep no es 0, se convertirá en otra cosa
fl: versión flash
ja:java soporta 1:0
ln: idioma zh-cn
lo: No lo sé, normalmente 0
lt: Fecha, hora.hora(), como "1327847756", no disponible en la primera solicitud
nv: No lo sé, normalmente 1 o 0
rnd: diez números aleatorios
sb: Si es un navegador 360se, el valor es igual a '17'
se: relacionado con los motores de búsqueda
si: identificación del código estadístico
calle:
su: página anterior documento.referrer
sw: No lo sé. Probablemente esté relacionado con el motor de búsqueda. Normalmente está vacío.
sse: No lo sé. Probablemente esté relacionado con el motor de búsqueda. Suele estar vacío.
v: versión del código estadístico, actualmente el valor es "1.0.17"
Cuando todos estos parámetros estén configurados (algunos parámetros no tienen valores asignados), filtre los parámetros asignados y utilícelos como parámetros de hm.baidu.com/hm.gif para armar una URL, como por ejemplo: http://upload. chinaz .com//?cc=1&ck=1&cl=32-bit & ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn. Entonces solicita la imagen.
El servidor de estadísticas de Baidu recibe esta solicitud y obtiene información relevante de los parámetros adjuntos a la URL de la imagen para registrar el registro de acceso del visitante cuando el usuario cierra la página, también activará una solicitud de hm.gif, pero esto El; El procedimiento no es compatible con todos los navegadores ni con todas las acciones de cierre.
Utilizando la prueba Wireshark (una herramienta de captura de paquetes de red), se puede encontrar que el navegador envió un total de 4 solicitudes al servidor:
Solicite un script js.
Cuando se complete la carga, inicie una solicitud y pase los parámetros
Al salir de la página, realice una solicitud y pase los parámetros. En comparación con lo anterior, se encuentra que el parámetro ep ha cambiado.
Baidu Statistics se basa en cookies. Cuando se solicita un script js, se guardará una cookie permanente en su computadora, que sirve como su identificación de usuario. Al mismo tiempo, se descubrió que el parámetro ep cambió del 0 inicial a "7289% 2C115" al salir, y después de escapar era "7289,115", que son dos unidades de milisegundos, es decir, 7,2 segundos y 0,1 segundos. Al mismo tiempo, el parámetro lt (time, javascript: (new Date).getTime()) permanece sin cambios al solicitar hm.gif las dos primeras veces. Y el número aleatorio cambia cada vez.
Cómo funciona Google Analytics
Cuando un usuario visita una página que contiene el código de estadísticas de Google Analytics, este código será ejecutado por el navegador del usuario y la función de este código es recopilar la información del visitante, como la URL de la página visitada, el tipo de navegador, el sistema operativo. , idioma del sistema, resolución de pantalla, etc.
Luego, el código de estadísticas de GA almacena esta información del visitante en una cookie. Una cookie es un texto breve que se almacena localmente y se asocia con el sitio web visitado. Se utiliza para determinar si un usuario lo visita por primera vez o varias veces. la fuente recomendada de la página y la información de visualización de la página posterior, etc.
Finalmente, toda la información recogida será enviada a los servidores de datos de Google Analytics. Este proceso es bastante inteligente. Sabemos que el archivo de registro del servidor registrará la información de cada solicitud de archivo, y la forma en que Google Analytics recopila datos es solicitando un archivo de imagen GIF transparente de 1 × 1 al servidor. Esta solicitud de archivo y el tiempo de solicitud. se registrará en el registro del servidor, y la información de solicitud del archivo contiene los datos recopilados por el código de estadísticas de GA y la información de las cookies. De esta manera, cada vez que esta imagen GIF reciba una solicitud, la información de acceso del visitante será recopilada por el servidor de datos de Google Analytics. .
Sin embargo, Google Analytics solo envía una solicitud de gif y muchas veces envía varias solicitudes de gif. Si hay una imagen gif que no se puede contar, GA enviará otras solicitudes de gif.
Resumir:
El experto en análisis de sitios web, Avinash, dijo una vez que siempre que los datos tengan una precisión del 90%, se pueden tomar medidas a tiempo. Lo importante es poder ver tendencias, tomar medidas, luego probar y optimizar continuamente.
Fuente del artículo: blog de Lu Songsong, indique la dirección de este artículo al reimprimir, gracias.
(Editor: Yang Yang) El espacio personal del blog del autor Lu Songsong