Статистические данные Google Analytics и Baidu Статистика различаются, и различия очень велики. Основная причина заключается в том, что принципы и механизмы статистики данных различны. Давайте поделимся принципами анализа Google Analytics и BaiduStatistics.
Анализ принципа работы статистики Baidu
JS, предоставленный Baidu Статистика, по существу вводит на страницу код hm.baidu.com/h.js. Содержимое кода будет варьироваться в зависимости от следующих параметров. Параметры, следующие за h.js, — это то, что вы ищете. .id в статистике Baidu.
При получении кода h.js Baidu Статистика запишет в ваш браузер файл cookie с именем «HMACCOUNT». Срок действия этого файла cookie — 2038, поэтому, пока вы не очистите файл cookie браузера, срок его действия практически никогда не истечет.
После загрузки h.js выполняется его сценарий для получения некоторой информации, связанной с браузером, и источников доступа. Полученная информация включает размер экрана, глубину цвета, версию Flash, язык пользователя и т. д.
В коде js все параметры включают в себя следующие: «cc, cf, ci, ck, cl, cm, cp, cw, ds, ep, et, fl, ja, ln, lo, lt, nv, rnd, sb, se , си, ст, су, св, ссэ, в». Смысл этих параметров примерно следующий:
cc: Не знаю, обычно 1
cf: значение параметра URL hmsr
ci: значение параметра URL hmci
ck: Поддерживать ли файлы cookie 1:0
cl: глубина цвета, например «32-битная».
cm: значение параметра URL hmmd
cp: значение параметра URL hmpl
cw: значение параметра URL hmkw
ds: размер экрана, например «1024×768».
ep: Начальное значение — «0», переменная времени, которая отражает время пребывания страницы. Вероятно, формат: текущее время — время загрузки + «,» + еще одно небольшое значение времени.
et: начальное значение равно «0», если переменная времени ep не равна 0, она станет чем-то другим
fl: флэш-версия
ja:java поддерживает 1:0
ln: язык zh-cn
lo: Не знаю, обычно 0
lt: Дата time.time(), например «1327847756», недоступна в первом запросе.
nv: не знаю, обычно 1 или 0
rnd: десять случайных чисел
sb: Если это браузер 360se, значение равно «17».
se: связано с поисковыми системами
si: идентификатор статистического кода
ул:
su: предыдущая страница document.referrer
sw: Не знаю, наверное, это связано с поисковой системой. Обычно оно пустое.
sse: Не знаю, наверное, это связано с поисковой системой. Обычно оно пустое.
v: версия статистического кода, на данный момент значение «1.0.17».
Когда все эти параметры установлены (некоторым параметрам не присвоены значения), отфильтруйте назначенные параметры и используйте их в качестве параметров hm.baidu.com/hm.gif, чтобы собрать воедино URL-адрес, например: http://upload. chinaz .com//?cc=1&ck=1&cl=32-bit & ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn. Затем запросите изображение.
Сервер статистики Baidu получает этот запрос и получает соответствующую информацию из параметров, прикрепленных к URL-адресу изображения, для записи записи доступа посетителя, когда страница закрывается пользователем, это также запускает запрос на hm.gif, но это Процедура поддерживается не всеми браузерами и не всеми действиями по закрытию.
Используя тест Wireshark (инструмент захвата сетевых пакетов), можно обнаружить, что браузер отправил на сервер в общей сложности 4 запроса:
Запросить js-скрипт.
После завершения загрузки инициируйте запрос и передайте параметры.
При выходе со страницы сделайте запрос и передайте параметры. По сравнению с вышеизложенным обнаружено, что параметр ep изменился.
Статистика Baidu основана на файлах cookie. При запросе сценария js на вашем компьютере сохраняется постоянный файл cookie, который служит вашим идентификатором пользователя. При этом было обнаружено, что параметр ep при выходе изменился с начального 0 на «7289%2C115». После выхода он стал «7289,115», что составляет две миллисекунды, а именно 7,2 секунды и 0,1 секунды. При этом параметр lt (time, javascript: (new Date).getTime()) остается неизменным при запросе hm.gif первые два раза. Rnd случайное число меняется каждый раз.
Как работает Google Аналитика
Когда пользователь посещает страницу, содержащую код статистики Google Analytics, этот код будет выполнен браузером пользователя, и функция этого кода заключается в сборе информации о посетителе, такой как URL-адрес просматриваемой страницы, тип браузера, операционная система. , язык системы, разрешение экрана и т. д.
Код статистики GA затем сохраняет эту информацию о посетителе в файле cookie. Файл cookie представляет собой короткий текст, который хранится локально и связан с посещенным веб-сайтом. Он используется для определения того, посещает ли пользователь первый раз или несколько раз, и рекомендуемый источник страницы и последующую информацию о просмотре страницы и т. д.
Наконец, вся собранная информация будет отправлена на серверы данных Google Analytics. Этот процесс довольно умный. Мы знаем, что в файл журнала сервера записывается информация о каждом запросе файла, а Google Analytics собирает данные путем запроса с сервера прозрачного файла изображения GIF размером 1 × 1. Этот запрос будет зависеть от времени запроса. записываться в журнал сервера, а информация запроса файла содержит данные, собранные статистическим кодом GA, и информацию файлов cookie. Таким образом, всякий раз, когда это изображение GIF получает запрос, информация о доступе посетителя будет собираться сервером данных Google Analytics. .
Однако Google Analytics отправляет только один запрос gif, а часто отправляет несколько запросов gif. Если есть изображение gif, которое невозможно подсчитать, GA отправит другие запросы gif.
Подведите итог:
Мастер анализа веб-сайтов Авинаш однажды сказал, что, если точность данных составляет 90%, можно вовремя принять меры. Важно уметь видеть тенденции, принимать меры, затем тестировать и постоянно оптимизировать.
Источник статьи: блог Лу Сунсонга, при перепечатке указывайте адрес этой статьи, спасибо.
(Редактор: Ян Ян) Личное пространство блога автора Лу Сунсонга