Os dados estatísticos do Google Analytics e do Baidu Statistics são diferentes, e as diferenças são muito grandes. A razão fundamental é que os princípios e mecanismos das estatísticas de dados são diferentes. Vamos compartilhar a análise principal do Google Analytics e do Baidu Statistics.
Análise do princípio de funcionamento das estatísticas do Baidu
O JS fornecido pelo Baidu Statistics introduz essencialmente o código de hm.baidu.com/h.js na página. O conteúdo do código varia de acordo com os seguintes parâmetros. Os parâmetros que seguem h.js são o que você está procurando. .id nas estatísticas do Baidu.
Ao obter o código h.js, o Baidu Statistics gravará um cookie chamado "HMACCOUNT" em seu navegador. O prazo de validade desse cookie é 2038, portanto, contanto que você não limpe o cookie do navegador, ele basicamente nunca expirará.
Após o download do h.js, seu script é executado para obter algumas informações relacionadas ao navegador e fontes de acesso. As informações obtidas incluem tamanho da tela, profundidade de cor, versão do Flash, idioma do usuário, etc.
No código js, todos os parâmetros incluem estes: "cc, cf, ci, ck, cl, cm, cp, cw, ds, ep, et, fl, ja, ln, lo, lt, nv, rnd, sb, se , si, st, su, sw, sse, v”. O significado desses parâmetros é aproximadamente o seguinte:
cc: Não sei, geralmente 1
cf: valor do parâmetro de URL hmsr
ci: valor do parâmetro de URL hmci
ck: Se deve suportar cookies 1:0
cl: Profundidade de cor como "32 bits"
cm: valor do parâmetro de URL hmmd
cp: valor do parâmetro de URL hmpl
cw: valor do parâmetro de URL hmkw
ds: tamanho da tela, como '1024×768′
ep: O valor inicial é '0', uma variável de tempo que reflete o tempo de permanência da página. O formato é provavelmente: hora atual - tempo de carregamento + "," + outro valor de tempo pequeno.
et: O valor inicial é '0', se a variável ep time não for 0, ela se tornará outra coisa
fl:versão flash
ja:java suporta 1:0
ln: idioma zh-cn
lo: Não sei, geralmente 0
lt: Data time.time(), como "1327847756", não disponível na primeira solicitação
nv: não sei, geralmente 1 ou 0
rnd: dez números aleatórios
sb: Se for um navegador 360se o valor é igual a '17'
se: relacionado a mecanismos de pesquisa
si: ID do código estatístico
st:
su: página anterior document.referrer
sw: Não sei. Provavelmente está relacionado ao mecanismo de pesquisa.
sse: Não sei. Provavelmente está relacionado ao mecanismo de pesquisa. Geralmente está vazio.
v: versão do código estatístico, atualmente o valor é “1.0.17”
Quando todos esses parâmetros estiverem definidos (alguns parâmetros não recebem valores atribuídos), filtre os parâmetros atribuídos e use-os como parâmetros de hm.baidu.com/hm.gif para reunir um URL, como: http://upload. chinaz .com//?cc=1&ck=1&cl=32 bits & ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn. Então solicite a imagem.
O servidor de estatísticas do Baidu recebe esta solicitação e obtém informações relevantes dos parâmetros anexados à URL da imagem para registrar o registro de acesso do visitante quando a página é fechada pelo usuário, também irá acionar uma solicitação para hm.gif, mas este O; procedimento não é suportado por todos os navegadores e nem todas as ações de fechamento.
Usando o teste Wireshark (uma ferramenta de captura de pacotes de rede), pode-se descobrir que o navegador enviou um total de 4 solicitações ao servidor:
Solicite um script js.
Quando o carregamento for concluído, inicie uma solicitação e passe os parâmetros
Ao sair da página, faça uma solicitação e passe os parâmetros. Em comparação com o anterior, verifica-se que o parâmetro ep foi alterado.
As estatísticas do Baidu são baseadas em cookies. Quando um script js é solicitado, um cookie permanente será salvo em seu computador, que servirá como seu ID de usuário. Ao mesmo tempo, descobriu-se que o parâmetro ep mudou do 0 inicial para "7289%2C115" ao sair. Após escapar, era "7289.115", que são duas unidades de milissegundos, ou seja, 7,2 segundos e 0,1 segundos. Ao mesmo tempo, o parâmetro lt (time, javascript: (new Date).getTime()) permanece inalterado ao solicitar hm.gif nas duas primeiras vezes. O segundo número aleatório muda sempre.
Como funciona o Google Analytics
Quando um usuário visita uma página que contém o código de estatísticas do Google Analytics, esse código será executado pelo navegador do usuário, e a função desse código é coletar informações do visitante, como URL da página visualizada, tipo de navegador, sistema operacional , idioma do sistema, resolução da tela, etc.
O código de estatísticas do GA armazena então essas informações do visitante em um cookie. Um cookie é um texto curto armazenado localmente e associado ao site visitado. Ele é usado para determinar se um usuário está visitando pela primeira vez ou várias vezes. a fonte recomendada da página e as informações de visualização da página subsequentes, etc.
Por fim, toda a informação recolhida será enviada para os servidores de dados do Google Analytics. Este processo é bastante inteligente. Sabemos que o arquivo de log do servidor registrará as informações de cada solicitação de arquivo, e a forma como o Google Analytics coleta os dados é solicitando um arquivo de imagem GIF transparente 1 × 1 do servidor. será registrado no log do servidor, e as informações de solicitação do arquivo conterão os dados coletados pelo código de estatísticas do GA e informações do cookie. Desta forma, sempre que esta imagem GIF receber uma solicitação, as informações de acesso do visitante serão coletadas pelo servidor de dados do Google Analytics. .
No entanto, o Google Analytics envia apenas uma solicitação de gif e, muitas vezes, envia várias solicitações de gif. Se houver uma imagem GIF que não possa ser contada, o GA enviará outras solicitações de GIF.
Resumir:
O mestre de análise de sites, Avinash, disse certa vez que, desde que os dados sejam 90% precisos, ações podem ser tomadas a tempo. O importante é poder ver tendências, agir, testar e otimizar continuamente.
Fonte do artigo: blog de Lu Songsong, indique o endereço deste artigo ao reimprimir, obrigado.
(Editor: Yang Yang) O espaço pessoal do blog do autor Lu Songsong