-
[Prólogo] A medição da análise de sites é um dos cursos introdutórios à análise de sites. Tenho visto muitos amigos levantarem muitas questões relacionadas com o assunto, o que mostra que esta é uma área que todos querem saber e menos conseguem apreender. A compreensão precisa das métricas torna possível compreender com precisão a análise do site.
【texto】
O tema de hoje volta à medição, porque a medição é o esqueleto da análise do site. Diz-se que se a pele não estiver presente, o cabelo não estará preso. Sem medição, a análise do site não pode se tornar uma ciência. Medição também é a pergunta que a maioria dos amigos faz, como a seguinte:
Canção do professor Xing:
Há uma questão que me intriga há muito tempo. O problema da taxa de rejeição e taxa de saída no GA.
Todos conhecemos o seu significado: mas quando existem ao mesmo tempo, que dados são melhores?
Não há problema se eles aparecerem sozinhos, mas aparecem ao mesmo tempo no GA.
Esta é uma boa pergunta, que incorpora um grande espírito de investigação e uma observação perspicaz que vai ao cerne da questão. São tantas questões semelhantes que uma nova série de posts é essencial. Agora, vamos começar com os conceitos de medição mais básicos que podem facilmente nos confundir. Ao mesmo tempo, este artigo não vai repetir o conteúdo anterior (para o conteúdo de medição, veja o mapa do site do blog), mas apenas o toque final e falar sobre o que todos mais deveriam saber.
Mesmo a medição de tráfego mais básica tem armadilhas
Visualização de página, visita e visitante são as três métricas de tráfego mais básicas. Essas três métricas são diferenciadas de acordo com a dificuldade de monitoramento da seguinte forma:
Visita 》 Visitante 》 Visualização de página
O motivo é:
A visualização da página é apenas uma contagem simples. O código de monitoramento da análise do site na página é executado uma vez, nada mais. É o mais simples.
Visitante também é uma contagem simples. O código de análise e monitoramento do site identifica um cookie diferente, ou um IP diferente (para algumas ferramentas, o IP é usado para identificar visitantes quando não há cookie) que chega ao site. Mas o visitante é definitivamente mais complicado do que a visualização da página, pois inclui o registro e julgamento de cookies ou IPs.
Visita representa uma série de ações de acesso ao site por um visitante, e o intervalo entre cada ação não ultrapassa um tempo específico (por exemplo, não mais que 30 minutos). Significa julgar várias coisas: (1) Deve haver um visitante. Se o visitante não puder ser julgado, a visita não terá sentido; (2) Deve julgar as ações de acesso ao site que podem ser identificadas pela visualização da página ou outras ferramentas de análise do site. ; (3) Identificar o tempo entre as ações. Portanto, o julgamento da visita é o mais complicado. Portanto, quando utilizamos pela primeira vez os arquivos de log para análise do site, não tínhamos um conceito muito claro de visita, apenas o conceito de sessão.
Então, onde está a armadilha?
Não há armadilhas na visualização de visitantes e páginas. São medidas simples de contagem. Quando são acionadas, basta registrá-las. Mas existem armadilhas na visita. A armadilha está nas seguintes possibilidades:
Visitei o site A por 20 minutos. No 21º minuto, corri do link do site A (como o site da CWA: http://www.chinawebanalytics.cn ) (este link está conectado ao site B) para o site B, e 25 minutos depois, o link do site B (este link aponta de volta para o site A) retorna ao site A. A janela do navegador não é fechada durante esse processo, então quantas visitas o site A tem durante esse processo?
Visitei o site A por 20 minutos. No 21º minuto, fechei a página do site A, abri uma nova janela do navegador e, aos 25 minutos, abri uma nova janela e digitei a URL de A para retornar ao site A. Isso. processo Quantas visitas o site A tem?
Visitei o site A por 20 minutos. No 21º minuto, fechei a página do site A, abri uma nova página do navegador, ou seja, Tab (observe que o navegador não estava fechado), e depois abri uma nova aba aos 25 minutos. Insira o URL de A para retornar ao site A. Quantas visitas o site A teve durante esse processo?
Imagem: Tab, o grande Tab
Não quero discutir as respostas a essas três perguntas com você aqui. Você pode discuti-las nos comentários. Uma coisa a lembrar é que diferentes ferramentas de análise de sites têm definições diferentes desses processos. Portanto, se estivermos escolhendo uma ferramenta de análise de site, é melhor pedir ao fornecedor que nos diga quais são suas definições básicas e métodos de monitoramento para essas métricas básicas.
No entanto, essas três perguntas respondem diretamente às nossas seguintes perguntas:
(1) Por que as visitas monitoradas pelo Omniture SiteCatalyst são apenas 80% daquelas medidas pelo Google Analytics?
(2) Por que os dados do Google Analytics são tão diferentes dos dados dos registros do meu servidor?
Eu ficaria surpreso se os dados deles fossem os mesmos! As diferenças entre estas diferentes ferramentas não são óbvias (algumas diferenças excessivas entre ferramentas semelhantes podem, evidentemente, significar que a monitorização é implementada incorretamente). O que quero dizer é que devemos pelo menos compreender que a visita é, na verdade, uma medida muito complexa e, definitivamente, não é tão simples como pensamos.
Portanto, vamos além do entendimento geral desta métrica e entramos em uma questão fundamental – por que definir a métrica “visita”? Por que não podemos usar visualização de página ou visitante?
Se você conseguir pensar nesta questão com clareza, acho que realmente entenderá a visita.
Foto: Não é tão fácil quanto você pensava!
A resposta é realmente muito simples - qual é a ciência da análise da análise da web em sentido estrito? É a ciência que analisa o comportamento dos visitantes do site, por isso o foco é o comportamento. Portanto, definitivamente não é possível ter apenas um visitante. Se o visitante não tiver comportamentos correspondentes associados a ele, isso não tem sentido. Porém, se o comportamento for isolado e não tiver contexto, ele terá pouca importância, portanto apenas a visualização da página também não funcionará. A visita foi construída para esse fim, para medir uma série de comportamentos de um visitante que são representados como visualizações de página. É uma ponte que permite ao visitante estabelecer uma relação com a visualização da página, e também permite ao visitante estabelecer uma relação com o comportamento e expressá-lo em forma de dados.
Parece um processo artístico. Esta é a beleza da análise de sites. Se você olhar mais de perto o porquê por trás do porquê, descobrirá que existe um mundo em uma flor.
Mesmo as medições básicas nem todas têm definições uniformes
O que é massa, o que é comprimento e o que é velocidade. Essas medidas que usamos com frequência na vida real têm definições e unidades padrão que são unificadas no mundo. No entanto, no mundo da análise de sites, nem todas as métricas têm definições uniformes.
Isso ocorre porque a análise de sites ainda é um assunto muito novo. O nome da disciplina de análise de sites era inicialmente incerto. No início, as pessoas usaram e-metrics (e-metrics) e, posteriormente, métricas da web (métricas de sites). Só quando mais e mais pessoas começaram a usar web analytics (análise de sites) é que o assunto ganhou um nome formal.
Embora o nome da disciplina seja fixo, muitas medidas dentro da disciplina têm diferentes interpretações. Por exemplo, taxa de rejeição (taxa de rejeição), esta medida ainda tem mais de duas interpretações comuns. Além das diferenças na interpretação, diferentes ferramentas de monitoramento também possuem algoritmos diferentes para algumas medições. Por exemplo, como mencionado acima, diferentes ferramentas possuem algoritmos diferentes sobre como identificar visitantes, e o mesmo se aplica às visitas.
A fim de resolver as contradições causadas por inconsistências, alguns fornecedores de ferramentas inteligentes de análise de sites fornecerão algumas funções que podem personalizar as medições, permitindo aos usuários ajustar com mais flexibilidade a definição e a escala das medições conforme necessário, o que aumenta objetivamente a eficiência da análise do site. Adaptável e produz ótimos resultados.
No entanto, definições inconsistentes não são boas, especialmente para algumas medidas básicas. Portanto, algumas organizações do setor também estão trabalhando para estabelecer alguns padrões internacionais. Essas organizações incluem: o British Audit Bureau of Circulation ( www.abc.org.uk ), o Joint Industry Committee for Website Standards (o Joint Industry Committee for Web Standards). , www.jicwebs.org ) e a Web Analytics Association, www.webanalyticsassociation.org .
Para definições diferentes, o resultado final possível é que algumas definições de medição utilizadas pela maioria das pessoas se tornarão as definições acordadas pela indústria e eventualmente se tornarão padrões de implementação.
No entanto, não pense que a definição de ferramenta de análise de sites representa a indústria de análise de sites. Pode ser apenas uma das inúmeras definições e regulamentos. A chave é entender para que finalidade essas métricas existem e a que elas correspondem o status do site no mundo real.
As medidas mais básicas constituem medidas compostas
As medidas mais básicas são muito simples e insuficientes para descrever comportamentos de navegação em websites mais complexos, por isso as pessoas começaram a introduzir medidas compostas. A chamada métrica composta é uma nova métrica composta por múltiplas métricas básicas usando quatro operações aritméticas. Por exemplo, taxa de rejeição, taxa de saída, PV/visita.
Métricas compostas trazem muitos problemas para amigos novatos. Espero que o texto a seguir possa resolver seus problemas.
Primeiro, observe a taxa de rejeição. A taxa de rejeição é chamada de taxa de rejeição (Google Analytics) ou taxa de rejeição (China Web Analytics). Todos devem ser capazes de entendê-lo.
A taxa de rejeição deve lembrar os seguintes pontos:
A taxa de rejeição não é uma métrica que mede todas as páginas, mas sim uma métrica que mede todas as páginas quando são apenas landing pages.
É uma medida especial. Ele pode medir o desempenho de todo o site ou pode ser usado para medir o desempenho de uma determinada página como landing page. Ou seja, é uma métrica de nível de site e de página. Falaremos sobre isso mais adiante neste artigo.
Diferentes ferramentas de análise de sites definem isso de maneira diferente.
Sua fórmula é menos importante que seu propósito e significado.
Agora deixe-me falar sobre qual é o seu propósito.
O objetivo da Taxa de Rejeição é muito claro, que é ajudar as pessoas a descobrir qual é a primeira impressão do visitante ao entrar no seu site. Observe que é a primeira impressão, a primeira impressão que entra no site de fora do site.
Para tanto, as pessoas começaram a pensar: como usar uma medida para descrevê-la? A primeira coisa que as pessoas pensam é usar o intervalo de tempo desde o momento em que você entra no site até o momento em que sai dele. Por exemplo, quando você chega à Tencent, dá algumas olhadas casuais, depois cospe e diz: "Foda-se, monopólio" e fecha a janela. Todo o processo pode levar apenas 5 segundos. Isso significa que este site lhe dá uma má impressão. Portanto, é uma boa ideia descrevê-lo em termos de tempo. Esta é a abordagem originalmente imaginada e a abordagem que o Sr. Avinash defendeu originalmente em seu blog.
No entanto, há um grande problema com este método: a questão do tempo. Você pode odiar o Tencent, mas devido à existência de guias da web, você pode não ter pressa em fechá-lo, mas abra uma nova página da web, como abrir a página inicial do 360 Anti-Virus, e leia com prazer o Sr. O "defensor" de Hongyi criticando a Tencent Então, meia hora depois, descobri por que o "nojento" site da Tencent ainda estava aberto, então desliguei-o. Neste momento, há um preconceito no julgamento do tempo. Outro grande problema é que o tempo monitorado pelas ferramentas de análise de sites não pode ser totalmente consistente com o tempo que realmente navegamos na página web. Portanto, é difícil implementar o método do tempo para medir a primeira impressão do site.
Mas o cérebro humano é sempre inteligente. Embora em escala cósmica essa inteligência seja apenas uma nuvem, e pode não ser muito diferente da beleza da irmã Feng, mas não temos medo das dificuldades. Portanto, nasceu outra ideia - se você acha irritante entrar na primeira página deste site, é improvável que perca tempo continuando a navegar em outras páginas deste site, o que deu origem à taxa de rejeição. A taxa de rejeição mede a proporção de visitas (visitas) que visitam apenas uma página em relação ao total de visitas (visitas), ou a proporção de visitantes (visitantes) que visitam apenas uma página (visitantes) em relação ao total de visitantes (visitantes). Quanto à definição matemática, não importa. A chave é que as pessoas finalmente encontraram um método independente do tempo e fácil de calcular para medir a primeira impressão de um site.
Esta é a história da taxa de rejeição, portanto a taxa de rejeição não é usada para medir todas as visitas a todas as páginas, mas apenas para medir a impressão da visita quando a página é usada como página de destino, porque a página de destino é a primeira impressão que o site traz aos visitantes. Portanto, você também deve entender: cada página de um site pode ser uma landing page (porque os motores de busca podem trazer tráfego para qualquer página do seu site), mas em relação às diferentes visitas, apenas uma parte de cada página pode ser a landing page - se e somente se a primeira página visitada por esta visita ao entrar no site for esta página.
E quanto à taxa de saída? Essa é outra história. A Taxa de Saída mede o comportamento das pessoas que saem do site. As pessoas sempre têm que sair de um site. Embora eu ache que o Guinness World Records deveria contar a pessoa que está online há mais tempo, mas essa pessoa é mortal, portanto, mesmo que possa continuar visitando um site por 100 anos, ela deve continuar visitando um site por 100 anos. eventualmente, deixe-o. Site amado. Além disso, os cookies não têm um limite de tempo tão longo. Portanto, o local onde as pessoas saem do site com mais frequência torna-se uma preocupação.
A taxa de saída é uma medida desse assunto. Para ser franco, a taxa de saída é a probabilidade de uma página da web ser usada como saída de um site. Taxa de saída = 87%, o que significa que entre todas as visitas a esta página, existe 87% de possibilidade de sair do site a partir desta página. Este site certamente tem a responsabilidade de não conseguir “reter” visitantes.
Deste ponto de vista, a intenção original da invenção das duas medidas de taxa de rejeição e taxa de saída não tem nada a ver uma com a outra. Embora sejam muito semelhantes, cada uma mede a sua lógica. Quando aprendi a analisar sites, também fiquei muito confuso e tentei desesperadamente descobrir a relação entre essas duas medidas. Agora parece que não faz muito sentido descobrir a relação entre os dois. Faz mais sentido descobrir quando usar qual deles.
Portanto, não vamos deixar que as medidas compostas nos confundam matematicamente. Acredito que quando o Google Analytics foi inventado, não esperavam que as pessoas acabassem por calcular estas medidas compostas com tanta precisão, e é por isso que descobrimos agora que existem tantas inconsistências nos números do Google Analytics. Porém, isso não atrapalha em nada a nossa análise, pois já sabemos o que usar e em que circunstâncias.
Contar medidas e medidas compostas
Agora, vamos resumir o que são medidas de contagem e o que são medidas compostas. A medição de contagem (contagem) refere-se a uma medição unária que não requer cálculo e é projetada para registrar o número, frequência, período de tempo, etc. Visualização de página, visita e visitante são medidas de contagem, e o tempo total na página também é uma medida de contagem. As medidas de contagem não podem mais ser divididas.
Medida composta (calcular) refere-se a uma medida composta por múltiplas medidas de contagem e operações de fórmula (geralmente quatro operações aritméticas). Por exemplo, nossa medida comumente usada da amplitude das páginas visitadas pelos visitantes - visualização de página/visita, é calculada dividindo a visualização de página por visita.
As medidas de contagem e as medidas compostas envolvem problemas expressos através de dados. Normalmente, a análise do website utiliza métodos de contagem para expressar valores específicos de medição. Por exemplo, o website teve 34.567 visitas e 23.456 visitantes em maio. As medidas de contagem geralmente correspondem à representação de contagem para a qual os dados são relatados.
Para métricas compostas, também é representado por um relatório de contagem. Por exemplo, a taxa de rejeição do site é de 13,3%. Os relatórios de contagem são os relatórios analíticos de sites mais comuns. O relatório a seguir é um relatório de contagem típico:
Outro tipo de relatório é denominado relatório de distribuição, que registra a distribuição de diferentes dimensões estatísticas. Por exemplo, a Figura D é um relatório de distribuição típico, indicando o número de visitas correspondentes a diferentes comprimentos de caminho.
A figura abaixo também é um relatório de distribuição típico, mostrando a distribuição do número de visitas de diferentes períodos de tempo:
Relatórios de contagem e relatórios de distribuição são formulários de exibição de dados comumente usados em ferramentas de análise de sites. Ao fazer relatórios de análise de sites, também usamos frequentemente esses dois formulários. Indiscutivelmente, contagens e distribuições são os modelos mais comuns com os quais lidamos todos os dias.
Ok, é isso por hoje. Se você tiver alguma ideia, deixe uma mensagem! Por fim, gostaria de compartilhar um filme - "A Trigésima Sexta História" é um esquete literário taiwanês com um tom literário completo, mas acho que é poderoso o suficiente. Ele me lembra dos meus dias anteriores como gerente de um restaurante. recomendo para quem gosta de "Análise de Sites na China" "Meninas - claro, é melhor se vocês também gostarem de mim.
Autor: Song Xing
Fonte do artigo: http://www.chinawebanalytics.cn/metrics-and-its-back-story-1/