-
[Avant-propos] La mesure de l'analyse de sites Web est l'un des cours d'introduction à l'analyse de sites Web. J'ai vu de nombreux amis soulever de nombreuses questions à ce sujet, ce qui montre que c'est un domaine que tout le monde veut connaître le plus et est le moins capable de comprendre. La saisie précise des métriques permet d’appréhender avec précision l’analyse du site Web.
【texte】
Le sujet d’aujourd’hui revient à la mesure, car la mesure est le squelette de l’analyse d’un site Web. On dit que si la peau n’est pas là, les cheveux ne seront pas attachés. Sans mesure, l’analyse d’un site Web ne peut pas devenir une science. La mesure est aussi la question que se posent la plupart des amis, comme la question suivante :
Chanson du professeur Xing :
Il y a une question qui me laisse perplexe depuis longtemps. Le problème du taux de rebond et du taux de sortie en GA.
Nous connaissons tous leur signification : mais lorsqu’elles existent en même temps, quelle donnée est la meilleure ?
Ce n'est pas grave s'ils apparaissent seuls, mais ils apparaissent en même temps dans GA.
C’est une bonne question, qui incarne un grand esprit d’enquête et une observation fine qui va au cœur du sujet. Il y a tellement de questions similaires qu’une nouvelle série d’articles s’impose. Commençons maintenant par les concepts de mesure les plus élémentaires qui peuvent facilement nous dérouter. Dans le même temps, cet article ne répétera pas le contenu passé (pour le contenu de la mesure, veuillez consulter le plan du site du blog), mais juste la touche finale et parlera des choses que tout le monde devrait le plus savoir.
Même la mesure du trafic la plus élémentaire comporte des pièges
La page vue, la visite et le visiteur sont les trois mesures de trafic les plus élémentaires. Ces trois mesures se distinguent en fonction de la difficulté de surveillance comme suit :
Visite 》 Visiteur 》 Page vue
La raison est :
L'affichage de la page n'est qu'un simple décompte. Le code de surveillance de l'analyse du site Web dans la page est exécuté une seule fois, rien de plus. C'est le plus simple.
Le visiteur est également un simple décompte. Le code d'analyse et de surveillance du site Web identifie un cookie différent, ou une adresse IP différente (pour certains outils, l'IP est utilisée pour identifier les visiteurs lorsqu'il n'y a pas de cookie) qui arrive sur le site Web. Mais le visiteur est nettement plus compliqué que la consultation de la page, car cela inclut l'enregistrement et le jugement des cookies ou des IP.
La visite représente une série d'actions d'accès au site Web par un visiteur, et l'intervalle entre chaque action ne dépasse pas une durée spécifique (par exemple, pas plus de 30 minutes). Cela signifie juger plusieurs choses : (1) Il doit y avoir un visiteur. Si le visiteur ne peut pas être jugé, la visite n'aura aucun sens ; (2) Il doit juger des actions d'accès au site Web qui peuvent être identifiées par la visualisation de la page ou par d'autres outils d'analyse du site Web ; ; (3) Pour identifier le temps entre les actions. C’est donc le jugement de visite qui est le plus compliqué. Par conséquent, lorsque nous avons utilisé pour la première fois les fichiers journaux pour l’analyse de sites Web, nous n’avions pas une notion très claire de visite, seulement la notion de session.
Alors, où est le piège ?
Il n'y a pas de pièges dans la vue Visiteur et page. Ce sont de simples mesures de comptage lorsqu'elles sont déclenchées, elles sont déclenchées et les enregistrent simplement. Mais il y a des pièges en visite. Le piège réside dans les possibilités suivantes :
J'ai visité le site Web A pendant 20 minutes. À la 21e minute, j'ai couru du lien du site Web A (tel que le site Web de CWA : http://www.chinawebanalytics.cn ) (ce lien est connecté au site Web B) au site Web B, puis 25 minutes plus tard, le lien du site Web B (ce lien renvoie au site Web A) renvoie au site Web A. La fenêtre du navigateur n'est pas fermée pendant ce processus, alors combien de visites le site Web A a-t-il effectué au cours de ce processus ?
J'ai visité le site Web A pendant 20 minutes. À la 21e minute, j'ai fermé la page du site Web A, puis ouvert une nouvelle fenêtre de navigateur, puis ouvert une nouvelle fenêtre à 25 minutes et saisi l'URL de A pour revenir au site Web A. Ceci. processus Combien de visites le site Web A reçoit-il ?
J'ai visité le site A pendant 20 minutes. A la 21ème minute, j'ai fermé la page du site A, puis j'ai ouvert une nouvelle page du navigateur, à savoir Tab (notez que le navigateur n'était pas fermé), puis j'ai ouvert un nouvel onglet à 25 minutes. Saisissez l'URL de A pour revenir au site Web A. Combien de visites le site Web A reçoit-il au cours de ce processus ?
Image : Tab, la grande Tab
Je ne veux pas discuter des réponses à ces trois questions avec vous ici. Vous êtes invités à en discuter dans les commentaires. Une chose à rappeler est que différents outils d'analyse de sites Web ont des définitions différentes de ces processus. Ainsi, si nous choisissons un outil d'analyse de site Web, nous ferions mieux de demander au fournisseur de nous indiquer quelles sont ses définitions de base et ses méthodes de surveillance pour ces mesures de base.
Cependant, ces trois questions répondent directement à nos questions suivantes :
(1) Pourquoi les visites surveillées par Omniture SiteCatalyst ne représentent-elles que 80 % de celles mesurées par Google Analytics ?
(2) Pourquoi les données de Google Analytics sont-elles si différentes des données des journaux de mon serveur ?
Je serais surpris si leurs données étaient les mêmes ! Les différences entre ces différents outils ne sont pas évidentes (certaines différences excessives entre outils similaires peuvent bien entendu signifier que le suivi est mal mis en œuvre). Ce que je veux dire, c’est que nous devrions au moins comprendre que la visite est en réalité une mesure très complexe, et qu’elle n’est certainement pas aussi simple qu’on le pense.
Par conséquent, nous allons au-delà de la compréhension générale de cette métrique et entrons dans une question fondamentale : pourquoi définir la métrique « visite » ? Pourquoi ne pouvons-nous pas utiliser la page vue ou le visiteur ?
Si vous parvenez à réfléchir clairement à cette question, je pense que vous comprendrez vraiment la visite.
Photo : Ce n'est pas aussi facile que vous le pensiez !
La réponse est en fait très simple : quelle est la science de l’analyse du Web au sens strict ? C’est la science de l’analyse du comportement des visiteurs d’un site Web, l’accent est donc mis sur le comportement. Par conséquent, il n’est certainement pas possible d’avoir uniquement un visiteur si le visiteur n’a pas de comportements correspondants, cela n’a aucun sens. Cependant, si le comportement est isolé et n'a pas de contexte, il n'a que peu d'importance, donc seule la visualisation de page ne fonctionnera pas non plus. Visit a été conçu dans ce but, pour mesurer une série de comportements d'un visiteur qui sont représentés sous forme de pages vues. C'est un pont qui permet au visiteur d'établir une relation avec la page vue, et permet également au visiteur d'établir une relation avec le comportement et de l'exprimer sous forme de données.
Cela ressemble à un tel processus artistique. C’est la beauté de l’analyse de sites Web. Si vous regardez de plus près le pourquoi du pourquoi, vous découvrirez qu’il y a un monde dans une seule fleur.
Même les mesures de base n'ont pas toutes des définitions uniformes
Qu'est-ce que la masse, qu'est-ce que la longueur et qu'est-ce que la vitesse ? Ces mesures que nous utilisons souvent dans la vie réelle ont des définitions et des unités standard unifiées dans le monde. Cependant, dans le monde de l’analyse de sites Web, toutes les mesures n’ont pas de définitions uniformes.
En effet, l’analyse de sites Web est encore un sujet très nouveau. Le nom de la discipline de l’analyse de sites Web était en fait incertain au départ. Au début, les gens utilisaient des e-metrics (e-metrics), puis des web metrics (website metrics). Ce n'est que lorsque de plus en plus de personnes ont commencé à utiliser l'analyse du web (website Analytics) que le sujet a reçu un nom officiel.
Bien que le nom de la discipline soit fixe, de nombreuses mesures au sein de la discipline ont des interprétations différentes. Par exemple, le taux de rebond (taux de rebond), cette mesure a encore plus de deux interprétations courantes. En plus des différences d'interprétation, différents outils de surveillance ont également des algorithmes différents pour certaines mesures. Par exemple, comme mentionné ci-dessus, différents outils ont des algorithmes différents pour identifier les visiteurs, et il en va de même pour les visites.
Afin de résoudre les contradictions causées par les incohérences, certains fournisseurs d'outils d'analyse de sites Web intelligents fourniront des fonctions permettant de personnaliser les mesures, permettant aux utilisateurs d'ajuster de manière plus flexible la définition et l'échelle des mesures selon les besoins, ce qui augmente objectivement considérablement l'efficacité de l'analyse du site Web. Adaptable et produit d’excellents résultats.
Cependant, des définitions incohérentes ne sont finalement pas une bonne chose, surtout pour certaines mesures de base. Par conséquent, certaines organisations du secteur s'efforcent également d'établir des normes internationales. Ces organisations comprennent : l'Audit Bureau of Circulation de Grande-Bretagne ( www.abc.org.uk ), le Joint Industry Committee for Web Standards (le Joint Industry Committee for Web Standards). , www.jicwebs.org ) et la Web Analytics Association, www.webanalyticsassociation.org .
Pour différentes définitions, le résultat final possible est que certaines définitions de mesure utilisées par le plus grand nombre deviendront les définitions convenues par l'industrie et finiront par devenir des normes de mise en œuvre.
Cependant, ne pensez pas que la définition d'un outil d'analyse de sites Web représente le secteur de l'analyse de sites Web. Il s'agit peut-être simplement d'une parmi d'innombrables définitions et réglementations. La clé est de comprendre à quoi servent ces métriques et à quel statut réel du site elles correspondent.
Les mesures les plus élémentaires constituent des mesures composites
Les mesures les plus élémentaires sont très simples et insuffisantes pour décrire un comportement de navigation sur des sites Web plus complexes. Les gens ont donc commencé à introduire des mesures composites. La métrique dite composite est une nouvelle métrique composée de plusieurs métriques de base utilisant quatre opérations arithmétiques. Par exemple, taux de rebond, taux de sortie, PV/visite.
Les métriques composites causent beaucoup de problèmes aux amis novices. J'espère que le texte suivant pourra résoudre vos problèmes.
Regardez d’abord le taux de rebond. Le taux de rebond est appelé taux de rebond (Google Analytics) ou taux de rebond (China Web Analytics). Vous pouvez choisir n'importe quel nom. Tout le monde devrait pouvoir le comprendre. J'aime ce dernier que j'ai inventé.
Le taux de rebond doit retenir les points suivants :
Le taux de rebond n'est pas une mesure qui mesure toutes les pages, mais une mesure qui mesure toutes les pages lorsqu'il ne s'agit que de pages de destination.
C'est une mesure spéciale. Il peut mesurer les performances de l’ensemble du site Web ou être utilisé pour mesurer les performances d’une certaine page en tant que page de destination. Autrement dit, il s'agit à la fois d'une métrique au niveau du site Web et d'une métrique au niveau de la page. Nous en parlerons plus tard dans cet article.
Différents outils d'analyse de sites Web le définissent différemment.
Sa formule est moins importante que son but et sa signification.
Maintenant, laissez-moi parler de son objectif.
L’objectif du taux de rebond est très clair : aider les gens à comprendre quelle est la première impression du visiteur lorsqu’il entre sur votre site Web. Veuillez noter qu'il s'agit de la première impression, la première impression entrant sur le site Web depuis l'extérieur du site Web.
Dans ce but, les gens ont commencé à réfléchir : comment utiliser une mesure pour la décrire ? La première chose à laquelle les gens pensent est d’utiliser l’intervalle de temps entre le moment où vous entrez sur le site Web et celui où vous le quittez. Par exemple, lorsque vous venez chez Tencent, vous jetez quelques regards occasionnels, puis crachez et dites : « Putain, monopole », puis fermez la fenêtre. L'ensemble du processus ne peut prendre que 5 secondes. Cela signifie que ce site Web vous donne une mauvaise impression. C'est donc une très bonne idée de le décrire en termes de temps. C’est l’approche qui avait été initialement envisagée et celle que M. Avinash préconisait à l’origine sur son blog.
Cependant, il y a un gros problème avec cette méthode, c’est la question du temps. Vous détestez peut-être Tencent, mais en raison de l'existence d'onglets Web, vous n'êtes peut-être pas pressé de le fermer, mais ouvrez une nouvelle page Web, comme ouvrir la page d'accueil de 360 Anti-Virus, et lisez avec délectation M. Zhou "L'avocat" de Hongyi critiquant Tencent Puis, une demi-heure plus tard, j'ai découvert pourquoi le site Web "dégoûtant" de Tencent était toujours ouvert, alors je l'ai désactivé. À l’heure actuelle, il existe un biais dans le jugement en fonction du temps. Un autre gros problème est que le temps surveillé par les outils d’analyse de sites Web ne peut pas être totalement cohérent avec le temps pendant lequel nous parcourons réellement la page Web. Il est donc difficile de mettre en œuvre la méthode temporelle pour mesurer la première impression du site Internet.
Mais le cerveau humain est toujours intelligent. Bien qu'à l'échelle cosmique, une telle intelligence ne soit qu'un nuage, et elle n'est peut-être pas très différente de la beauté de sœur Feng, mais nous n'avons pas peur des difficultés. Par conséquent, une autre idée est née : si vous trouvez cela ennuyeux lorsque vous entrez sur la première page de ce site Web, il est peu probable que vous perdiez du temps à continuer à parcourir d'autres pages de ce site Web, ce qui a donné naissance au taux de rebond. Le taux de rebond mesure la proportion de visites (visites) qui ne visitent qu'une seule page par rapport au total des visites (visites), ou la proportion de visiteurs (visiteurs) qui ne visitent qu'une seule page (visiteurs) par rapport au total des visiteurs (visiteurs). Quant à la définition mathématique, cela n'a pas d'importance. L'essentiel est que les gens ont enfin trouvé une méthode indépendante du temps et facile à calculer pour mesurer la première impression d'un site Web.
C'est l'histoire du taux de rebond, donc le taux de rebond n'est pas utilisé pour mesurer toutes les visites sur toutes les pages, mais uniquement pour mesurer l'impression de visite lorsque la page est utilisée comme page de destination, car la page de destination est la première impression que le site Web apporte aux visiteurs. Par conséquent, vous devez également comprendre : chaque page d'un site Web peut être une page de destination (car les moteurs de recherche peuvent générer du trafic vers n'importe quelle page de votre site Web), mais par rapport aux différentes visites, seulement une partie de chaque page. Il peut s'agir de la page de destination. - si et seulement si la première page visitée par cette visite lors de l'entrée sur le site est cette page.
Qu’en est-il du taux de sortie ? C'est une autre histoire. Le taux de sortie mesure le comportement des personnes qui quittent le site Web. Les gens doivent toujours quitter un site Web. Même si je pense que le Guinness World Records devrait compter la personne qui est en ligne depuis le plus longtemps, cette personne est mortelle après tout, donc même si elle peut continuer à visiter un site Web pendant 100 ans, elle doit le faire. quittez-le finalement. De plus, les cookies n’ont pas une durée aussi longue. Par conséquent, l’endroit où les gens quittent le site Web le plus souvent devient une préoccupation.
Le taux de sortie est une mesure de cette question. Pour parler franchement, le taux de sortie est la probabilité qu'une page Web soit utilisée comme sortie d'un site Web. Taux de sortie = 87%, ce qui signifie que parmi toutes les visites sur cette page, il y a 87% de chances de quitter le site à partir de cette page. Ce site Web porte certainement la responsabilité de ne pas pouvoir « fidéliser » les visiteurs.
De ce point de vue, l’intention initiale de l’invention des deux mesures du taux de rebond et du taux de sortie n’a rien à voir l’une avec l’autre. Bien qu’elles soient très similaires, leur logique est complètement différente. Lorsque j’ai appris pour la première fois l’analyse de sites Web, j’étais également très confus et j’essayais désespérément de comprendre la relation entre ces deux mesures. Il semble maintenant que cela n'ait pas beaucoup de sens de comprendre la relation entre les deux. Il est plus logique de déterminer quand utiliser lequel d'entre eux.
Ne laissons donc pas les mesures composites nous confondre mathématiquement. Je crois que lorsque Google Analytics a été inventé, ils ne s'attendaient pas à ce que les gens finissent par calculer ces mesures composites avec autant de précision. C'est pourquoi nous constatons aujourd'hui qu'il y a tant d'incohérences dans les chiffres de Google Analytics. Cependant, cela ne gêne en rien notre analyse, car nous savons déjà quoi utiliser et dans quelles circonstances.
Mesures de comptage et mesures composites
Maintenant, résumons ce que sont les mesures comptées et ce que sont les mesures composées. La mesure de comptage (compte) fait référence à une mesure unaire qui ne nécessite pas de calcul et est conçue pour enregistrer le nombre, la fréquence, la durée, etc. La page vue, la visite et le visiteur sont tous des mesures de comptage, et le temps global passé sur la page est également une mesure de comptage. Les mesures de comptage ne peuvent plus être divisées.
Une mesure composite (calculer) fait référence à une mesure composée de plusieurs mesures de comptage et d'opérations de formule (généralement quatre opérations arithmétiques). Par exemple, notre mesure couramment utilisée de l'étendue des pages visitées par les visiteurs - page vue/visite, est calculée en divisant la page vue par visite.
Les mesures de comptage et les mesures composites impliquent des problèmes exprimés à travers les données. Habituellement, l'analyse d'un site Web utilise des méthodes de comptage pour exprimer des valeurs spécifiques aux mesures. Par exemple, le site Web a enregistré 34 567 visites et 23 456 visiteurs en mai. Les mesures de comptage correspondent souvent à la représentation de comptage pour laquelle les données sont rapportées.
Pour les métriques composites, il est également représenté par un rapport de comptage. Par exemple, le taux de rebond du site Web est de 13,3 %. Les rapports de décompte sont les rapports d'analyse de sites Web les plus courants. Le rapport suivant est un rapport de comptage typique :
Un autre type de rapport est appelé rapport de distribution, qui enregistre la distribution de différentes dimensions statistiques. Par exemple, la figure D est un rapport de distribution typique, indiquant le nombre de visites correspondant à différentes longueurs de chemin.
La figure ci-dessous est également un rapport de distribution typique, montrant la répartition du nombre de visites de différentes durées :
Les rapports de comptage et les rapports de distribution sont tous deux des formulaires d'affichage de données couramment utilisés dans les outils d'analyse de sites Web. Lors de la création de rapports d'analyse de sites Web, nous utilisons également souvent ces deux formulaires. On peut soutenir que les décomptes et les distributions sont les modèles les plus courants auxquels nous sommes confrontés quotidiennement.
Bon, c'est tout pour aujourd'hui. Si vous avez des idées, laissez un message ! Enfin, j'aimerais partager un film : « La trente-sixième histoire » est un film de sketchs littéraire taïwanais avec un ton littéraire plein, mais je pense qu'il est assez puissant. Il me rappelle mes jours passés à diriger un restaurant. Je le recommande à ceux qui aiment "Analyse de sites Web en Chine" "Les filles - bien sûr, c'est mieux si vous m'aimez aussi en passant.
Auteur : Song Xing
Source de l'article : http://www.chinawebanalytics.cn/metrics-and-its-back-story-1/