-
De nos jours, il existe de grandes différences dans les données statistiques de plusieurs outils de statistiques de trafic différents. À cette époque, je pensais que je devrais analyser le journal d'accès d'Apache. Les données qui s'y trouvent devraient être les plus fiables. Au début, j'ai écrit un outil d'analyse simple à des fins d'urgence et j'ai collecté quelques données simples. L'open source AWStats devrait être un outil largement utilisé et doté de fonctions complètes.
L'installation et la configuration d'Awstats sont assez simples, mais j'ai quand même fait quelques détours. La leçon la plus pénible parmi elles est la suivante : il est préférable de le configurer de la manière par défaut. Ce qui suit enregistre mon processus d'installation et de configuration. Expliquez d'abord l'environnement : CentOS 5.6 64 bits + Apache Httpd 2.2
1. Configurez la méthode de sortie du journal d'Apache.
Par défaut, le fichier access.log d'Apache sera compressé lorsqu'il atteint une certaine taille, et certains anciens seront également supprimés. Je n'ai trouvé aucun contenu pertinent sur la gestion des journaux d'accès dans la documentation d'Apache. J'espère que les étudiants qui la connaissent pourront me donner quelques conseils. Ici, je le configure pour qu'il s'agisse d'un fichier par jour pour une analyse et une sauvegarde ultérieures. Ouvrez httpd.conf, recherchez l'emplacement de la configuration du journal d'accès et modifiez
Journaux CustomLog/access_log commun
Changer pour
CustomLog "|/usr/sbin/rotatelogs /var/log/httpd/access_log.%Y%m%d 86400" combiné
Parmi eux, rotatelogs est un outil de journalisation fourni par Apache. Vous pouvez connaître le chemin de l'outil grâce auquel rotatelogs. Un autre changement consiste à modifier le contenu du journal de commun à combiné, afin que le journal contienne plus d'informations, ce qui est également nécessaire à AWStats. Si le journal est configuré dans Virtual Hosts, modifiez-le simplement de la même manière.
Après avoir modifié et redémarré le service httpd, vous verrez un fichier journal similaire à access_log.20110612 généré sous /var/log/httpd.
2. Installez AWStats
Téléchargez d'abord le package d'installation d'Awstats : awstats-7.0.tar.gz. Vous pouvez également trouver le fichier d'installation adapté à votre environnement sur la page de téléchargement.
]# wget http://PRdownloads.sourceforge.net/awstats/awstats-7.0.tar.gz
]# tar xzvf awstats-7.0.tar.gz
]# mv awstats-7.0 /var/
Vous pouvez l'installer selon le guide officiel d'Awstats : http://awstats.sourceforge.net/docs/awstats_setup.html . Il y a quelques points à noter :
(1) Lorsque vous posez des questions sur le chemin du fichier de configuration Apache, écrivez le chemin réel du fichier de configuration Apache dans l'environnement actuel. Par exemple, le mien est : /etc/httpd/conf/httpd.conf.
(2) Lorsque vous demandez le chemin où le fichier de configuration Awstats est stocké, assurez-vous d'utiliser le chemin par défaut, sinon des problèmes inattendus surviendront plus tard.
(3) Lorsque vous souhaitez créer un nouveau fichier de configuration Awstats, il vous sera demandé le nom du fichier de configuration. En fait, vous demandez cette fois à quel nom de domaine appartient le journal à analyser. le site Web est www.monsite.com , vous pouvez saisir : www.monsite .com .
Pendant le processus d’installation, j’ai continué à dire oui jusqu’au bout. A la fin de l'installation, un nouveau répertoire awstats sera généré sous /etc, et il y aura un nom nommé awstats.www.mysite.com.conf ci-dessous.
C'est à ce moment-là que j'ai rouvert httpd.conf et découvert qu'il y avait d'autres configurations liées à Awstats en bas.
Créez un nouveau fichier nommé awstats sous /var/lib pour stocker les fichiers de données générés après l'analyse du journal.
3. Configurer AWStats
Une fois l'installation terminée, vous devez encore effectuer une configuration simple avant de pouvoir commencer à utiliser AWStats. Ouvrez le fichier de configuration awstats.www.mysite.com.conf généré ci-dessus, recherchez LogFile et remplacez-le par le chemin du fichier journal réel. Il convient de noter que dans la première étape, le fichier journal a été remplacé par un nom nommé d'après le jour en cours, la configuration ici est donc :
LogFile=/var/log/httpd/access_log.%YYYY-0%MM-%DD
Indique que le dernier fichier journal est en cours d'analyse. Concernant cette configuration, merci de vous référer à l'explication détaillée dans ses commentaires.
4. Vérifiez l'installation
La configuration est pratiquement terminée, vérifions-la :
]# cd /var/awstats/wwwroot/cgi-bin
]# perl awstats.pl -config=www.mysite.com -update
Si vous suivez strictement les étapes ci-dessus, il ne devrait y avoir aucun problème dans cette étape et vous pouvez voir un résultat similaire à celui-ci :
Créer/mettre à jour la base de données pour la configuration "/etc/awstats/awstats.www.mysite.com.conf" par AWStats version 7.0 (build 1.971)
>À partir des données du fichier journal "/var/log/httpd/access_log.20110611"...
Phase 1 : contourner d'abord les anciens enregistrements, rechercher de nouveaux enregistrements...
Accès direct après le dernier enregistrement analysé (après la ligne 545194)
Lignes sautées dans le fichier : 545194
545194 enregistrements déjà analysés ont été trouvés.
Lignes analysées dans le fichier : 1677
Trouvé 0 enregistrement supprimé,
Trouvé 0 commentaires,
Trouvé 0 enregistrement vierge,
Trouvé 0 enregistrements corrompus,
Trouvé 0 anciens enregistrements,
Trouvé 1677 nouveaux enregistrements qualifiés.
Pour des raisons de sécurité, je n'ai pas ouvert le lien de mise à jour sur la page Web, mais j'ai configuré la crontab pour exécuter le programme ci-dessus toutes les 10 minutes :
*/10 * * * * root cd /var/awstats/wwwroot/cgi-bin/;perl awstats.pl -config=www.mysite.com -update
De cette façon, vous pouvez voir les résultats statistiques actualisés toutes les 10 minutes sur la page.
5. Installez le plug-in pour la conversion d'adresse IP
Parmi les rapports statistiques d'Awstats, l'un affiche l'adresse réelle correspondant à l'IP. Celle-ci doit être implémentée via un plug-in. La méthode la plus courante sur Internet consiste à utiliser QQWry.dat. Mais il a fallu beaucoup de temps pour trouver ce plug-in, car de nombreux endroits ne peuvent télécharger que des bases de données IP, pas des plug-ins.
La base de données IP peut être téléchargée via : http://www.cz88.net/fox/ipdat.shtml . Remarque : Ce qui est téléchargé ici est un fichier d'installation ext. Après l'installation, il y aura un fichier qqwry.dat, qui est la base de données IP à utiliser. Cette base de données IP sera mise à jour fréquemment, nous devons donc également la maintenir à jour.
Les fichiers liés au plug-in peuvent être téléchargés depuis : http://blogimg.chinaunix.net/blog/upfile/070103141422.rar (je ne sais pas quand cette URL deviendra invalide). Après décompression, il contient trois fichiers : qqhostinfo.pm, qqwry.pl et QQWry.Dat. Le premier est le fichier du plug-in, le second est le véritable programme Perl qui exécute la conversion et le troisième est la base de données. Vous pouvez utiliser la dernière version ci-dessus. La base de données couvre cela. Copiez ces trois fichiers dans le répertoire /var/awstats/wwwroot/cgi-bin/plugins/ et apportez les modifications suivantes :
]# chmod 755 qqhostinfo.pm
]# vim qqwry.pl
Remplacez ./QQWry.Dat par /var/awstats/wwwroot/cgi-bin/plugins/qqwry.dat.
Modifiez le fichier de configuration Awstats awstats.www.mysite.com.conf et recherchez
#LoadPlugin="infohôte"
Ajouter une nouvelle ligne après
LoadPlugin="qqhostinfo"
Après avoir terminé toutes les étapes ci-dessus, vous devriez pouvoir voir les résultats statistiques sur la page Web. Le chinois peut être affiché sous forme de caractères tronqués, il suffit de définir la langue du navigateur sur chinois.
(Source : blog du RSC)