Das Protokollstatistiksystem spielt eine wichtige Rolle bei der Analyse des Benutzerverhaltens der Website, insbesondere für Keyword-Zugriffsstatistiken von Suchmaschinen: Es ist eine sehr effektive Quelle für Daten zur Analyse des Benutzerverhaltens. Mit der Entwicklung des Internets im Laufe der Jahre sind WEB-Protokollstatistiktools immer ausgereifter geworden und verfügen über immer mehr Funktionen. Viele davon sind Open Source und AWStats ist eines der besten.
Die kurze Installationsanleitung lautet wie folgt:
Installieren
http://sourceforge.net/projects/awstats/ Nach dem Herunterladen des Installationspakets:
GNU/Linux: tar zxf awstats-version.tgz
Standardmäßig befinden sich die Skripte und statischen Dateien von awstats im Verzeichnis wwwroot: Stellen Sie alle Dateien im Verzeichnis cgi-bin im Verzeichnis cgi-bin/ bereit: /home/apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
Kopieren Sie das Symbol und andere Dateiverzeichnisse in das WEB-HTML-Dateiveröffentlichungsverzeichnis, zum Beispiel: /home/apache/htdocs/, und veröffentlichen Sie sie
Weitere Batch-Update-Skripte befinden sich im Tools-Verzeichnis und können im Verzeichnis cgi-bin/awstats/ abgelegt werden.
Aktualisieren Sie die Definitionen der wichtigsten inländischen Suchmaschinen und Spider und installieren Sie die GeoIP-Anwendungsbibliothek: C
http://www.maxmind.com/download/geoip/api/c/ Entpacken, kompilieren und installieren
perl -MCPAN -e 'install "Geo::IP"' oder verwenden Sie das reine Perl-Paket perl -MCPAN -e 'install "Geo::IP::PurePerl"'
Laden Sie das GeoIP/GeoIPCityLite-Paket herunter: Entpacken Sie es und stellen Sie es im Verzeichnis awstats bereit
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
Konfiguration
Benennen Sie die Standarddatei awstats.model.conf in common.conf
Ändern Sie einige dieser Konfigurationsoptionen:
LoadPlugin="decodeutfkeys"
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
Erstellen Sie unter awstats das Datenverzeichnis für die Ausgabe statistischer Daten
Richten Sie die Konfigurationsdatei gemäß dem folgenden Beispiel ein:
„common.conf“ einschließen
LogFile="/home/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
SiteDomain="www.chedong.com"
HostAliases="chedong.com"
DefaultFile="index.html"
DirData="/home/apache/cgi-bin/awstats/data/"
Inhaltszusammenfassung: Einführung in die Verwendung von AWStats und einige Anweisungen zur Konfigurationsverbesserung. Es ist großartig zu sehen, dass chinesische Benutzer ab AWStats Version 6.3 grundsätzlich nur LoadPlugin="decodeutfkeys" in der Konfigurationsdatei aktivieren müssen. Derzeit gibt es keine statistischen Probleme mit chinesischen Suchmaschinen .com“, „search.sina.com“, „search.sohu.com“, diese drei Suchmaschinen. Enthält Patches für die wichtigsten inländischen Suchmaschinen und Spider-Definitionen (nach dem Entpacken einfach das ursprüngliche Programmverzeichnis im lib-Verzeichnis überschreiben)
[Seite ausschneiden]
Das Protokollstatistiksystem spielt eine wichtige Rolle bei der Analyse des Benutzerverhaltens der Website, insbesondere für Keyword-Zugriffsstatistiken von Suchmaschinen: Es ist eine sehr effektive Quelle für Daten zur Analyse des Benutzerverhaltens. Mit der Entwicklung des Internets im Laufe der Jahre sind WEB-Protokollstatistiktools immer ausgereifter geworden und verfügen über immer mehr Funktionen. Viele davon sind Open Source und AWStats ist eines der besten.
AWStats: Erweiterte Webstatistiken
AWStats ist ein Perl-basiertes WEB-Protokollanalysetool, das schnell auf Sourceforge entwickelt wurde. Im Vergleich zu Webalizer, einem weiteren hervorragenden Open-Source-Protokollanalysetool, bietet AWStats die folgenden Vorteile:
Benutzerfreundliche Oberfläche: Sie können je nach Browser direkt die entsprechende Sprachoberfläche aufrufen (vereinfachte chinesische Version ist verfügbar).
Referenzausgabebeispiel: http://www.chedong.com/cgi-bin/awstats/awstats.pl? config=chedong
Basiert auf Perl: und löst das plattformübergreifende Problem sehr gut. Das System selbst kann unter GNU/Linux oder Windows ausgeführt werden (nach der Installation von ActivePerl); die analysierten Protokolle unterstützen direkt das Apache-Format (kombiniert) und das IIS-Format (muss geändert werden). ). Obwohl es für Webalizer auch eine Version für die Windows-Plattform gibt, mangelt es derzeit an Wartung.
AWStats kann ein einziges System vollständig nutzen, um einheitliche Statistiken auf verschiedenen WEB-Servern Ihrer eigenen Site zu erstellen: GNU/Linux/Apache- und Windows/IIS-Server.
Relativ hohe Effizienz: Die Ausgabestatistikelemente von AWStats sind viel umfangreicher als die von Webalizer, und die Geschwindigkeit kann immer noch etwa ein Drittel der von Webalizer erreichen. Für eine Website mit Millionen von täglichen Besuchen ist diese Geschwindigkeit ausreichend.
Bequeme Konfiguration/Anpassung: Das System bietet ausreichend flexible, aber sinnvolle Standardkonfigurationsregeln, um mit der Ausführung beginnen zu können, und es gibt eine ganze Reihe von Plug-Ins, die geändert und erweitert werden können.
Die Designer von AWStats sind auf präzise „menschliche Besuche“ ausgelegt, daher werden viele Besuche von Suchmaschinenrobotern herausgefiltert, sodass die Zahlen möglicherweise niedriger sind als bei anderen Protokollstatistiktools. Besuche aus dem Unternehmen können auch durch IP-Filtereinstellungen herausgefiltert werden .
Bietet viele erweiterte Parameterstatistikfunktionen: Die Verwendung der Konfiguration der ExtraXXXX-Serie zur Erstellung anwendungsspezifischer Parameteranalysen ist für die Produktanalyse sehr nützlich.
Weitere Vergleiche mit anderen Tools: Webalizer, analog finden Sie unter:
http://awstats.sourceforge.net/#COMPARISON
[Seite ausschneiden]
AWStats-Installationserinnerung
Die Funktionsweise von AWStats ist wie folgt:
Protokolle analysieren: Archivieren Sie solche Protokollstatistikergebnisse nach der Ausführung in einer AWStats-Datenbank (einfacher Text).
Dann gibt es noch die Ausgabe: in zwei Formen
Eine besteht darin, die Ausgabe der statistischen Ergebnisdatenbank über das CGI-Programm zu lesen.
Eine besteht darin, ein Hintergrundskript auszuführen, um die Ausgabe in eine statische Datei zu exportieren.
Im Folgenden finden Sie zwei Beispiele für Protokollstatistiken für eine einzelne Site:
Eines wird über CGI unter GNU/Linux ausgegeben,
Eine davon basiert auf dem statischen Seitenexport unter Windows 2000
Herunterladen/installieren
http://sourceforge.net/projects/awstats/ Nach dem Herunterladen des Installationspakets:
GNU/Linux: tar zxf awstats-version.tgz
Die Skripte und statischen Dateien von awstats befinden sich standardmäßig im Verzeichnis wwwroot: Stellen Sie das Programm awstats.pl im Verzeichnis cgi-bin unter /home/apache/cgi-bin/awstats/ bereit.
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
#Kopieren Sie das Symbol und andere Dateiverzeichnisse in das WEB-HTML-Dateiveröffentlichungsverzeichnis: /home/apache/htdocs/ und veröffentlichen Sie sie unter
Weitere Batch-Update-Skripte befinden sich im Tools-Verzeichnis und können zusammen im Verzeichnis cgi-bin/awstats/ abgelegt werden.
Windows 2000: Im Hintergrundskriptmodus ausführen, direkt entpacken und dann in das Verzeichnis D:AWStats verschieben
Kopieren Sie das Icon-Verzeichnis in das IIS-Release-Verzeichnis: inetpub/icon
[Seite ausschneiden]
Protokollformat der Datenquelle und Kürzungsregeln pro Tag
Für Apache: Das Protokollformat lässt sich einfach festlegen: Stellen Sie es einfach auf das kombinierte Format ein. Das Abschneiden des Protokolls ist etwas problematischer: Sie müssen das Cronolog-Tool installieren und das Protokoll so einstellen, dass es nach Tag abgeschnitten wird:
CustomLog „|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d“ kombiniert
Beispiel: logs/access_log.20030326
Das Protokoll liegt im komprimierten Format vor. Sie können gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | verwenden, um Statistiken dynamisch zu dekomprimieren.
Für IIS: Standardmäßig gibt es bessere Protokollkürzungsregeln pro Tag, aber das Protokollformat von IIS ist nicht für AWStats-Statistiken geeignet.
Daher ist es am besten, einfach alle Protokollfelder zu entfernen und sie streng nach der folgenden Liste festzulegen
Datum Datum
Zeit Zeit
Kunden-IP-Adresse c-ip
Benutzernamecs-Benutzername
methodcs-methode
URI-Ressource cs-uri-stem
Protokollstatus sc-status
Anzahl der gesendeten Bytes sc-Bytes
Protokollversion CS-Version
Benutzeragent cs (Benutzeragent)
Referenzcs(Referer)
Im Vergleich zu den IIS-Standardeinstellungen:
Die Ermäßigungen umfassen:
Server-IP-Adresse
Server-Port
URI-Abfrage
Hinzugekommen sind:
Anzahl der gesendeten Bytes
Protokollversion
Referenz
Benennungsregeln für Konfigurationsdateien: awstats.sitename.conf
Das Hauptprogramm von AWStats, awstats.pl, ruft automatisch die Konfigurationsdatei der entsprechenden Site entsprechend dem Site-Namen auf: awstats.sitename.conf
Beispiel: Wenn Sie ./awstats.pl -config=chedong ausführen, wird die Konfigurationsdatei awstats.chedong.conf im selben Verzeichnis aufgerufen.
Wenn -config nicht angegeben ist, wird auch awstats.conf oder /etc/awstats.conf im aktuellen Verzeichnis als Standardkonfigurationsdatei gefunden.
Daher ist es am besten, die Standarddatei awstats.model.conf in awstats.yoursite.conf umzubenennen, zum Beispiel: awstats.chedong.conf;
Für Statistiken auf mehreren Websites ist die Funktion zum Einbinden von Konfigurationsdateien von AWStats immer noch sehr nützlich. Wir können die allgemeine Konfiguration in ein Dokument einfügen und dann die Konfiguration einschließen (unterstützt nach Version 5.4) verwenden, um die allgemeine Konfiguration in jede spezifische Konfigurationsdatei einzuschließen .-Header und verwenden Sie dann andere Konfigurationen, um die entsprechenden Eigenschaften in der allgemeinen Konfiguration zu überschreiben, wie zum Beispiel:
Include="common.conf"
LogFile="/path/to/bbs/access_log"
SiteName="bbs.chedong.com"
Minimale Änderung der Konfigurationsdatei: LogFile SiteDomain LogFormat
Um Apache-Protokolle unter GNU/Linux zu zählen, ändern Sie einfach diese beiden Optionen: LogFile SiteDomain
GNU/Linux LogFile="/path/to/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
Windows 2000 LogFile="d:iis_logsW3SV3ex%YY-24%MM-24%DD-24.log"
Bei dieser Konfiguration wird der Name der Protokolldatei mit Jahr, Monat und Datum vor 24 Stunden angegeben.
SiteDomain="www.chedong.com"
Der Name der Site, der standardmäßig leer ist. Wenn er leer ist, verweigert AWStats die Ausführung.
Für statistische IIS-Protokolle ist eine weitere Änderung erforderlich:
LogFormat=2
Der Standardwert ist 1: Apache-Protokoll, 2 ist IIS-Protokoll
[Seite ausschneiden]
Weitere Dinge, die Sie beachten sollten:
AWStats filtert standardmäßig keine SWF-Dateien und zählt .swf als PageView. Wenn es sich bei den SWF-Dateien auf der Website also hauptsächlich um Werbung handelt, ist es am besten, sie herauszufiltern:
Protokollanalyse
./awstats.pl -update -config=sitename -lang=cn
Zum Beispiel: ./awstats.pl -update -config=chedong
Die Konfigurationsdatei awstats.chedong.conf wird automatisch aufgerufen.
Statistische Ausgabe
GNU/Linux http://localhost/cgi-bin/awstats/awstats.pl? config=chedong
Windows 2000 http://localhost/awstats/awstats.chedong.html
Protokollstatistiken werden automatisch ausgeführt
Unter GNU/Linux: crontab -e: jeden Tag um 8:10 ausführen
#updateawstats
10 8 * * * (cd /path/to/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
Unter Windows 2000: Täglich um 8:10 Uhr ausführen
D:Perlbinperl.exe d:AWStatstoolsawstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:inetpubawstats -awstatsprog=d:awstatswwwroot cgi-binawstats.pl
Protokollstatistiken für mehrere Standorte
AWStats verfügt über ein Stapelverarbeitungstool: tools/awstats_updateall.pl, das alle Konfigurationsdateien in einem Verzeichnis stapelweise durchsuchen und Statistiken ausführen kann. Daher besteht die verbleibende Arbeit hauptsächlich aus der Protokollsynchronisierung.
Bei mehreren Standorten werden viele Konfigurationsoptionen geändert und verwaltet. AWStats bietet seit Version 5.4 Funktionen, die in den Konfigurationsdateien enthalten sind, sodass wir eine gemeinsame Konfiguration konfigurieren können, z. conf
Anschließend wird die Konfiguration anderer Sites auf Folgendes festgelegt: Sie können die folgenden Optionen verwenden, um die Konfiguration zu überschreiben, die nicht mit der Standardeinstellung übereinstimmt.
awstats.bbs.chedong.conf
Fügen Sie „chedong.common.conf“ ein
LogFile „/path/to/bbs_log“
SiteName „bbs.chedong.com“
awstats.www.chedong.conf
Fügen Sie „chedong.common.conf“ ein
LogFile „/path/to/www_log“
SiteName „www.chedong.com“
HostAliases="chedong.com"
Beschreibung statistischer Indikatoren
Besucher: Statistiken basierend auf eindeutigen IP-Adressen von Besuchern, eine IP repräsentiert einen Besucher;
Anzahl der Besuche: Ein Besucher kann mehrmals am Tag vorbeikommen (z. B. einmal morgens, einmal nachmittags). Daher wird die Anzahl der Besuche des Besuchers auf der Grundlage der Anzahl eindeutiger IPs innerhalb eines bestimmten Zeitraums berechnet Zeit (zum Beispiel: 1 Stunde);
Anzahl der Webseiten: Die Gesamtzahl der reinen Seitenbesuche ohne Bilder, CSS, JavaScript-Dateien usw., aber wenn eine Seite mehrere Frames verwendet, zählt jeder Frame als Seitenanforderung;
Anzahl der Dateien: Die Gesamtzahl der Dateianfragen vom Browser-Client, einschließlich Bildern, CSS, JavaScript usw. Wenn die Seite Bilder usw. enthält, werden mehrere Dateianfragen an den Server gestellt Die Anzahl der Dateien ist im Allgemeinen viel größer als die Anzahl der Dateien.
Bytes: die Gesamtmenge der an den Client übertragenen Daten;
Daten von REFERER: Das Referenzfeld (REFERER) im Protokoll zeichnet die Adresse auf, bevor auf die entsprechende Webseite zugegriffen wird. Wenn der Benutzer daher über die Suchergebnisse der Suchmaschine auf die Website klickt, wird die Anfrage des Benutzers angezeigt entsprechende Suchmaschine im Protokoll. Aus dieser Adresse können die in Benutzeranfragen verwendeten Schlüsselwörter durch Parsen extrahiert werden:
Zum Beispiel:
26.03.2003 15:43:58 123.123.123.123 - GET /index.html 200 192 HTTP/1.1 Mozilla/4.0+(kompatibel; +MSIE+5.01; +Windows+NT+5.0) http://www.google .com/search? q=chedong
AWStats verfügt über relativ vollständige Funktionen für Suchmaschinen-Schlüsselphrasen und Keyword-Statistiken: Es kann mehr als 300 Maschinen-Crawler auf der ganzen Welt identifizieren und die meisten gängigen internationalen Suchmaschinen und Suchmaschinen in vielen Regionen identifizieren.
[Seite ausschneiden]
AWStats hacken
Plug-in-Installation basierend auf geografischen Informationen:
GeoIP und Geo::IPfree (awstats 5.5+)
Sowohl GeoIP als auch Geo::IPfree sind kostenlose Länder-/IP-Zuordnungstabellen, die genauer und schneller sind als die durch DNS-Reverse-Domain-Name-Auflösung erhaltenen Statistiken. GeoIP-APIs sind kostenlos, die Standardbibliothek ist kostenlos und der Datenaktualisierungsdienst ist kostenpflichtig. Nicht nur der Code von Geo::IPfree ist öffentlich, sondern auch die Bibliotheksdaten.
GeoIP-Installation:
Laden Sie zuerst die C-Bibliothek herunter: GeoIP C nach dem Entpacken
%./configure; make
#make installieren
Laden Sie dann nach dem Entpacken die Perl-Bibliothek herunter: GeoIP Perl
%perl MakeFile.PL; make
#make installieren
Geo::IPfreie Installation:
Nachdem Sie Geo::IPfree heruntergeladen und entpackt haben
%perl-Makefile
%machen
#make installieren
Konfiguration: Durch Aktivieren von GEOIP-bezogenen Plug-ins in der Konfigurationsdatei:
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
MaxMind stellt GeoIP- und GeoIPCityLite-Datenpakete derzeit kostenlos zur Verfügung: Sie können regelmäßig jeden Monat unter der folgenden Adresse heruntergeladen werden
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
[Seite ausschneiden]Das Protokollstatistiksystem spielt eine wichtige Rolle bei der Analyse des Benutzerverhaltens der Website, insbesondere für Keyword-Zugriffsstatistiken von Suchmaschinen: Es ist eine sehr effektive Quelle für Daten zur Analyse des Benutzerverhaltens. Mit der Entwicklung des Internets im Laufe der Jahre sind WEB-Protokollstatistiktools immer ausgereifter geworden und verfügen über immer mehr Funktionen. Viele davon sind Open Source und AWStats ist eines der besten.
AWStats: Erweiterte Webstatistiken
AWStats ist ein Perl-basiertes WEB-Protokollanalysetool, das schnell auf Sourceforge entwickelt wurde. Im Vergleich zu Webalizer, einem weiteren hervorragenden Open-Source-Protokollanalysetool, bietet AWStats die folgenden Vorteile:
Benutzerfreundliche Oberfläche: Sie können je nach Browser direkt die entsprechende Sprachoberfläche aufrufen (vereinfachte chinesische Version ist verfügbar).
Referenzausgabebeispiel: http://www.chedong.com/cgi-bin/awstats/awstats.pl? config=chedong
Basiert auf Perl: und löst das plattformübergreifende Problem sehr gut. Das System selbst kann unter GNU/Linux oder Windows ausgeführt werden (nach der Installation von ActivePerl); die analysierten Protokolle unterstützen direkt das Apache-Format (kombiniert) und das IIS-Format (muss geändert werden). ). Obwohl es für Webalizer auch eine Version für die Windows-Plattform gibt, mangelt es derzeit an Wartung.
AWStats kann vollständig ein System verwenden, um einheitliche Statistiken auf verschiedenen WEB-Servern Ihrer eigenen Site zu erstellen: GNU/Linux/Apache- und Windows/IIS-Server.
Relativ hohe Effizienz: Die Ausgabestatistikelemente von AWStats sind viel umfangreicher als die von Webalizer, und die Geschwindigkeit kann immer noch etwa ein Drittel der von Webalizer erreichen. Für eine Website mit Millionen von täglichen Besuchen ist diese Geschwindigkeit ausreichend.
Bequeme Konfiguration/Anpassung: Das System bietet ausreichend flexible, aber sinnvolle Standardkonfigurationsregeln, um mit der Ausführung beginnen zu können, und es gibt eine ganze Reihe von Plug-Ins, die geändert und erweitert werden können.
Die Designer von AWStats sind auf präzise „menschliche Besuche“ ausgelegt, daher werden viele Besuche von Suchmaschinenrobotern herausgefiltert, sodass die Zahlen möglicherweise niedriger sind als bei anderen Protokollstatistiktools. Besuche aus dem Unternehmen können auch durch IP-Filtereinstellungen herausgefiltert werden .
Bietet viele erweiterte Parameterstatistikfunktionen: Die Verwendung der Konfiguration der ExtraXXXX-Serie zur Erstellung anwendungsspezifischer Parameteranalysen ist für die Produktanalyse sehr nützlich.
Weitere Vergleiche mit anderen Tools: Webalizer, analog finden Sie unter:
http://awstats.sourceforge.net/#COMPARISON