El sistema de estadísticas de registro juega un papel importante en el análisis del comportamiento del usuario del sitio, especialmente para las estadísticas de acceso a palabras clave de los motores de búsqueda: es una fuente muy eficaz de datos de análisis del comportamiento del usuario. Con el desarrollo de Internet a lo largo de los años, las herramientas de estadísticas de registros WEB se han vuelto cada vez más maduras y tienen cada vez más funciones. Muchos de ellos son de código abierto y AWStats es uno de los mejores.
Las breves instrucciones de instalación son las siguientes:
Instalar
http://sourceforge.net/projects/awstats/ Después de descargar el paquete de instalación:
GNU/Linux: tar zxf awstats-version.tgz
De forma predeterminada, los scripts y los archivos estáticos de awstats están en el directorio wwwroot: implemente todos los archivos en el directorio cgi-bin en el directorio cgi-bin/: /home/apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
Copie el ícono y otros directorios de archivos al directorio de publicación de archivos HTML WEB, por ejemplo: /home/apache/htdocs/ y publíquelos.
Hay más scripts de actualización por lotes en el directorio de herramientas y se pueden colocar en el directorio cgi-bin/awstats/.
Actualice las definiciones de los principales motores de búsqueda y arañas nacionales e instale la biblioteca de aplicaciones GeoIP: C
http://www.maxmind.com/download/geoip/api/c/ Desempaquetar, compilar e instalar
perl -MCPAN -e 'instalar "Geo::IP"' o utilizar el paquete Perl puro perl -MCPAN -e 'instalar "Geo::IP::PurePerl"'
Descargue el paquete GeoIP/GeoIPCityLite: descomprímalo e impleméntelo en el directorio awstats
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
Configuración
Asigne el nombre predeterminado awstats.model.conf a common.conf
Modifique algunas de estas opciones de configuración:
LoadPlugin="clavesdecodeutf"
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
Cree el directorio de datos en awstats para la salida de datos estadísticos
Configure el archivo de configuración según el siguiente ejemplo:
Incluir "common.conf"
LogFile="/home/apache/logs/access_log.%AAAA-24%MM-24%DD-24"
Dominio del sitio="www.chedong.com"
HostAliases="chedong.com"
Archivo predeterminado="index.html"
DirData="/home/apache/cgi-bin/awstats/data/"
Resumen de contenido: Introducción al uso de AWStats y algunas instrucciones de mejora de configuración. Es genial ver que a partir de la versión 6.3 de AWStats: los usuarios chinos básicamente solo necesitan habilitar LoadPlugin="decodeutfkeys" en el archivo de configuración. Básicamente, no habrá problemas estadísticos con los motores de búsqueda chinos. Actualmente, # Baidu de motores de búsqueda chinos menores. .com', 'search.sina.com', 'search.sohu.com', estos tres motores de búsqueda. Contiene parches para los principales motores de búsqueda nacionales y definiciones de arañas (simplemente sobrescriba el directorio del programa original en el directorio lib después de descomprimirlo)
[Cortar-Página]
El sistema de estadísticas de registro juega un papel importante en el análisis del comportamiento del usuario del sitio, especialmente para las estadísticas de acceso a palabras clave de los motores de búsqueda: es una fuente muy eficaz de datos de análisis del comportamiento del usuario. Con el desarrollo de Internet a lo largo de los años, las herramientas de estadísticas de registros WEB se han vuelto cada vez más maduras y tienen cada vez más funciones. Muchos de ellos son de código abierto y AWStats es uno de los mejores.
AWStats: Estadísticas web avanzadas
AWStats es una herramienta de análisis de registros WEB basada en Perl desarrollada rápidamente en Sourceforge. En comparación con Webalizer, otra excelente herramienta de análisis de registros de código abierto, AWStats tiene las siguientes ventajas:
Interfaz amigable: puede llamar directamente a la interfaz del idioma correspondiente según el navegador (hay disponible una versión en chino simplificado)
Ejemplo de salida de referencia: http://www.chedong.com/cgi-bin/awstats/awstats.pl? configuración=chedong
Basado en Perl: y resuelve muy bien el problema multiplataforma. El sistema en sí puede ejecutarse en GNU/Linux o Windows (después de instalar ActivePerl, los registros analizados admiten directamente el formato Apache (combinado) y el formato IIS (deben modificarse); ). Aunque Webalizer también cuenta con una versión para plataforma Windows, actualmente carece de mantenimiento;
AWStats puede utilizar completamente un sistema para completar estadísticas unificadas en diferentes servidores WEB de su propio sitio: servidores GNU/Linux/Apache y Windows/IIS.
Eficiencia relativamente alta: los elementos estadísticos de salida de AWStats son mucho más ricos que Webalizer y la velocidad aún puede alcanzar aproximadamente 1/3 de Webalizer. Para un sitio con millones de visitas diarias, esta velocidad es suficiente;
Configuración/personalización conveniente: el sistema proporciona reglas de configuración predeterminadas suficientemente flexibles pero razonables. No es necesario modificar más de 3 o 4 configuraciones predeterminadas para comenzar a ejecutarse, y hay bastantes complementos que se pueden modificar y expandir;
Los diseñadores de AWStats están diseñados para "visitas humanas" precisas, por lo que muchas visitas de robots de motores de búsqueda se filtran, por lo que los números pueden ser más bajos que los de otras herramientas de estadísticas de registro. Las visitas desde dentro de la empresa también se pueden pasar a través de la configuración de filtrado de IP. .
Proporciona muchas funciones estadísticas de parámetros extendidas: usar la configuración de la serie ExtraXXXX para generar análisis de parámetros específicos de la aplicación será muy útil para el análisis de productos.
Para más comparaciones con otras herramientas: Webalizer, analógico, consulte:
http://awstats.sourceforge.net/#COMPARISON
[Cortar-Página]
Recordatorio de instalación de AWStats
El modo de funcionamiento de AWStats es el siguiente:
Analizar registros: después de ejecutar, archive dichos resultados estadísticos de registros en una base de datos de AWStats (texto sin formato);
Luego está el resultado: en dos formas.
Una es leer la salida de la base de datos de resultados estadísticos a través del programa cgi;
Una es ejecutar un script en segundo plano para exportar el resultado a un archivo estático;
Los siguientes son dos ejemplos de estadísticas de registro para un solo sitio:
Uno se genera a través de CGI en GNU/Linux,
Uno se basa en la exportación de páginas estáticas en Windows 2000.
Descargar/instalar
http://sourceforge.net/projects/awstats/ Después de descargar el paquete de instalación:
GNU/Linux: tar zxf awstats-version.tgz
Los scripts y los archivos estáticos de awstats están en el directorio wwwroot de forma predeterminada: implemente el programa awstats.pl en el directorio cgi-bin en /home/apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
#Copie el ícono y otros directorios de archivos al directorio de publicación de archivos HTML WEB: /home/apache/htdocs/ y publíquelos en
Hay más scripts de actualización por lotes en el directorio de herramientas y se pueden colocar juntos en el directorio cgi-bin/awstats/.
Windows 2000: ejecute en modo script en segundo plano, descomprima directamente y luego vaya al directorio D:AWStats
Copie el directorio de iconos al directorio de versión de IIS: inetpub/icon
[Cortar-Página]
Formato de registro de origen de datos y reglas de truncamiento por día
Para Apache: el formato de registro es fácil de configurar: simplemente configurarlo en formato combinado. El truncamiento de registros es un poco más problemático: debe instalar la herramienta cronolog y configurar el registro para que se trunque por día:
CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" combinado
Por ejemplo: registros/access_log.20030326
El registro está en formato comprimido, puede usar gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | para descomprimir dinámicamente las estadísticas.
Para IIS: de forma predeterminada, existen mejores reglas de truncamiento de registros por día, pero el formato de registro de IIS no es adecuado para las estadísticas de AWStats.
Por lo tanto, es mejor simplemente eliminar todos los campos de registro y configurarlos estrictamente de acuerdo con la siguiente lista
fecha fecha
tiempo tiempo
Dirección IP del cliente c-ip
Nombre de usuariocs-nombre de usuario
método-métodos
recurso URI cs-uri-stem
Estado del protocolo estado-sc
Número de bytes enviados sc-bytes
Versión del protocolo versión cs
Agente de usuario cs (Agente de usuario)
Referencias(Referente)
En comparación con la configuración predeterminada de IIS:
Las reducciones incluyen:
Dirección IP del servidor
Puerto del servidor
consulta URI
Se agregan:
número de bytes enviados
Versión del protocolo
Referencia
Reglas de nomenclatura para archivos de configuración: awstats.sitename.conf
El programa principal de AWStats, awstats.pl, llamará automáticamente al archivo de configuración del sitio correspondiente según el nombre del sitio: awstats.sitename.conf
Por ejemplo: ejecutar ./awstats.pl -config=chedong llama al archivo de configuración awstats.chedong.conf en el mismo directorio;
Si no se especifica -config, awstats.conf o /etc/awstats.conf en el directorio actual también se encontrarán como el archivo de configuración predeterminado.
Por lo tanto, es mejor cambiar el nombre del awstats.model.conf predeterminado a awstats.yoursite.conf, por ejemplo: awstats.chedong.conf;
Para estadísticas en varios sitios, la función de inclusión de archivos de configuración de AWStats sigue siendo muy útil. Podemos colocar la configuración común en un documento y luego usar la configuración Incluir (compatible después de la versión 5.4) para incluir la configuración común en cada archivo de configuración específico. encabezado y luego use otras configuraciones para anular las propiedades correspondientes en la configuración general, como:
Incluir="común.conf"
LogFile="/ruta/a/bbs/access_log"
Nombre del sitio="bbs.chedong.com"
Modificación mínima del archivo de configuración: LogFile SiteDomain LogFormat
Para contar los registros de Apache en GNU/Linux, simplemente modifique estas dos opciones: LogFile SiteDomain
GNU/Linux LogFile="/ruta/a/apache/logs/access_log.%AAAA-24%MM-24%DD-24"
Archivo de registro de Windows 2000="d:iis_logsW3SV3ex%YY-24%MM-24%DD-24.log"
Esta configuración significa que el nombre del archivo de registro se detalla con el año, mes y fecha de hace 24 horas;
Dominio del sitio="www.chedong.com"
El nombre del sitio, que está vacío de forma predeterminada. Si está vacío, AWStats se negará a ejecutarse;
Para los registros estadísticos de IIS, se requiere una modificación más:
Formato de registro=2
El valor predeterminado es 1: registro de Apache, 2 es registro de IIS
[Cortar-Página]
Otras cosas a tener en cuenta:
AWStats no filtra archivos swf de forma predeterminada y contará .swf como PageView, por lo que si los archivos swf en el sitio son principalmente anuncios, es mejor filtrarlos:
Análisis de registros
./awstats.pl -update -config=nombre del sitio -lang=cn
Por ejemplo: ./awstats.pl -update -config=chedong
Se llamará automáticamente al archivo de configuración awstats.chedong.conf.
Producción estadística
GNU/Linux http://localhost/cgi-bin/awstats/awstats.pl? configuración=chedong
Windows 2000 http://localhost/awstats/awstats.chedong.html
Las estadísticas de registro se ejecutan automáticamente
En GNU/Linux: crontab -e: se ejecuta todos los días a las 8:10
#actualizarestadísticas
10 8 * * * (cd /ruta/a/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
En Windows 2000: configurado para ejecutarse a las 8:10 todos los días
D:Perlbinperl.exe d:AWStatstoolsawstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:inetpubawstats -awstatsprog=d:awstatswwwroot cgi-binawstats.pl
Estadísticas de registros multisitio
AWStats viene con una herramienta de procesamiento por lotes: tools/awstats_updateall.pl, que puede recorrer todos los archivos de configuración en un directorio en lotes y ejecutar estadísticas. Por lo tanto, el trabajo restante se centra principalmente en la sincronización de registros.
Para varios sitios, se repiten muchas opciones de configuración. Si cada archivo de configuración se modifica y mantiene, será muy problemático. AWStats ha proporcionado funciones incluidas en los archivos de configuración desde la versión 5.4, por lo que podemos configurar una configuración común, como: común. confinar
Luego, la configuración de otros sitios se establece en: puede usar las siguientes opciones para anular la configuración que no es consistente con la predeterminada.
awstats.bbs.chedong.conf
Incluir "chedong.common.conf"
Archivo de registro "/ruta/a/bbs_log"
Nombre del sitio "bbs.chedong.com"
awstats.www.chedong.conf
Incluir "chedong.common.conf"
Archivo de registro "/ruta/a/www_log"
Nombre del sitio "www.chedong.com"
HostAliases="chedong.com"
Descripción de indicadores estadísticos.
Visitantes: estadísticas basadas en direcciones IP únicas de visitantes, una IP representa un visitante;
Número de visitas: un visitante puede visitar varias veces en un día (por ejemplo: una vez por la mañana, otra por la tarde), por lo que el número de visitas del visitante se calcula en función del número de IP únicas dentro de un determinado período de tiempo. tiempo (por ejemplo: 1 hora);
Número de páginas web: el número total de visitas puras a páginas, excluidas imágenes, CSS, archivos JavaScript, etc., pero si una página utiliza varios marcos, cada marco cuenta como una solicitud de página;
Número de archivos: el número total de solicitudes de archivos del cliente del navegador, incluidas imágenes, CSS, JavaScript, etc. El usuario solicita una página. Si la página contiene imágenes, etc., se realizarán varias solicitudes de archivos al servidor. la cantidad de archivos es generalmente mucho mayor que la cantidad de archivos;
Bytes: la cantidad total de datos transmitidos al cliente;
Datos de REFERER: El campo de referencia (REFERER) en el registro registra la dirección antes de acceder a la página web correspondiente. Por lo tanto, si el usuario hace clic para ingresar al sitio web a través de los resultados de búsqueda del motor de búsqueda, estará la consulta del usuario en el. motor de búsqueda correspondiente en la dirección de registro, desde esta dirección, las palabras clave utilizadas en las consultas de los usuarios se pueden extraer mediante análisis:
Por ejemplo:
2003-03-26 15:43:58 123.123.123.123 - OBTENER /index.html 200 192 HTTP/1.1 Mozilla/4.0+(compatible; +MSIE+5.01; +Windows+NT+5.0) http://www.google .com/búsqueda? q=chedong
AWStats tiene funciones relativamente completas en frases clave y estadísticas de palabras clave de motores de búsqueda: puede identificar más de 300 rastreadores de máquinas en todo el mundo y puede identificar la mayoría de los principales motores de búsqueda internacionales y motores de búsqueda en idiomas locales en muchas regiones.
[Cortar-Página]
Hackear AWStats
Instalación de complementos basada en información geográfica:
GeoIP y Geo::IPfree (awstats 5.5+)
Tanto GeoIP como Geo::IPfree son tablas de mapeo de IP/país gratuitas, que son más precisas y rápidas que las estadísticas obtenidas mediante la resolución inversa de nombres de dominio DNS. Las API de GeoIP son gratuitas, la biblioteca predeterminada es gratuita y su servicio de actualización de datos es de pago. No sólo el código de Geo::IPfree es público, sino que los datos de la biblioteca también lo son.
Instalación GeoIP:
Descargue primero la biblioteca C: GeoIP C después de descomprimir
%./configurar;
#hacer instalar
Luego descargue la biblioteca Perl: GeoIP Perl después de descomprimir
%perl MakeFile.PL;
#hacer instalar
Instalación Geo::IPfree:
Después de descargar Geo::IPfree y descomprimirlo
Archivo %perl
%hacer
#hacer instalar
Configuración: habilitando los complementos relacionados con GEOIP en el archivo de configuración:
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
MaxMind actualmente ofrece paquetes de datos GeoIP y GeoIPCityLite de forma gratuita: se pueden descargar periódicamente todos los meses desde la siguiente dirección
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
[Cortar-Página]El sistema de estadísticas de registro juega un papel importante en el análisis del comportamiento del usuario del sitio, especialmente para las estadísticas de acceso a palabras clave de los motores de búsqueda: es una fuente muy eficaz de datos de análisis del comportamiento del usuario. Con el desarrollo de Internet a lo largo de los años, las herramientas de estadísticas de registros WEB se han vuelto cada vez más maduras y tienen cada vez más funciones. Muchos de ellos son de código abierto y AWStats es uno de los mejores.
AWStats: Estadísticas web avanzadas
AWStats es una herramienta de análisis de registros WEB basada en Perl desarrollada rápidamente en Sourceforge. En comparación con Webalizer, otra excelente herramienta de análisis de registros de código abierto, AWStats tiene las siguientes ventajas:
Interfaz amigable: puede llamar directamente a la interfaz del idioma correspondiente según el navegador (hay disponible una versión en chino simplificado)
Ejemplo de salida de referencia: http://www.chedong.com/cgi-bin/awstats/awstats.pl? configuración=chedong
Basado en Perl: y resuelve muy bien el problema multiplataforma. El sistema en sí puede ejecutarse en GNU/Linux o Windows (después de instalar ActivePerl, los registros analizados admiten directamente el formato Apache (combinado) y el formato IIS (deben modificarse); ). Aunque Webalizer también cuenta con una versión para plataforma Windows, actualmente carece de mantenimiento;
AWStats puede utilizar completamente un sistema para completar estadísticas unificadas en diferentes servidores WEB de su propio sitio: servidores GNU/Linux/Apache y Windows/IIS.
Eficiencia relativamente alta: los elementos estadísticos de salida de AWStats son mucho más ricos que Webalizer y la velocidad aún puede alcanzar aproximadamente 1/3 de Webalizer. Para un sitio con millones de visitas diarias, esta velocidad es suficiente;
Configuración/personalización conveniente: el sistema proporciona reglas de configuración predeterminadas suficientemente flexibles pero razonables. No es necesario modificar más de 3 o 4 configuraciones predeterminadas para comenzar a ejecutarse, y hay bastantes complementos que se pueden modificar y expandir;
Los diseñadores de AWStats están diseñados para "visitas humanas" precisas, por lo que muchas visitas de robots de motores de búsqueda se filtran, por lo que los números pueden ser más bajos que los de otras herramientas de estadísticas de registro. Las visitas desde dentro de la empresa también se pueden pasar a través de la configuración de filtrado de IP. .
Proporciona muchas funciones estadísticas de parámetros extendidas: usar la configuración de la serie ExtraXXXX para generar análisis de parámetros específicos de la aplicación será muy útil para el análisis de productos.
Para más comparaciones con otras herramientas: Webalizer, analógico, consulte:
http://awstats.sourceforge.net/#COMPARISON