로그 통계 시스템은 사이트의 사용자 행동 분석, 특히 검색 엔진의 키워드 액세스 통계에서 중요한 역할을 합니다. 이는 사용자 행동 분석 데이터의 매우 효과적인 소스입니다. 수년에 걸쳐 인터넷이 발전함에 따라 WEB 로그 통계 도구는 점점 더 성숙해졌으며 점점 더 많은 기능을 가지고 있습니다. 그 중 다수는 오픈 소스이며 AWStats는 최고의 소스 중 하나입니다.
간략한 설치 지침은 다음과 같습니다.
설치하다
http://sourceforge.net/projects/awstats/ 설치 패키지를 다운로드한 후:
GNU/Linux: tar zxf awstats-version.tgz
기본적으로 awstats의 스크립트와 정적 파일은 wwwroot 디렉터리에 있습니다. cgi-bin 디렉터리의 모든 파일을 cgi-bin/ 디렉터리에 배포합니다: /home/apache/cgi-bin/awstats/
mv awstats-버전/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
아이콘 및 기타 파일 디렉터리를 WEB HTML 파일 게시 디렉터리(예: /home/apache/htdocs/)에 복사하고 게시합니다.
더 많은 일괄 업데이트 스크립트는 tools 디렉터리에 있으며 cgi-bin/awstats/ 디렉터리에 배치할 수 있습니다.
국내 주요 검색 엔진 및 스파이더의 정의를 업그레이드하고 GeoIP 애플리케이션 라이브러리를 설치합니다: C
http://www.maxmind.com/download/geoip/api/c/ 압축 풀기, 컴파일 및 설치
perl -MCPAN -e 'install "Geo::IP"' 또는 순수 Perl 패키지 사용 perl -MCPAN -e 'install "Geo::IP::PurePerl"'
GeoIP/GeoIPCityLite 패키지 다운로드: 압축을 풀고 awstats 디렉터리에 배포
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
구성
기본 awstats.model.conf의 이름을 common.conf로 지정합니다.
다음 구성 옵션 중 일부를 수정합니다.
LoadPlugin="decodeutfkeys"
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
통계 데이터 출력을 위해 awstats 아래에 데이터 디렉터리를 생성합니다.
다음 예에 따라 구성 파일을 설정합니다.
"common.conf" 포함
로그 파일="/home/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
SiteDomain="www.chedong.com"
HostAliases="chedong.com"
DefaultFile="index.html"
DirData="/home/apache/cgi-bin/awstats/data/"
콘텐츠 요약: AWStats 사용 소개 및 일부 구성 개선 지침. AWStats 버전 6.3부터 중국 사용자는 기본적으로 구성 파일에서 LoadPlugin="decodeutfkeys"만 활성화하면 됩니다. 기본적으로 중국 검색 엔진에는 통계적 문제가 없습니다. .com', 'search.sina.com', 'search.sohu.com', 이 세 가지 검색 엔진입니다. 국내 주요 검색 엔진 및 스파이더 정의에 대한 패치가 포함되어 있습니다. (압축해제 후 lib 디렉터리에 원래 프로그램 디렉터리를 덮어쓰시면 됩니다.)
[컷 페이지]
로그 통계 시스템은 사이트의 사용자 행동 분석, 특히 검색 엔진의 키워드 액세스 통계에서 중요한 역할을 합니다. 이는 사용자 행동 분석 데이터의 매우 효과적인 소스입니다. 수년에 걸쳐 인터넷이 발전함에 따라 WEB 로그 통계 도구는 점점 더 성숙해졌으며 점점 더 많은 기능을 가지고 있습니다. 그 중 다수는 오픈 소스이며 AWStats는 최고의 소스 중 하나입니다.
AWStats: 고급 웹 통계
AWStats는 Sourceforge에서 빠르게 개발된 Perl 기반 WEB 로그 분석 도구입니다. 또 다른 뛰어난 오픈 소스 로그 분석 도구인 Webalizer와 비교할 때 AWStats는 다음과 같은 장점이 있습니다.
친숙한 인터페이스: 브라우저에 따라 해당 언어 인터페이스를 직접 호출할 수 있습니다(중국어 간체 버전 사용 가능).
참조 출력 샘플: http://www.chedong.com/cgi-bin/awstats/awstats.pl? 구성=체동
Perl 기반: 크로스 플랫폼 문제를 매우 잘 해결합니다. 시스템 자체는 GNU/Linux 또는 Windows(ActivePerl이 설치된 후)에서 실행될 수 있습니다. 분석된 로그는 Apache 형식(결합) 및 IIS 형식(수정 필요)을 직접 지원합니다. ). Webalizer에는 Windows 플랫폼 버전도 있지만 현재 유지 관리가 부족합니다.
AWStats는 하나의 시스템을 완전히 사용하여 사이트의 다양한 웹 서버(GNU/Linux/Apache 및 Windows/IIS 서버)에 대한 통합 통계를 완성할 수 있습니다.
상대적으로 높은 효율성: AWStats 출력 통계 항목은 Webalizer보다 훨씬 풍부하며 일일 방문 수가 수백만 건인 사이트의 경우 속도는 여전히 Webalizer의 약 1/3에 도달할 수 있습니다.
편리한 구성/사용자 정의: 시스템은 충분히 유연하지만 합리적인 기본 구성 규칙을 제공하며 실행을 시작하려면 3~4개 이하의 기본 구성을 수정해야 하며 수정 및 확장할 수 있는 플러그인이 상당히 많습니다.
AWStats의 디자이너는 정확한 "사람 방문"을 위해 설계되었으므로 많은 검색 엔진 로봇 방문이 필터링되므로 다른 로그 통계 도구보다 숫자가 낮을 수 있습니다. 회사 내부의 방문도 IP 필터링 설정을 통해 필터링할 수 있습니다. .
다양한 확장된 매개변수 통계 기능 제공: ExtraXXXX 시리즈 구성을 사용하여 애플리케이션별 매개변수 분석을 생성하는 것은 제품 분석에 매우 유용합니다.
다른 도구와의 추가 비교: Webalizer, 아날로그, 다음을 참조하십시오.
http://awstats.sourceforge.net/#COMPARISON
[컷 페이지]
AWStats 설치 알림
AWStats의 작동 모드는 다음과 같습니다:
로그 분석: 실행 후 해당 로그 통계 결과를 AWStats 데이터베이스(일반 텍스트)에 보관합니다.
그런 다음 출력이 있습니다. 두 가지 형태로 나타납니다.
하나는 cgi 프로그램을 통해 통계 결과 데이터베이스 출력을 읽는 것입니다.
하나는 백그라운드 스크립트를 실행하여 출력을 정적 파일로 내보내는 것입니다.
다음은 단일 사이트에 대한 로그 통계의 2가지 예입니다.
하나는 GNU/Linux에서 CGI를 통해 출력되고,
하나는 Windows 2000의 정적 페이지 내보내기를 기반으로 합니다.
다운로드/설치
http://sourceforge.net/projects/awstats/ 설치 패키지를 다운로드한 후:
GNU/Linux: tar zxf awstats-version.tgz
awstats의 스크립트와 정적 파일은 기본적으로 wwwroot 디렉터리에 있습니다. cgi-bin 디렉터리의 awstats.pl 프로그램을 /home/apache/cgi-bin/awstats/에 배포합니다.
mv awstats-버전/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
#아이콘 및 기타 파일 디렉터리를 WEB HTML 파일 게시 디렉터리: /home/apache/htdocs/에 복사하고 아래에 게시합니다.
더 많은 일괄 업데이트 스크립트는 tools 디렉터리에 있으며 cgi-bin/awstats/ 디렉터리에 함께 배치할 수 있습니다.
Windows 2000: 백그라운드 스크립트 모드에서 실행하고 직접 압축을 푼 다음 D:AWStats 디렉터리로 이동합니다.
아이콘 디렉터리를 IIS 릴리스 디렉터리 inetpub/icon에 복사합니다.
[컷 페이지]
일별 데이터 소스 로그 형식 및 잘림 규칙
Apache의 경우: 로그 형식은 설정하기 쉽습니다. 결합 형식으로 설정하면 됩니다. 로그 자르기는 좀 더 번거롭습니다. cronolog 도구를 설치하고 로그를 날짜별로 자르도록 설정해야 합니다.
CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" 결합
예: 로그/access_log.20030326
로그는 압축된 형식이므로 gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz |를 사용하여 통계를 동적으로 압축 해제할 수 있습니다.
IIS의 경우: 기본적으로 날짜별로 더 나은 로그 자르기 규칙이 있지만 IIS의 로그 형식은 AWStats 통계에 적합하지 않습니다.
따라서 모든 로그 필드를 제거하고 다음 목록에 따라 엄격하게 설정하는 것이 가장 좋습니다.
날짜 날짜
시간 시간
고객 IP 주소 c-ip
사용자 이름cs-사용자 이름
방법-방법
URI 리소스 cs-uri-stem
프로토콜 상태 sc-status
전송된 바이트 수 sc-바이트
프로토콜 버전 cs-version
사용자 에이전트 cs(User-Agent)
Referencecs(참조자)
IIS 기본 설정과 비교:
감소에는 다음이 포함됩니다.
서버 IP 주소
서버 포트
URI 쿼리
추가된 내용은 다음과 같습니다:
전송된 바이트 수
프로토콜 버전
참조
구성 파일의 이름 지정 규칙: awstats.sitename.conf
AWStats의 기본 프로그램인 awstats.pl은 사이트 이름에 따라 해당 사이트의 구성 파일인 awstats.sitename.conf를 자동으로 호출합니다.
예를 들어, ./awstats.pl -config=chedong을 실행하면 동일한 디렉터리에 있는 awstats.chedong.conf 구성 파일이 호출됩니다.
-config를 지정하지 않으면 현재 디렉터리의 awstats.conf 또는 /etc/awstats.conf도 기본 구성 파일로 검색됩니다.
따라서 기본 awstats.model.conf의 이름을 awstats.yoursite.conf로 바꾸는 것이 가장 좋습니다. 예: awstats.chedong.conf
여러 사이트에 대한 통계의 경우 AWStats의 구성 파일 포함 기능은 여전히 매우 유용합니다. 공통 구성을 하나의 문서에 넣은 다음 포함 구성(버전 5.4 이후 지원)을 사용하여 각 특정 구성 파일에 공통 구성을 포함할 수 있습니다. . 헤더를 선택한 다음 다른 구성을 사용하여 다음과 같은 일반 구성의 해당 속성을 재정의합니다.
포함="common.conf"
로그파일="/path/to/bbs/access_log"
사이트명="bbs.chedong.com"
최소 구성 파일 수정: LogFile SiteDomain LogFormat
GNU/Linux에서 Apache 로그를 계산하려면 다음 두 가지 옵션을 수정하세요. LogFile SiteDomain
GNU/Linux 로그 파일="/path/to/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
Windows 2000 로그 파일="d:iis_logsW3SV3ex%YY-24%MM-24%DD-24.log"
이 구성은 24시간 전의 연도, 월, 날짜가 포함된 로그 파일 이름을 의미합니다.
SiteDomain="www.chedong.com"
기본적으로 비어 있는 사이트 이름입니다. 비어 있으면 AWStats 실행이 거부됩니다.
통계 IIS 로그의 경우 한 가지 더 수정해야 합니다.
로그형식=2
기본값은 1: Apache 로그, 2는 IIS 로그입니다.
[컷 페이지]
기타 참고할 사항:
AWStats는 기본적으로 swf 파일을 필터링하지 않으며 .swf를 PageView로 계산하므로 사이트의 swf 파일이 주로 광고인 경우 필터링하는 것이 가장 좋습니다.
로그 분석
./awstats.pl -update -config=사이트 이름 -lang=cn
예: ./awstats.pl -update -config=chedong
구성 파일 awstats.chedong.conf가 자동으로 호출됩니다.
통계 출력
GNU/리눅스 http://localhost/cgi-bin/awstats/awstats.pl? 구성=체동
윈도우 2000 http://localhost/awstats/awstats.chedong.html
로그 통계가 자동으로 실행됩니다.
GNU/Linux: crontab -e: 매일 8:10에 실행
#updateawstats
10 8 * * * (cd /path/to/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
Windows 2000: 매일 8시 10분에 실행되도록 설정
D:Perlbinperl.exe d:AWStatstoolsawstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:inetpubawstats -awstatsprog=d:awstatswwwroot cgi-binawstats.pl
다중 사이트 로그 통계
AWStats에는 일괄 처리 도구인 tools/awstats_updateall.pl이 함께 제공됩니다. 이 도구는 디렉터리의 모든 구성 파일을 일괄적으로 탐색하고 통계를 실행할 수 있습니다. 따라서 남은 작업은 주로 로그 동기화에 관한 것입니다.
여러 사이트의 경우 많은 구성 옵션이 반복되므로 각 구성 파일을 수정하고 유지 관리하는 것은 매우 번거로운 일입니다.AWStats는 버전 5.4부터 구성 파일에 포함된 기능을 제공하므로 다음과 같은 공통 구성을 구성할 수 있습니다. conf
그러면 다른 사이트의 구성이 다음과 같이 설정됩니다. 다음 옵션을 사용하여 기본값과 일치하지 않는 구성을 재정의할 수 있습니다.
awstats.bbs.chedong.conf
"chedong.common.conf"를 포함합니다.
로그 파일 "/path/to/bbs_log"
사이트명 "bbs.chedong.com"
awstats.www.chedong.conf
"chedong.common.conf"를 포함합니다.
로그 파일 "/path/to/www_log"
사이트명 "www.chedong.com"
HostAliases="chedong.com"
통계지표 설명
방문자: 방문자의 고유 IP 주소를 기반으로 한 통계로, 하나의 IP는 한 명의 방문자를 나타냅니다.
방문 횟수 : 방문자는 하루에 여러 번(예: 오전에 한 번, 오후에 한 번) 방문할 수 있으므로, 방문자의 방문 횟수는 일정 기간 동안의 고유 IP 수를 기준으로 계산됩니다. 시간(예: 1시간)
웹페이지 수: 이미지, CSS, JavaScript 파일 등을 제외한 순수 페이지 방문의 총 횟수. 단, 페이지가 여러 프레임을 사용하는 경우 각 프레임은 페이지 요청으로 계산됩니다.
파일 수: 그림, CSS, JavaScript 등을 포함하여 브라우저 클라이언트의 총 파일 요청 수입니다. 사용자가 페이지에 그림 등이 포함된 경우 서버에 여러 개의 파일 요청이 이루어집니다. 파일 수는 일반적으로 파일 수보다 훨씬 큽니다.
바이트: 클라이언트에 전송된 데이터의 총량입니다.
REFERER의 데이터: 로그의 참조(REFERER) 필드에는 해당 웹 페이지에 접속하기 전의 주소가 기록되어 있으므로 사용자가 검색 엔진의 검색 결과를 통해 해당 웹 사이트를 클릭하면 해당 페이지에 사용자의 쿼리가 포함됩니다. 로그의 해당 검색 엔진 주소. 이 주소에서 사용자 쿼리에 사용된 키워드를 구문 분석을 통해 추출할 수 있습니다.
예를 들어:
2003-03-26 15:43:58 123.123.123.123 - GET /index.html 200 192 HTTP/1.1 Mozilla/4.0+(호환; +MSIE+5.01; +Windows+NT+5.0) http://www.google .com/search? q=체동
AWStats는 검색 엔진 핵심 문구 및 키워드 통계에 있어 비교적 완전한 기능을 갖추고 있습니다. 전 세계 300개 이상의 기계 크롤러를 식별할 수 있으며 대부분의 주류 국제 검색 엔진과 여러 지역의 현지 언어 검색 엔진을 식별할 수 있습니다.
[컷 페이지]
AWStats 해킹
지리정보 기반 플러그인 설치:
GeoIP 및 Geo::IPfree(awstats 5.5+)
GeoIP와 Geo::IPfree는 모두 무료 국가/IP 매핑 테이블로, DNS 역방향 도메인 이름 확인으로 얻은 통계보다 더 정확하고 빠릅니다. GeoIP API는 무료이고 기본 라이브러리도 무료이며 데이터 업데이트 서비스는 유료입니다. Geo::IPfree의 코드는 공개될 뿐만 아니라 라이브러리 데이터도 공개됩니다.
GeoIP 설치:
C 라이브러리를 먼저 다운로드하세요: 압축을 푼 후 GeoIP C
%./구성;
#설치하기
그런 다음 압축을 푼 후 Perl 라이브러리: GeoIP Perl을 다운로드합니다.
%perl MakeFile.PL;
#설치하기
지역::IPfree 설치:
Geo::IPfree를 다운로드하고 압축을 푼 후
%perl 메이크파일
%만들다
#설치하기
구성: 구성 파일에서 GEOIP 관련 플러그인을 활성화하여:
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
MaxMind는 현재 GeoIP 및 GeoIPCityLite 데이터 패키지를 무료로 제공합니다. 다음 주소에서 매달 정기적으로 다운로드할 수 있습니다.
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
[컷 페이지]로그 통계 시스템은 사이트의 사용자 행동 분석, 특히 검색 엔진의 키워드 액세스 통계에서 중요한 역할을 합니다. 이는 사용자 행동 분석 데이터의 매우 효과적인 소스입니다. 수년에 걸쳐 인터넷이 발전함에 따라 WEB 로그 통계 도구는 점점 더 성숙해졌으며 점점 더 많은 기능을 가지고 있습니다. 그 중 다수는 오픈 소스이며 AWStats는 최고의 소스 중 하나입니다.
AWStats: 고급 웹 통계
AWStats는 Sourceforge에서 빠르게 개발된 Perl 기반 WEB 로그 분석 도구입니다. 또 다른 뛰어난 오픈 소스 로그 분석 도구인 Webalizer와 비교할 때 AWStats는 다음과 같은 장점이 있습니다.
친숙한 인터페이스: 브라우저에 따라 해당 언어 인터페이스를 직접 호출할 수 있습니다(중국어 간체 버전 사용 가능).
참조 출력 샘플: http://www.chedong.com/cgi-bin/awstats/awstats.pl? 구성=체동
Perl 기반: 크로스 플랫폼 문제를 매우 잘 해결합니다. 시스템 자체는 GNU/Linux 또는 Windows(ActivePerl이 설치된 후)에서 실행될 수 있습니다. 분석된 로그는 Apache 형식(결합) 및 IIS 형식(수정 필요)을 직접 지원합니다. ). Webalizer에는 Windows 플랫폼 버전도 있지만 현재 유지 관리가 부족합니다.
AWStats는 하나의 시스템을 완전히 사용하여 사이트의 다양한 웹 서버(GNU/Linux/Apache 및 Windows/IIS 서버)에 대한 통합 통계를 완성할 수 있습니다.
상대적으로 높은 효율성: AWStats 출력 통계 항목은 Webalizer보다 훨씬 풍부하며 일일 방문 수가 수백만 건인 사이트의 경우 속도는 여전히 Webalizer의 약 1/3에 도달할 수 있습니다.
편리한 구성/사용자 정의: 시스템은 충분히 유연하지만 합리적인 기본 구성 규칙을 제공하며 실행을 시작하려면 3~4개 이하의 기본 구성을 수정해야 하며 수정 및 확장할 수 있는 플러그인이 상당히 많습니다.
AWStats의 디자이너는 정확한 "사람 방문"을 위해 설계되었으므로 많은 검색 엔진 로봇 방문이 필터링되므로 다른 로그 통계 도구보다 숫자가 낮을 수 있습니다. 회사 내부의 방문도 IP 필터링 설정을 통해 필터링할 수 있습니다. .
다양한 확장된 매개변수 통계 기능 제공: ExtraXXXX 시리즈 구성을 사용하여 애플리케이션별 매개변수 분석을 생성하는 것은 제품 분석에 매우 유용합니다.
다른 도구와의 추가 비교: Webalizer, 아날로그, 다음을 참조하십시오.
http://awstats.sourceforge.net/#COMPARISON