Sistem statistik log memainkan peran penting dalam analisis perilaku pengguna situs, terutama untuk statistik akses kata kunci dari mesin pencari: ini adalah sumber data analisis perilaku pengguna yang sangat efektif. Dengan perkembangan Internet selama bertahun-tahun, alat statistik log WEB menjadi semakin matang dan memiliki lebih banyak fungsi. Banyak di antaranya yang bersifat open source, dan AWStats adalah salah satu yang terbaik.
Petunjuk instalasi singkat adalah sebagai berikut:
Memasang
http://sourceforge.net/projects/awstats/ Setelah mengunduh paket instalasi:
GNU/Linux: tar zxf awstats-version.tgz
Secara default, skrip dan file statis awstats berada di direktori wwwroot: sebarkan semua file di direktori cgi-bin ke direktori cgi-bin/: /home/Apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/Apache/cgi-bin/awstats
Salin ikon dan direktori file lainnya ke direktori penerbitan file HTML WEB, misalnya: /home/apache/htdocs/ dan publikasikan
Skrip pembaruan batch lainnya ada di direktori alat dan dapat ditempatkan di direktori cgi-bin/awstats/.
Tingkatkan definisi mesin pencari dan spider domestik utama, dan instal perpustakaan aplikasi GeoIP: C
http://www.maxmind.com/download/geoip/api/c/ Buka paket, kompilasi, dan instal
perl -MCPAN -e 'install "Geo::IP"' atau gunakan paket Perl murni perl -MCPAN -e 'install "Geo::IP::PurePerl"'
Unduh paket GeoIP/GeoIPCityLite: buka kemasannya dan sebarkan ke direktori awstats
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
Konfigurasi
Beri nama default awstats.model.conf ke common.conf
Ubah beberapa opsi konfigurasi berikut:
LoadPlugin="kunci decodeutf"
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
Buat direktori data di bawah awstats untuk keluaran data statistik
Siapkan file konfigurasi sesuai dengan contoh berikut:
Sertakan "umum.conf"
LogFile="/home/Apache/logs/access_log.%YYYY-24%MM-24%DD-24"
DomainSitus="www.chedong.com"
HostAliases="chedong.com"
File Default = "indeks.html"
DirData="/home/apache/cgi-bin/awstats/data/"
Ringkasan konten: Pengenalan penggunaan AWStats dan beberapa petunjuk peningkatan konfigurasi. Sangat menyenangkan melihat bahwa dimulai dengan AWStats versi 6.3: Pengguna Cina pada dasarnya hanya perlu mengaktifkan LoadPlugin="decodeutfkeys" di file konfigurasi. Pada dasarnya, tidak akan ada masalah statistik dengan mesin pencari Cina. Saat ini, # Mesin pencari Cina kecil ' baidu .com', 'search.sina.com', 'search.sohu.com', ketiga mesin pencari ini. Berisi tambalan untuk mesin pencari domestik utama dan definisi laba-laba (cukup timpa direktori program asli di direktori lib setelah membongkar)
[Potong Halaman]
Sistem statistik log memainkan peran penting dalam analisis perilaku pengguna situs, terutama untuk statistik akses kata kunci dari mesin pencari: ini adalah sumber data analisis perilaku pengguna yang sangat efektif. Dengan perkembangan Internet selama bertahun-tahun, alat statistik log WEB menjadi semakin matang dan memiliki lebih banyak fungsi. Banyak di antaranya yang bersifat open source, dan AWStats adalah salah satu yang terbaik.
AWStats: Statistik Web Tingkat Lanjut
AWStats adalah alat analisis log WEB berbasis Perl yang dikembangkan dengan cepat di Sourceforge. Dibandingkan dengan Webalizer, alat analisis log sumber terbuka luar biasa lainnya, AWStats memiliki keunggulan sebagai berikut:
Antarmuka yang ramah: Anda dapat langsung memanggil antarmuka bahasa yang sesuai sesuai dengan browser (tersedia versi Cina yang disederhanakan)
Contoh keluaran referensi: http://www.chedong.com/cgi-bin/awstats/awstats.pl? config=chedong
Berdasarkan Perl: dan menyelesaikan masalah lintas platform dengan sangat baik. Sistem itu sendiri dapat berjalan di GNU/Linux atau Windows (setelah ActivePerl diinstal); log yang dianalisis secara langsung mendukung format Apache (gabungan) dan format IIS (perlu dimodifikasi ). Meskipun Webalizer juga memiliki versi platform Windows, saat ini kurang pemeliharaan;
AWStats sepenuhnya dapat menggunakan satu sistem untuk melengkapi statistik terpadu pada server WEB berbeda di situs Anda: server GNU/Linux/Apache dan Windows/IIS.
Efisiensi yang relatif tinggi: Item statistik keluaran AWStats jauh lebih kaya daripada Webalizer, dan kecepatannya masih dapat mencapai sekitar 1/3 Webalizer untuk situs dengan jutaan kunjungan setiap hari, kecepatan ini cukup;
Konfigurasi/kustomisasi yang mudah: Sistem menyediakan aturan konfigurasi default yang cukup fleksibel namun masuk akal. Tidak lebih dari 3 atau 4 konfigurasi default perlu dimodifikasi untuk mulai berjalan, dan ada beberapa plug-in yang dapat dimodifikasi dan diperluas;
Perancang AWStats dirancang untuk "Kunjungan Manusia" yang tepat, sehingga banyak kunjungan robot mesin pencari disaring, sehingga jumlahnya mungkin lebih rendah daripada alat statistik log lainnya. Kunjungan dari dalam perusahaan juga dapat diteruskan melalui pengaturan penyaringan IP .
Menyediakan banyak fungsi statistik parameter yang diperluas: menggunakan konfigurasi seri ExtraXXXX untuk menghasilkan analisis parameter khusus aplikasi akan sangat berguna untuk analisis produk.
Untuk perbandingan lebih lanjut dengan alat lain: Webalizer, analog, silakan merujuk ke:
http://awstats.sourceforge.net/#COMPARISON
[Potong Halaman]
Pengingat instalasi AWStats
Mode pengoperasian AWStats adalah sebagai berikut:
Analisis log: Setelah dijalankan, arsipkan hasil statistik log tersebut ke dalam database AWStats (teks biasa);
Lalu ada keluarannya: dalam dua bentuk
Salah satunya adalah membaca keluaran database hasil statistik melalui program cgi;
Salah satunya adalah menjalankan skrip latar belakang untuk mengekspor hasilnya ke file statis;
Berikut ini adalah 2 contoh statistik log untuk satu situs:
Salah satunya adalah output melalui CGI di GNU/Linux,
Salah satunya didasarkan pada ekspor halaman statis pada Windows 2000
Unduh/instal
http://sourceforge.net/projects/awstats/ Setelah mengunduh paket instalasi:
GNU/Linux: tar zxf awstats-version.tgz
Skrip dan file statis awstats berada di direktori wwwroot secara default: terapkan program awstats.pl di direktori cgi-bin ke /home/apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/Apache/cgi-bin/awstats
#Salin ikon dan direktori file lainnya ke direktori penerbitan file HTML WEB: /home/apache/htdocs/ dan publikasikan di bawah
Skrip pembaruan batch lainnya ada di direktori alat dan dapat ditempatkan bersama di direktori cgi-bin/awstats/.
Windows 2000: Jalankan dalam mode skrip latar belakang, buka paket secara langsung, lalu pindah ke direktori D:AWStats
Salin direktori ikon ke direktori rilis IIS: inetpub/icon
[Potong Halaman]
Format log sumber data dan aturan pemotongan berdasarkan hari
Untuk Apache: Format log mudah diatur: cukup atur ke format gabungan. Pemotongan log sedikit lebih merepotkan: Anda perlu menginstal alat kronolog dan mengatur log agar dipotong berdasarkan hari:
CustomLog "|/usr/local/sbin/cronolog /path/to/apache/logs/access_log.%Y%m%d" digabungkan
Misalnya: logs/access_log.20030326
Log dalam format terkompresi, Anda dapat menggunakan gzip -d < /home/apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | untuk mendekompresi statistik secara dinamis.
Untuk IIS: Secara default, ada aturan pemotongan log yang lebih baik setiap harinya, namun format log IIS tidak cocok untuk statistik AWStats.
Oleh karena itu yang terbaik adalah menghapus semua bidang log dan mengaturnya secara ketat sesuai dengan daftar berikut
Tanggal tanggal
waktu waktu
C-ip alamat IP pelanggan
Nama penggunacs-nama pengguna
metode-metode
Sumber daya URI cs-uri-stem
Status protokol sc-status
Jumlah byte yang dikirim sc-byte
Versi protokol versi cs
Agen pengguna cs (Agen-Pengguna)
Referensi (Referensi)
Dibandingkan dengan pengaturan default IIS:
Pengurangan tersebut antara lain:
Alamat IP server
Pelabuhan server
Kueri URI
Ditambahkan adalah:
jumlah byte yang dikirim
Versi protokol
Referensi
Aturan penamaan untuk file konfigurasi: awstats.sitename.conf
Program utama AWStats, awstats.pl, akan secara otomatis memanggil file konfigurasi situs terkait sesuai dengan nama situs: awstats.sitename.conf
Misalnya: menjalankan ./awstats.pl -config=chedong memanggil file konfigurasi awstats.chedong.conf di direktori yang sama;
Jika -config tidak ditentukan, awstats.conf atau /etc/awstats.conf di direktori saat ini juga akan ditemukan sebagai file konfigurasi default.
Jadi yang terbaik adalah mengganti nama default awstats.model.conf menjadi awstats.yoursite.conf misalnya: awstats.chedong.conf,
Untuk statistik di beberapa situs, fungsi penyertaan file konfigurasi AWStats masih sangat berguna. Kita dapat meletakkan konfigurasi umum dalam satu dokumen, dan kemudian menggunakan konfigurasi Sertakan (didukung setelah versi 5.4) untuk menyertakan konfigurasi umum di setiap file konfigurasi tertentu. .header, lalu gunakan konfigurasi lain untuk mengganti properti terkait dalam konfigurasi umum, seperti:
Sertakan = "umum.conf"
LogFile="/path/ke/bbs/access_log"
Nama Situs="bbs.chedong.com"
Modifikasi file konfigurasi minimal: LogFile SiteDomain LogFormat
Untuk menghitung log Apache di GNU/Linux, cukup ubah dua opsi berikut: LogFile SiteDomain
GNU/Linux LogFile="/path/ke/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
File Log Windows 2000="d:iis_logsW3SV3ex%YY-24%MM-24%DD-24.log"
Konfigurasi ini berarti nama file log yang dijabarkan dengan tahun, bulan, dan tanggal 24 jam yang lalu;
DomainSitus="www.chedong.com"
Nama situs, yang secara default kosong. Jika kosong, AWStats akan menolak untuk dijalankan;
Untuk log statistik IIS, diperlukan satu modifikasi lagi:
Format Log=2
Nilai defaultnya adalah 1: log Apache, 2 adalah log IIS
[Potong Halaman]
Hal lain yang perlu diperhatikan:
AWStats tidak memfilter file swf secara default dan akan menghitung .swf sebagai PageView, jadi jika file swf di situs sebagian besar berisi iklan, yang terbaik adalah memfilternya:
Analisis log
./awstats.pl -update -config=nama situs -lang=cn
Misalnya: ./awstats.pl -update -config=chedong
File konfigurasi awstats.chedong.conf akan dipanggil secara otomatis.
Keluaran statistik
GNU/Linux http://localhost/cgi-bin/awstats/awstats.pl? config=chedong
Windows 2000 http://localhost/awstats/awstats.chedong.html
Statistik log berjalan secara otomatis
Di GNU/Linux: crontab -e: dijalankan setiap hari pada jam 8:10
#updateawstats
10 8 * * * (cd /path/to/apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
Pada Windows 2000: Ditetapkan untuk berjalan pada 8:10 setiap hari
D:Perlbinperl.exe d:AWStatstoolsawstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:inetpubawstats -awstatsprog=d:awstatswwwroot cgi-binawstats.pl
Statistik log multi-situs
AWStats dilengkapi dengan alat pemrosesan batch: tools/awstats_updateall.pl, yang dapat melintasi semua file konfigurasi dalam direktori dalam batch dan menjalankan statistik. Oleh karena itu, pekerjaan yang tersisa terutama mengenai sinkronisasi log.
Untuk beberapa situs, banyak opsi konfigurasi yang diulang. Jika setiap file konfigurasi diubah dan dipelihara, akan sangat merepotkan. AWStats telah menyediakan fungsi yang disertakan dalam file konfigurasi sejak versi 5.4, sehingga kita dapat mengonfigurasi konfigurasi umum, seperti: umum. konf
Kemudian konfigurasi situs lain diatur ke: Anda dapat menggunakan opsi berikut untuk mengganti konfigurasi yang tidak sesuai dengan default.
awstats.bbs.chedong.conf
Sertakan "chedong.common.conf"
File Log "/path/ke/bbs_log"
Nama Situs "bbs.chedong.com"
awstats.www.chedong.conf
Sertakan "chedong.common.conf"
File Log "/path/ke/www_log"
Nama Situs "www.chedong.com"
HostAliases="chedong.com"
Deskripsi indikator statistik
Pengunjung: Statistik berdasarkan alamat IP unik pengunjung, satu IP mewakili satu pengunjung;
Jumlah kunjungan: Seorang pengunjung boleh berkunjung beberapa kali dalam satu hari (contoh: pagi sekali, sore sekali), sehingga jumlah kunjungan pengunjung dihitung berdasarkan jumlah IP unik dalam kurun waktu tertentu. waktu (misalnya: 1 jam);
Jumlah halaman web: Jumlah total kunjungan halaman murni tidak termasuk gambar, CSS, file JavaScript, dll., namun jika halaman menggunakan beberapa frame, setiap frame dihitung sebagai permintaan halaman;
Jumlah file: Jumlah total permintaan file dari klien browser, termasuk gambar, CSS, JavaScript, dll. Pengguna meminta suatu halaman. Jika halaman berisi gambar, dll., beberapa permintaan file akan dibuat ke server jumlah file umumnya jauh lebih besar daripada jumlah file;
Bytes: jumlah total data yang dikirimkan ke klien;
Data dari REFERER: Bidang referensi (REFERER) di log mencatat alamat sebelum mengakses halaman web terkait. Oleh karena itu, jika pengguna mengklik untuk masuk ke situs web melalui hasil pencarian mesin pencari, akan ada permintaan pengguna di halaman tersebut. mesin pencari yang sesuai di log, dari alamat ini, kata kunci yang digunakan dalam permintaan pengguna dapat diekstraksi melalui parsing:
Misalnya:
26-03-2003 15:43:58 123.123.123.123 - DAPATKAN /index.html 200 192 HTTP/1.1 Mozilla/4.0+(kompatibel; +MSIE+5.01; +Windows+NT+5.0) http://www.google .com/pencarian? q=chedong
AWStats memiliki fungsi yang relatif lengkap dalam frasa kunci mesin pencari dan statistik kata kunci: dapat mengidentifikasi lebih dari 300 perayap mesin di seluruh dunia, dan dapat mengidentifikasi sebagian besar mesin pencari internasional utama dan mesin pencari bahasa lokal di banyak wilayah.
[Potong Halaman]
Meretas AWStats
Instalasi plug-in berdasarkan informasi geografis:
GeoIP dan Geo::IPfree (awstats 5.5+)
Baik GeoIP maupun Geo::IPfree adalah tabel pemetaan negara/IP gratis, yang lebih akurat dan lebih cepat dibandingkan statistik yang diperoleh melalui resolusi nama domain balik DNS. API GeoIP gratis, perpustakaan defaultnya gratis, dan layanan pembaruan datanya dikenakan biaya. Tidak hanya kode Geo::IPfree yang bersifat publik, namun data perpustakaannya juga bersifat publik.
Instalasi GeoIP:
Download C Library terlebih dahulu: GeoIP C setelah di unpack
%./konfigurasi;
#buat instalasi
Kemudian unduh perpustakaan Perl: GeoIP Perl setelah membongkar
%perl MakeFile.PL;
#buat instalasi
Geo :: IP instalasi gratis:
Setelah mengunduh Geo::IPfree dan membongkarnya
%perl Makefile
%membuat
#buat instalasi
Konfigurasi: Dengan mengaktifkan plug-in terkait GEOIP di file konfigurasi:
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
MaxMind saat ini menyediakan paket data GeoIP dan GeoIPCityLite secara gratis: dapat diunduh secara rutin setiap bulan dari alamat berikut
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
[Potong Halaman]Sistem statistik log memainkan peran penting dalam analisis perilaku pengguna situs, terutama untuk statistik akses kata kunci dari mesin pencari: ini adalah sumber data analisis perilaku pengguna yang sangat efektif. Dengan perkembangan Internet selama bertahun-tahun, alat statistik log WEB menjadi semakin matang dan memiliki lebih banyak fungsi. Banyak di antaranya yang bersifat open source, dan AWStats adalah salah satu yang terbaik.
AWStats: Statistik Web Tingkat Lanjut
AWStats adalah alat analisis log WEB berbasis Perl yang dikembangkan dengan cepat di Sourceforge. Dibandingkan dengan Webalizer, alat analisis log sumber terbuka luar biasa lainnya, AWStats memiliki keunggulan sebagai berikut:
Antarmuka yang ramah: Anda dapat langsung memanggil antarmuka bahasa yang sesuai sesuai dengan browser (tersedia versi Cina yang disederhanakan)
Contoh keluaran referensi: http://www.chedong.com/cgi-bin/awstats/awstats.pl? config=chedong
Berdasarkan Perl: dan menyelesaikan masalah lintas platform dengan sangat baik. Sistem itu sendiri dapat berjalan di GNU/Linux atau Windows (setelah ActivePerl diinstal); log yang dianalisis secara langsung mendukung format Apache (gabungan) dan format IIS (perlu dimodifikasi ). Meskipun Webalizer juga memiliki versi platform Windows, saat ini kurang pemeliharaan;
AWStats sepenuhnya dapat menggunakan satu sistem untuk melengkapi statistik terpadu pada server WEB berbeda di situs Anda: server GNU/Linux/Apache dan Windows/IIS.
Efisiensi yang relatif tinggi: Item statistik keluaran AWStats jauh lebih kaya daripada Webalizer, dan kecepatannya masih dapat mencapai sekitar 1/3 Webalizer untuk situs dengan jutaan kunjungan setiap hari, kecepatan ini cukup;
Konfigurasi/kustomisasi yang mudah: Sistem menyediakan aturan konfigurasi default yang cukup fleksibel namun masuk akal. Tidak lebih dari 3 atau 4 konfigurasi default perlu dimodifikasi untuk mulai berjalan, dan ada beberapa plug-in yang dapat dimodifikasi dan diperluas;
Perancang AWStats dirancang untuk "Kunjungan Manusia" yang tepat, sehingga banyak kunjungan robot mesin pencari disaring, sehingga jumlahnya mungkin lebih rendah daripada alat statistik log lainnya. Kunjungan dari dalam perusahaan juga dapat diteruskan melalui pengaturan penyaringan IP .
Menyediakan banyak fungsi statistik parameter yang diperluas: menggunakan konfigurasi seri ExtraXXXX untuk menghasilkan analisis parameter khusus aplikasi akan sangat berguna untuk analisis produk.
Untuk perbandingan lebih lanjut dengan alat lain: Webalizer, analog, silakan merujuk ke:
http://awstats.sourceforge.net/#COMPARISON