يلعب نظام إحصائيات السجل دورًا مهمًا في تحليل سلوك المستخدم للموقع، خاصة بالنسبة لإحصائيات الوصول إلى الكلمات الرئيسية من محركات البحث: فهو مصدر فعال للغاية لبيانات تحليل سلوك المستخدم. مع تطور الإنترنت على مر السنين، أصبحت أدوات إحصائيات سجل الويب أكثر نضجًا ولديها المزيد والمزيد من الوظائف. العديد منها مفتوحة المصدر، وAWStats هي واحدة من أفضلها.
تعليمات التثبيت الموجزة هي كما يلي:
ثَبَّتَ
http://sourceforge.net/projects/awstats/ بعد تنزيل حزمة التثبيت:
جنو/لينكس: tar zxf awstats-version.tgz
بشكل افتراضي، البرامج النصية والملفات الثابتة الخاصة بـ awstats موجودة في دليل wwwroot: قم بنشر جميع الملفات الموجودة في دليل cgi-bin إلى دليل cgi-bin/: /home/Apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/Apache/cgi-bin/awstats
انسخ الأيقونة وأدلة الملفات الأخرى إلى دليل نشر ملفات WEB HTML، على سبيل المثال: /home/Apache/htdocs/ وانشرها
يوجد المزيد من البرامج النصية للتحديث الدفعي في دليل الأدوات ويمكن وضعها في دليل cgi-bin/awstats/.
ترقية تعريفات محركات البحث والعناكب المحلية الرئيسية، وتثبيت مكتبة تطبيقات GeoIP: C
http://www.maxmind.com/download/geoip/api/c/ فك وتجميع وتثبيت
Perl -MCPAN -e 'install "Geo::IP"' أو استخدم حزمة Perl النقية perl -MCPAN -e 'install "Geo::IP::PurePerl"'
قم بتنزيل حزمة GeoIP/GeoIPCityLite: قم بفك الحزم ونشرها في دليل awstats
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
إعدادات
قم بتسمية awstats.model.conf الافتراضي بـ common.conf
قم بتعديل بعض خيارات التكوين هذه:
LoadPlugin = "مفاتيح فك التشفير"
LoadPlugin="geoip GEOIP_STANDARD /home/Apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/Apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
قم بإنشاء دليل البيانات ضمن awstats لإخراج البيانات الإحصائية
قم بإعداد ملف التكوين حسب المثال التالي:
تضمين "common.conf"
ملف السجل = "/home/Apache/logs/access_log.%YYYY-24%MM-24%DD-24"
نطاق الموقع = "www.chedong.com"
الأسماء المستعارة للمضيف = "chedong.com"
الملف الافتراضي = "index.html"
DirData = "/home/Apache/cgi-bin/awstats/data/"
ملخص المحتوى: مقدمة لاستخدام AWStats وبعض تعليمات تحسين التكوين. من الرائع أن نرى أنه بدءًا من الإصدار 6.3 من AWStats: يحتاج المستخدمون الصينيون بشكل أساسي فقط إلى تمكين LoadPlugin = "decodeutfkeys" في ملف التكوين. في الأساس، لن تكون هناك مشكلات إحصائية مع محركات البحث الصينية حاليًا، # محركات البحث الصينية الصغيرة .com'، 'search.sina.com'، 'search.sohu.com'، محركات البحث الثلاثة هذه. يحتوي على تصحيحات لمحركات البحث المحلية الكبرى وتعريفات العنكبوت (فقط قم بالكتابة فوق دليل البرنامج الأصلي في دليل lib بعد التفريغ)
[قص الصفحة]
يلعب نظام إحصائيات السجل دورًا مهمًا في تحليل سلوك المستخدم للموقع، خاصة بالنسبة لإحصائيات الوصول إلى الكلمات الرئيسية من محركات البحث: فهو مصدر فعال للغاية لبيانات تحليل سلوك المستخدم. مع تطور الإنترنت على مر السنين، أصبحت أدوات إحصائيات سجل الويب أكثر نضجًا ولديها المزيد والمزيد من الوظائف. العديد منها مفتوحة المصدر، وAWStats هي واحدة من أفضلها.
AWStats: إحصائيات الويب المتقدمة
AWStats هي أداة لتحليل سجل الويب مبنية على لغة Perl وتم تطويرها بسرعة على Sourceforge. بالمقارنة مع Webalizer، وهي أداة ممتازة أخرى لتحليل السجلات مفتوحة المصدر، تتمتع AWStats بالمزايا التالية:
واجهة سهلة الاستخدام: يمكنك الاتصال مباشرة بواجهة اللغة المقابلة وفقًا للمتصفح (تتوفر نسخة صينية مبسطة)
عينة الإخراج المرجعية: http://www.chedong.com/cgi-bin/awstats/awstats.pl؟ config=chedong
استنادًا إلى Perl: ويحل مشكلة الأنظمة الأساسية بشكل جيد للغاية. يمكن للنظام نفسه أن يعمل على GNU/Linux أو Windows (بعد تثبيت ActivePerl)؛ تدعم السجلات التي تم تحليلها تنسيق Apache (مدمجًا) وتنسيق IIS مباشرةً ). على الرغم من أن Webalizer لديه أيضًا إصدار نظام التشغيل Windows، إلا أنه يفتقر حاليًا إلى الصيانة؛
يمكن لـ AWStats استخدام نظام واحد بالكامل لإكمال الإحصائيات الموحدة على خوادم ويب مختلفة لموقعك: خوادم GNU/Linux/Apache وWindows/IIS.
كفاءة عالية نسبيًا: تعد عناصر إحصائيات مخرجات AWStats أكثر ثراءً من Webalizer، ولا يزال من الممكن أن تصل السرعة إلى حوالي 1/3 من Webalizer بالنسبة لموقع به ملايين الزيارات اليومية، فإن هذه السرعة كافية؛
التكوين/التخصيص المريح: يوفر النظام قواعد تكوين افتراضية مرنة بما فيه الكفاية ولكن معقولة، ولا يلزم تعديل أكثر من 3 أو 4 تكوينات افتراضية لبدء التشغيل، وهناك عدد لا بأس به من المكونات الإضافية التي يمكن تعديلها وتوسيعها؛
تم تصميم مصممي AWStats "للزيارات البشرية" الدقيقة، لذلك تتم تصفية العديد من زيارات روبوت محرك البحث، لذلك قد تكون الأرقام أقل من أدوات إحصائيات السجل الأخرى ويمكن أيضًا تمرير الزيارات من داخل الشركة من خلال تصفية إعدادات تصفية IP .
يوفر العديد من وظائف إحصائيات المعلمات الموسعة: سيكون استخدام تكوين سلسلة ExtraXXXX لإنشاء تحليل المعلمات الخاص بالتطبيق مفيدًا جدًا لتحليل المنتج.
لمزيد من المقارنات مع الأدوات الأخرى: Webalizer، التناظرية، يرجى الرجوع إلى:
http://awstats.sourceforge.net/#COMPARISON
[قص الصفحة]
تذكير بتثبيت AWStats
وضع التشغيل لـ AWStats هو كما يلي:
تحليل السجلات: بعد التشغيل، قم بأرشفة النتائج الإحصائية للسجل في قاعدة بيانات AWStats (نص عادي)؛
ثم هناك الإخراج: على شكلين
الأول هو قراءة مخرجات قاعدة بيانات النتائج الإحصائية من خلال برنامج cgi؛
أحدهما هو تشغيل برنامج نصي في الخلفية لتصدير الإخراج إلى ملف ثابت؛
فيما يلي مثالان لإحصائيات السجل لموقع واحد:
أحدهما هو الإخراج من خلال CGI على نظام GNU/Linux،
يعتمد أحدهما على تصدير الصفحة الثابتة في نظام التشغيل Windows 2000
تنزيل/تثبيت
http://sourceforge.net/projects/awstats/ بعد تنزيل حزمة التثبيت:
جنو/لينكس: tar zxf awstats-version.tgz
البرامج النصية والملفات الثابتة الخاصة بـ awstats موجودة في دليل wwwroot افتراضيًا: قم بنشر برنامج awstats.pl في دليل cgi-bin إلى /home/Apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/Apache/cgi-bin/awstats
# انسخ الرمز وأدلة الملفات الأخرى إلى دليل نشر ملف WEB HTML: /home/Apache/htdocs/ وانشرها تحت
يوجد المزيد من البرامج النصية للتحديث الدفعي في دليل الأدوات ويمكن وضعها معًا في دليل cgi-bin/awstats/.
Windows 2000: قم بالتشغيل في وضع البرنامج النصي في الخلفية، وقم بفك الحزم مباشرة، ثم انتقل إلى الدليل D:AWStats
انسخ دليل الرمز إلى دليل إصدار IIS: inetpub/icon
[قص الصفحة]
تنسيق سجل مصدر البيانات وقواعد الاقتطاع حسب اليوم
بالنسبة لـ Apache: من السهل ضبط تنسيق السجل: ما عليك سوى تعيينه على التنسيق المدمج. يعد اقتطاع السجل أكثر إزعاجًا: تحتاج إلى تثبيت أداة cronolog وتعيين السجل ليتم اقتطاعه يوميًا:
CustomLog "|/usr/local/sbin/cronolog /path/to/Apache/logs/access_log.%Y%m%d" مدمج
على سبيل المثال: logs/access_log.20030326
السجل بتنسيق مضغوط، يمكنك استخدام gzip -d < /home/Apache/logs/access_log.%YYYY-24%MM-24%DD-24.gz | لفك ضغط الإحصائيات ديناميكيًا.
بالنسبة لـ IIS: بشكل افتراضي، توجد قواعد أفضل لاقتطاع السجل يوميًا، ولكن تنسيق سجل IIS غير مناسب لإحصائيات AWStats.
ولذلك فمن الأفضل إزالة كافة حقول السجل ببساطة وتعيينها بدقة وفقًا للقائمة التالية
تاريخ التاريخ
وقت الوقت
عنوان IP الخاص بالعميل c-ip
اسم المستخدم-اسم المستخدم
طريقة-methodc
مورد URI cs-uri-stem
حالة البروتوكول sc-status
عدد البايتات المرسلة sc-bytes
إصدار البروتوكول cs-version
وكيل المستخدم CS (وكيل المستخدم)
المراجع(المرجع)
مقارنة بإعدادات IIS الافتراضية:
وتشمل التخفيضات ما يلي:
عنوان IP للخادم
منفذ الخادم
استعلام URI
المضافة هي:
عدد البايتات المرسلة
نسخة البروتوكول
مرجع
قواعد التسمية لملفات التكوين: awstats.sitename.conf
سيقوم البرنامج الرئيسي لـ AWStats، awstats.pl، تلقائيًا باستدعاء ملف التكوين الخاص بالموقع المقابل وفقًا لاسم الموقع: awstats.sitename.conf
على سبيل المثال: تشغيل ./awstats.pl -config=chedong يستدعي ملف التكوين awstats.chedong.conf في نفس الدليل؛
إذا لم يتم تحديد -config، فسيتم أيضًا العثور على awstats.conf أو /etc/awstats.conf في الدليل الحالي كملف التكوين الافتراضي.
لذلك من الأفضل إعادة تسمية awstats.model.conf الافتراضي إلى awstats.yoursite.conf، على سبيل المثال: awstats.chedong.conf،
بالنسبة للإحصائيات على مواقع متعددة، لا تزال وظيفة تضمين ملف التكوين في AWStats مفيدة جدًا. يمكننا وضع التكوين المشترك في مستند واحد، ثم استخدام تكوين التضمين (المدعوم بعد الإصدار 5.4) لتضمين التكوين المشترك في كل ملف تكوين محدد. header، ثم استخدم تكوينات أخرى لتجاوز الخصائص المقابلة في التكوين العام، مثل:
تضمين = "common.conf"
ملف السجل = "/path/to/bbs/access_log"
اسم الموقع = "bbs.chedong.com"
الحد الأدنى من تعديل ملف التكوين: LogFile SiteDomain LogFormat
لحساب سجلات Apache على GNU/Linux، ما عليك سوى تعديل هذين الخيارين: LogFile SiteDomain
GNU/Linux LogFile = "/path/to/Apache/logs/access_log.%YYYY-24%MM-24%DD-24"
ملف سجل Windows 2000 = "d:iis_logsW3SV3ex%YY-24%MM-24%DD-24.log"
يعني هذا التكوين أن اسم ملف السجل مكتوب بالسنة والشهر والتاريخ قبل 24 ساعة؛
نطاق الموقع = "www.chedong.com"
اسم الموقع، الذي يكون فارغًا بشكل افتراضي، إذا كان فارغًا، فسوف يرفض AWStats التشغيل؛
بالنسبة لسجلات IIS الإحصائية، يلزم إجراء تعديل آخر:
تنسيق السجل = 2
القيمة الافتراضية هي 1: سجل Apache، 2 هي سجل IIS
[قص الصفحة]
أشياء أخرى يجب ملاحظتها:
لا يقوم AWStats بتصفية ملفات swf بشكل افتراضي وسيحسب .swf كعرض صفحة، لذلك إذا كانت ملفات swf الموجودة على الموقع عبارة عن إعلانات بشكل أساسي، فمن الأفضل تصفيتها:
تحليل السجل
./awstats.pl -update -config=sitename -lang=cn
على سبيل المثال: ./awstats.pl -update -config=chedong
سيتم استدعاء ملف التكوين awstats.chedong.conf تلقائيًا.
المخرجات الإحصائية
جنو/لينكس http://localhost/cgi-bin/awstats/awstats.pl? config=chedong
ويندوز 2000 http://localhost/awstats/awstats.chedong.html
يتم تشغيل إحصائيات السجل تلقائيًا
على نظام GNU/Linux: crontab -e: يتم تشغيله كل يوم في الساعة 8:10
#updateawstats
10 8 * * * (cd /path/to/Apache/cgi-bin/awstats/; ./awstats.pl -update -config=chedong)
في نظام التشغيل Windows 2000: اضبط التشغيل عند الساعة 8:10 يوميًا
D:Perlbinperl.exe d:AWStatstoolsawstats_buildstaticpages.pl -update -config=chedong -lang=cn -dir=c:inetpubawstats -awstatsprog=d:awstatswwwroot cgi-binawstats.pl
إحصائيات السجل متعدد المواقع
يأتي AWStats مزودًا بأداة معالجة مجمعة: Tools/awstats_updateall.pl، والتي يمكنها اجتياز جميع ملفات التكوين في الدليل على دفعات وتشغيل الإحصائيات. ولذلك، فإن العمل المتبقي يتعلق بشكل أساسي بمزامنة السجل.
بالنسبة لمواقع متعددة، يتم تكرار العديد من خيارات التكوين، إذا تم تعديل كل ملف تكوين وصيانته، فسيكون الأمر مزعجًا للغاية. وقد وفرت AWStats الوظائف المضمنة في ملفات التكوين منذ الإصدار 5.4، حتى نتمكن من تكوين تكوين مشترك، مثل: common. conf
ثم يتم تعيين تكوين المواقع الأخرى على: يمكنك استخدام الخيارات التالية لتجاوز التكوين غير المتوافق مع الإعداد الافتراضي.
awstats.bbs.chedong.conf
تضمين "chedong.common.conf"
ملف السجل "/ المسار/إلى/bbs_log"
اسم الموقع "bbs.chedong.com"
awstats.www.chedong.conf
تضمين "chedong.common.conf"
ملف السجل "/ المسار/إلى/www_log"
اسم الموقع "www.chedong.com"
الأسماء المستعارة للمضيف = "chedong.com"
وصف المؤشرات الإحصائية
الزوار: تعتمد الإحصائيات على عناوين IP الفريدة للزوار، حيث يمثل عنوان IP الواحد زائرًا واحدًا؛
عدد الزيارات: قد يقوم الزائر بالزيارة عدة مرات في اليوم الواحد (على سبيل المثال: مرة في الصباح، مرة بعد الظهر)، لذلك يتم حساب عدد زيارات الزائر بناءً على عدد عناوين IP الفريدة خلال فترة معينة من الوقت (على سبيل المثال: ساعة واحدة)؛
عدد صفحات الويب: إجمالي عدد زيارات الصفحة الخالصة باستثناء الصور وملفات CSS وملفات JavaScript وما إلى ذلك، ولكن إذا كانت الصفحة تستخدم إطارات متعددة، فسيتم احتساب كل إطار كطلب صفحة؛
عدد الملفات: إجمالي عدد طلبات الملفات من عميل المتصفح، بما في ذلك الصور وCSS وجافا سكريبت وما إلى ذلك. يطلب المستخدم صفحة إذا كانت الصفحة تحتوي على صور وما إلى ذلك، فسيتم تقديم طلبات ملفات متعددة إلى الخادم عدد الملفات بشكل عام أكبر بكثير من عدد الملفات.
البايتات: إجمالي كمية البيانات المرسلة إلى العميل؛
البيانات من المُحيل: يسجل حقل المرجع (المُحيل) في السجل العنوان قبل الوصول إلى صفحة الويب المقابلة، لذلك، إذا قام المستخدم بالنقر للدخول إلى موقع الويب من خلال نتائج البحث الخاصة بمحرك البحث، فسيكون هناك استعلام المستخدم في مربع البحث. محرك البحث المقابل في عنوان السجل، من هذا العنوان، يمكن استخراج الكلمات الرئيسية المستخدمة في استعلامات المستخدم من خلال التحليل:
على سبيل المثال:
2003-03-26 15:43:58 123.123.123.123 - GET /index.html 200 192 HTTP/1.1 Mozilla/4.0+(compatible; +MSIE+5.01; +Windows+NT+5.0) http://www.google .com/search؟ س=chedong
تتمتع AWStats بوظائف كاملة نسبيًا في العبارات الرئيسية لمحركات البحث وإحصائيات الكلمات الرئيسية: يمكنها تحديد أكثر من 300 زاحف آلي حول العالم، ويمكنها تحديد معظم محركات البحث الدولية السائدة ومحركات البحث باللغة المحلية في العديد من المناطق.
[قص الصفحة]
اختراق AWStats
تثبيت البرنامج الإضافي بناءً على المعلومات الجغرافية:
GeoIP وGeo::IPfree (awstats 5.5+)
يعد كل من GeoIP وGeo::IPfree جداول تعيين البلد/IP المجانية، وهي أكثر دقة وأسرع من الإحصائيات التي تم الحصول عليها عن طريق تحليل اسم المجال العكسي لنظام DNS. واجهات برمجة تطبيقات GeoIP مجانية، والمكتبة الافتراضية مجانية، وخدمة تحديث البيانات الخاصة بها مدفوعة. ليس كود Geo::IPfree عامًا فحسب، بل إن بيانات المكتبة عامة أيضًا.
تثبيت GeoIP:
قم بتنزيل مكتبة C أولاً: GeoIP C بعد التفريغ
%./تكوين؛
#قم بالتثبيت
ثم قم بتنزيل مكتبة Perl: GeoIP Perl بعد التفريغ
% بيرل MakeFile.PL;
#قم بالتثبيت
الموقع الجغرافي::تثبيت مجاني IP:
بعد تنزيل Geo::IPfree وتفريغه
%ملف تكوين بيرل
٪يصنع
#قم بالتثبيت
التكوين: من خلال تمكين المكونات الإضافية ذات الصلة بـ GEOIP في ملف التكوين:
LoadPlugin="geoip GEOIP_STANDARD /home/Apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/Apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
يوفر MaxMind حاليًا حزم بيانات GeoIP وGeoIPCityLite مجانًا: يمكن تنزيلها بانتظام كل شهر من العنوان التالي
http://www.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
http://www.maxmind.com/download/geoip/database/GeoIP.dat.gz
[قص الصفحة]يلعب نظام إحصائيات السجل دورًا مهمًا في تحليل سلوك المستخدم للموقع، خاصة بالنسبة لإحصائيات الوصول إلى الكلمات الرئيسية من محركات البحث: فهو مصدر فعال للغاية لبيانات تحليل سلوك المستخدم. مع تطور الإنترنت على مر السنين، أصبحت أدوات إحصائيات سجل الويب أكثر نضجًا ولديها المزيد والمزيد من الوظائف. العديد منها مفتوحة المصدر، وAWStats هي واحدة من أفضلها.
AWStats: إحصائيات الويب المتقدمة
AWStats هي أداة لتحليل سجل الويب مبنية على لغة Perl وتم تطويرها بسرعة على Sourceforge. بالمقارنة مع Webalizer، وهي أداة ممتازة أخرى لتحليل السجلات مفتوحة المصدر، تتمتع AWStats بالمزايا التالية:
واجهة سهلة الاستخدام: يمكنك الاتصال مباشرة بواجهة اللغة المقابلة وفقًا للمتصفح (تتوفر نسخة صينية مبسطة)
عينة الإخراج المرجعية: http://www.chedong.com/cgi-bin/awstats/awstats.pl؟ config=chedong
استنادًا إلى Perl: ويحل مشكلة الأنظمة الأساسية بشكل جيد للغاية. يمكن للنظام نفسه أن يعمل على GNU/Linux أو Windows (بعد تثبيت ActivePerl)؛ تدعم السجلات التي تم تحليلها تنسيق Apache (مدمجًا) وتنسيق IIS مباشرةً ). على الرغم من أن Webalizer لديه أيضًا إصدار نظام التشغيل Windows، إلا أنه يفتقر حاليًا إلى الصيانة؛
يمكن لـ AWStats استخدام نظام واحد بالكامل لإكمال الإحصائيات الموحدة على خوادم ويب مختلفة لموقعك: خوادم GNU/Linux/Apache وWindows/IIS.
كفاءة عالية نسبيًا: تعد عناصر إحصائيات مخرجات AWStats أكثر ثراءً من Webalizer، ولا يزال من الممكن أن تصل السرعة إلى حوالي 1/3 من Webalizer بالنسبة لموقع به ملايين الزيارات اليومية، فإن هذه السرعة كافية؛
التكوين/التخصيص المريح: يوفر النظام قواعد تكوين افتراضية مرنة بما فيه الكفاية ولكن معقولة، ولا يلزم تعديل أكثر من 3 أو 4 تكوينات افتراضية لبدء التشغيل، وهناك عدد لا بأس به من المكونات الإضافية التي يمكن تعديلها وتوسيعها؛
تم تصميم مصممي AWStats "للزيارات البشرية" الدقيقة، لذلك تتم تصفية العديد من زيارات روبوت محرك البحث، لذلك قد تكون الأرقام أقل من أدوات إحصائيات السجل الأخرى ويمكن أيضًا تمرير الزيارات من داخل الشركة من خلال تصفية إعدادات تصفية IP .
يوفر العديد من وظائف إحصائيات المعلمات الموسعة: سيكون استخدام تكوين سلسلة ExtraXXXX لإنشاء تحليل المعلمات الخاص بالتطبيق مفيدًا جدًا لتحليل المنتج.
لمزيد من المقارنات مع الأدوات الأخرى: Webalizer، التناظرية، يرجى الرجوع إلى:
http://awstats.sourceforge.net/#COMPARISON