لقد أحدث فيروس H1N1 ضجة كبيرة في الآونة الأخيرة والجميع يدرك ذلك. ليس فقط قبل بضعة أيام، حتى بايدو أصيبت بفيروس H1N1.
فيما يتعلق بسرعة تحديث محرك البحث، تقوم Baidu بفهرسة مواقع الويب الإخبارية والمواقع الأخرى التي يتم تحديثها بشكل كبير بسرعة كبيرة، وتقوم بتحديثها بشكل أساسي في نفس اليوم. ومع ذلك، بالنسبة لمواقع الويب التي تحتوي على قدر قليل من التحديثات، مثل مواقع المستشفيات، هناك فرق كبير بين الاثنين. على سبيل المثال، بالنسبة لمواقع الويب ذات الوزن الكبير وخرائط الموقع المرسلة والأصوات، يمكن أن تصل سرعة فهرسة Google إلى مستوى الدقائق في بعض الأحيان ، بعد تحديث المقالة فقط، يمكن أن تصل سرعة الفهرس إلى عدة دقائق، ويمكن العثور عليها في Google في دقائق، ولكن بالنسبة لـ Baidu، تكون سرعة الفهرسة بطيئة، وعادةً ما تزحف فقط إلى الصفحة الرئيسية لموقع الويب، وتبحث عن العنوان. أو صفحة الدليل، ولكن هناك عدد قليل جدًا من صفحات المحتوى الخاصة بالمقالة.
وفقًا لملاحظتي للموقع الجديد www.wznanke.com، فإن هذا الموقع هو في الأساس موقع ويب للخدمات الطبية. ومن خلال اللقطات المضمنة، يبدو أن بايدو تولي اهتمامًا كبيرًا بشكل خاص للصفحة الرئيسية للموقع. عندما تمت مراجعة المحتوى الثابت للصفحة الرئيسية للموقع ولم يتم تحسين المحتوى الثابت، استخدمت أولاً روابط المقالات الإلكترونية الخارجية، بالإضافة إلى معرفة Baidu وTieba كمساعدة. عادة ما يستغرق الأمر أقل من أسبوع ليتم تضمينه في بايدو، من خلال تحليل المواقع الطبية ذات الصلة. بالنسبة للمقالات المنشورة خلال نصف شهر، استخدم Baidu للبحث عن عناوين المقالات، أهمها هي في الأساس مقالات أعيد طباعتها أو تم جمعها من مواقع البوابة الإلكترونية. معظم المقالات الموجودة على مواقع المستشفيات هي نفسها، لذا فإن محتوى المقالات غير مرئي محركات البحث صغيرة جدًا، فكيف يمكن زيادة عدد الزيارات إلى مواقع الويب مثل Wanzhong Men's Network التي تحتوي على عدد قليل من تحديثات المحتوى الاحترافية وخصائص الصناعة الواضحة؟ إذا تأثرت Baidu أيضًا للأسف بفيروس H1N1، فربما يمكننا العثور على بعض الأسباب!
1. تحليل التقاط المحاكاة
(1) وفقًا لسجل زاحف بايدو على الموقع بتاريخ 16 مايو، يظهر:
#البرمجيات: خدمات معلومات الإنترنت من Microsoft 6.0
#الإصدار: 1.0
#التاريخ: 2009-05-16 14:42:56
#الحقول: التاريخ والوقت s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2009-05-16 14:42:55 W3SVC490114653 61.129.14.17 الحصول على /robots.txt - 80 - 61.135.190.55 Baiduspider+(+http://www.baidu.com/search/spider.htm) 404 0 64
أولاً، عثر الزاحف على معلومات التنقل في الجزء العلوي من الصفحة الرئيسية لموقع الويب، وقد توقف Baidu مؤقتًا بعد قراءة ملف الروبوتات مرة واحدة وإرجاع 404. وبما أن محتوى الصفحات الداخلية للموقع لم يكتمل بعد، فإن بايدو ستنتظر لفترة طويلة قبل الوصول إلى الصفحات الداخلية بعد قراءة الصفحة الرئيسية. وفقًا للمحاكاة، فإن أول زيارة فعالة لبايدو هي:
2009-05-16 01:23:32 W3SVC490114653 61.129.14.17 GET /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
ثانيًا، من المحتمل أن تستمر قراءة Baidu التالية في قراءة محتوى الصفحة الرئيسية أولاً، ويمكننا عرضها من خلال لقطة في الموقع:wznanke.com. ومع ذلك، عند الزحف إلى الصفحة الرئيسية للمرة الثانية، لا تتم قراءة الروبوتات (عرض الزاحف المحاكي). ).
2009-05-16 08:24:26 W3SVC490114653 61.129.14.17 GET /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
في الخطوة التالية، قد يقرأ Baidu المزيد من الروابط على الصفحة الرئيسية نظرًا لأن موقع الويب يتحسن تدريجيًا، فيجب على موقع الويب تحسين الروابط الداخلية ذات الصلة ورفض ظهور الروابط الميتة وفقًا لسجل الزاحف الذي تمت محاكاته:
2009-05-1608:26:01W3SVC490114653 61.129.14.17 GET /remensousuo/RuHeJianFei/index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
وفقًا للمحتوى المختلف لشبكة الزحف Baidu Baiduspider في كل مرحلة، يمكننا ضبط التخطيط ذي الصلة لموقع الويب في الوقت المناسب وفقًا للقواعد ذات الصلة. خاصة بالنسبة لمواقع الويب الجديدة المتصلة بالإنترنت، لن تقوم Baidu بفهرستها بسرعة. فقط عندما يكون لموقع الويب الخاص بك وزن معين في محرك البحث ويحتوي على روابط عكسية معينة عالية الجودة، ستمنح Baidu موقع الويب عتبة سيبدأ في تضمين صفحات المحتوى ذات الصلة، وسيتلقى موقع الويب المزيد من الزيارات من بايدو.
خاصة بالنسبة لمشرفي المواقع الذين لا يزال محتوى موقع الويب الخاص بهم قيد التحسين التدريجي والذين يتوقون إلى الانضمام إلى Baidu، لا يقدمون بشكل أعمى إلى محركات البحث الرئيسية. في هذه العملية، قمت أولاً بالترويج للموقع من خلال المقالات المتعلقة بالروابط الخارجية، واستخدمت Baidu لإعطاء أهمية أكبر لـ Baidu Space وTieba وZhizhi والتعاون مع Baidu لزيارة مواقع البوابات الإلكترونية بشكل متكرر مع أوقات تحديث أسرع، مثل: Sina وNetEase ، يركز توم على كتابة مقالات ذات جودة معينة في المجتمعات ذات الصلة، وبهذه الطريقة، ستعتبر بايدو موقع الويب ذا وزن خارجي أعلى وستقوم بإدراجه طوعًا.
بالطبع، لن تكون بايدو مجرد ناقل لفيروس H1N1، فطالما وجدنا السلاح السحري لقواعد جمع بايدو، فسيتم أيضًا القضاء على فيروس H1N1 هذا من قبل غالبية مشرفي المواقع.
تم المساهمة في هذه المقالة من قبل مسؤول موقع www.wznanke.com. اتصل بـ QQ309067036