في 13 أبريل 2010، في Baidu Tieba Webmaster Club، طرح ZAC، خبير تحسين محركات البحث الصيني المعروف، في المنشور "طرح أسئلة نيابة عن الآخرين بحيث لا يمكن تحديد المحتوى الأصلي": "ترتيب المحتوى الأصلي الخاص بي غالبًا ما لا يكون جيدًا مثل المحتوى المعاد طباعته أو المسروق. ما الذي يمكن لمشرف الموقع فعله لمنعه أو تحسينه؟ يقوم موقع الويب الخاص بي بتحديث المحتوى الأصلي كل يوم، كما يقوم Baidu أيضًا بتحديثه كل يوم لا يمكن البحث عنه، لقد ثابرت لما يقرب من 4 مرات، إنه عملي الأصلي، لكن بايدو ما زال يوصلني إلى أكثر من 500 مكان!
قبل عامين، أجرى مسؤول موقع ZAC حوارًا مع لي، الذي مثل بايدو، حول مسألة التضمين الأصلي.
لقد مر أكثر من عامين، ولم يتغير الوضع المذكور في السؤال أعلاه، بل ازداد سوءًا. يوصى بسهولة بصفحات المحتوى الأصلي القيمة "المنسوخة والمجمعة" للبحث عن مستخدمي الإنترنت من خلال بحث الويب Baidu من خلال فهرسة الكلمات الرئيسية. ومع ذلك، فقد موقع إطلاق المحتوى الأصلي سمعته. وهذا يتغاضى بشكل موضوعي عن انتشار ما يسمى تحسين محركات البحث (SEO) القائم على "نسخ وجمع النسخ الأصلية الزائفة" الذي يستهدف عيوب بايدو.
مما لا يثير الدهشة، في حدث "اليوم المفتوح لعيادة مشرفي المواقع" الذي نظمته بايدو في 10 أغسطس من هذا العام، أصبحت مسألة تحديد الأصالة سؤالًا ظل مشرفو المواقع وكبار المسئولين الاقتصاديين يطرحونه على مهندس بحث بايدو لي.
ومن غير المستغرب أيضًا أن تكون إجابة لي، مهندس بحث بايدو، نسخة طبق الأصل من إجابته قبل عامين: "حسنًا، لا يمكن إلا أن نقول إن استراتيجية بايدو ليست مثالية بعد، ونحن نعمل على تحسينها".
يمكن للأشخاص الذين يتابعون أخبار بايدو أن يجدوا بسهولة أن إجابة بايدو لي "نحن نصمم مجموعة كاملة نسبيًا من خوارزميات التعريف الأصلية" هي استجابة كاملة لـ "التدابير ضد المواقع منخفضة الجودة" التي اتخذها فريق مكافحة الاحتيال في بحث الويب في بايدو في 2 يوليو. "لقد دخلت الإجراءات ضد مواقع الويب منخفضة الجودة (المواقع الأصلية المزيفة والمواقع غير الأصلية) حيز التنفيذ" - لا يزال الجميع يتذكر أنه في ذلك الوقت، "دخلت الإجراءات ضد مواقع الويب منخفضة الجودة حيز التنفيذ" قال بشكل رائع: "لتوفير جودة عالية، بالنسبة لمشرفي المواقع الذين يستخدمون الموارد الأصلية، نظرًا لأننا نقوم بتقليل أو حتى إلغاء تصنيفات المواقع منخفضة الجودة، فستحصل على المزيد من الزيارات من Baidu."
ولكن بعد أقل من شهرين، نفى لي إجابة مهندس البحث في بايدو تمامًا بيان فريق مكافحة الاحتيال في البحث على الويب في بايدو، والذي كان صادمًا حقًا.
علاوة على ذلك، عندما واجهت بايدو لي مسألة تحديد "المحتوى الأصلي" مرتين بعد عامين، اعتمدت أسلوب "النظر حولها والتحدث عنها" للتعامل معها بشكل روتيني: قبل عامين، كانت إجابة لي "من منظور "تجربة المستخدم، قد لا تكون بعض النسخ المعاد طباعتها أسوأ من النسخة الأصلية... إنها مجرد نسخ محلية معاد طبعها، والعديد منها مقطوع من البداية إلى النهاية، مما يجعل المؤلف الأصلي أكثر جرحًا." إنه يستهدف أكثر مشكلة الكتب المحلية غير المنتظمة إعادة الطبع هذا العام، إجابة بايدو لي هي: "(تلقت بايدو أكثر من 80٪ من الشكاوى التي تدعي أنها أصلية باطلة، بل إن هناك عددًا كبيرًا من مواقع الويب التي تدعي أن أطباء الطب الصيني القديم يمكنهم علاج الأمراض المزمنة في الصين)؛ من 3 إلى 5 أيام، يصبح المحتوى بأكمله غير قابل للقراءة ويزعمون أنهم مواقع ويب عالية الجودة."
لا يمكن إنكار أن ما قاله لي كله حقائق، لكن تراكم التفاصيل الحقيقية لا يساوي الكل الحقيقي. إن وجود هذه المواقف المشتركة لا يعني عدم وجود محتوى أصلي عالي الجودة في صناعة الإنترنت الصينية، ولا يعني ذلك أيضًا هذا يعني أن بايدو لا يمكنها تحديد مواقع الويب بسبب الإصدار الأصلي. وكما يقول المثل: "إذا لم يكن لديك ماسة، فلا تعبث بالخزف". ولا يمكن لبيان بايدو لي إلا أن يثبت أن قدرة بايدو على تحديد المحتوى الأصلي وإزالة الصفحات المكررة لم تتحسن على الإطلاق.
ويجب التأكيد على أنه بعد فهم أن ضعف القدرة على تحديد الصفحات الأصلية هو ضعف جميع محركات البحث، فقد أضاف العديد من المؤلفين الأصليين على مستوى القاعدة بيان حقوق الطبع والنشر في نهاية المقالة لوضع علامة على عنوان URL للبدء، وفي الوقت نفسه، إنهم يسترشدون بطريقة "مزامنة المحتوى" لعمليات تقديم مواقع الويب عالية الجودة لمحركات البحث ومشرفي المواقع المعاد نشرها - على الرغم من أن معظم الروابط التي تم الحصول عليها هي روابط نصية عادية، قال لي مهندس بحث بايدو: "دعونا نوضح السؤال: هل يمكن الروابط في. هل يمكن التعرف على شكل النص العادي (غير العلامات) ومعالجته؟ الجواب "نعم، تحتاج عناكب محركات البحث إلى اكتشاف الروابط على الإنترنت والزحف إليها في الوقت المناسب. ولا يهم الشكل الذي يوجد به الرابط،" مما منحهم الثقة.
ما يخيب آمال مشرفي المواقع هؤلاء هو أن عددًا كبيرًا من مواقع التقديم وإعادة الطبع الموثوقة في الصناعة لا "تتم إعادة الطباعة من البداية إلى النهاية" كما قال بايدو لي، ويتم إنشاء صفحات الويب الخاصة بمواقع التقديم أو إعادة الطبع عالية الوزن وإدراجها بواسطة محركات البحث في وقت أبكر بكثير من " في حالة "نسخ وجمع المواقع الأصلية الزائفة"، لا يزال هناك عدد كبير من صفحات الصفحة الأولى الأصلية التي تتجاهلها بايدو. تصنيفات "نسخ وجمع المواقع الأصلية الزائفة" تظل مواقع الويب عالية - لا تزال العديد من هذه الصفحات تعترض بشكل عشوائي جزءًا من المقالة ولا تعبر بشكل كامل عن موضوع المقالة ولا يمكنها تلبية معيار "تجربة المستخدم الأفضل" الذي تعلن عنه بايدو.
تجدر الإشارة إلى أنه على الرغم من أن تحديد الصفحات الأصلية كان دائمًا يمثل نقطة ضعف في محركات البحث، إلا أن أداء جميع محركات البحث ليس سيئًا مثل أداء بايدو في مواجهة العديد من عناوين URL ذات الوزن الكبير التي تشير إلى صفحات الإطلاق الأصلية. كما قال وانغ تونغ، أحد كبار المسئولين الاقتصاديين المحليين المعروفين، في مواجهة انتشار "نسخ وجمع النسخ الأصلية الزائفة" على الإنترنت الصيني، لصفحة الإطلاق الأصلية مع دليل URL لبيان حقوق الطبع والنشر (بالإضافة إلى الإصدار الوقت، عالمية الارتباط ووزن صفحة موقع الويب، وما إلى ذلك. قياسي)، لم يتعرض Google لفشل كامل مثل Baidu، الذي يدعي أنه "يعرف أفضل اللغة الصينية" - أهم عمليات البحث ذات الصلة تشغلها الصفحات المزيفة الأصلية المنسوخة والمجمعة، وتختفي الصفحة الأولى الأصلية دون أن يترك أثرا.
وهذا يدل على أن بايدو، التي "تعرف اللغة الصينية أفضل"، يجب أن تكمل أعمال التعريف الأصلية وإزالة الصفحات المكررة (لتحديد صفحات المعلومات عالية الجودة والصفحات التكميلية المهمة للتوصيات الرئيسية) قبل التوصية بعناوين URL للبحث لمستخدمي الإنترنت من خلال فهرسة الكلمات الرئيسية. لم يكتمل - والسبب هو أن المستوى الفني منخفض للغاية وهناك حاجة ملحة للحاق به، وبيان بايدو لي يبحث باستمرار عن أعذار لبايدو.
علاوة على ذلك، بالمقارنة، فإن الأداء الأفضل لـ Google في تحديد عنوان البداية الأصلي يثبت أن Baidu لا تهتم بصفحة البداية الأصلية، بل تهتم فقط بالمزيد من المحتوى الأصلي - ولكنها تفتقر إلى الوعي المناسب بحقوق الطبع والنشر، وأعتقد أن هذا ما تفعله Baidu لـ لفترة طويلة، السبب الرئيسي لتخلف خوارزمية موقع الويب الأصلي هو "إما مستحيل أم لا".
لا عجب أنه بمجرد أن قال Wang Tong، أحد كبار المسئولين الاقتصاديين المحليين المعروفين، إن "تعديل Baidu 628 هو اتخاذ إجراءات صارمة ضد مواقع الويب الأصلية"، شعر العديد من مشرفي المواقع وكبار المسئولين الاقتصاديين بالحزن.
في الواقع، إذا كان من الممكن تحسين تقنية تحديد الهوية للصفحة الأولى الأصلية بشكل كبير، فيمكن أن يساعد ذلك في تحسين قدرة محرك البحث على مكافحة الغش بشكل كبير، وإحباط مؤامرات مُحسني محركات البحث الذين يخدعون محركات البحث بطرق مختلفة لتحقيق الربح، وتوفير منصة لأولئك الملتزمين جديًا بمحركات البحث المتطورة والثقة في المحتوى الأصلي عالي الجودة.
فقط عندما تحترم بايدو عمل العديد من مشرفي المواقع الأصلية الصغيرة والمتوسطة الحجم من خلال الإجراءات العملية وتشجعهم على الاستمرار في استخدام ذكائهم ومواهبهم لتنفيذ العمل الأصلي، يمكننا توجيه المزيد من مشرفي المواقع وكبار المسئولين الاقتصاديين المهووسين بـ "النسخ والتجميع" "الأصول الزائفة" لتكريس طاقتهم للانتقال إلى المحتوى الأصلي الذي "يعكس بشكل أفضل القيمة الأساسية لموقع الويب". بالنسبة لبايدو، على الرغم من صعوبة هذه الخطوة، إلا أنها خطوة كبيرة مفيدة للتطوير المستقبلي لمحركات البحث.
علاوة على ذلك، يجب أن أذكر بحث الويب الخاص بشركة Baidu أنه ليس من هدية Baidu للعديد من مشرفي المواقع على مستوى القاعدة حل "مشكلة جمع المحتوى الأصلي" التي أبلغ عنها مشرفو المواقع في أسرع وقت ممكن باستخدام خوارزمية أكثر منطقية (المواقع المعروفة لا تغضب Baidu all) ، يقوم Taobao بحظر Baidu مباشرة)، ولكنه "التزام أساسي" يجب على Baidu الوفاء به بموجب قانون حقوق الطبع والنشر الحالي والقوانين الأخرى ذات الصلة. لا يمكن لأفراد بايدو أن يشعروا بالرضا تجاه أنفسهم.
إلى أين تذهب، الطريق تحت قدميك، كل هذا يتوقف على اختيار محرك البحث (تم نشر هذه المقالة في الأصل بواسطة gouyn12. جميع الحقوق محفوظة. أنت مسؤول عن المقالة. يرجى الإشارة إلى المصدر الأصلي للمقالة في نموذج الرابط عند إعادة طباعته : http://www.gouyn12.com/cnnet/327.html ) .
(المحرر: تشن لونغ) المساحة الشخصية للمؤلف gouyn12