تواجه محركات البحث مثل Google مشكلة. يسمونه "محتوى مكرر". يتم عرض المحتوى الخاص بك على صفحات مختلفة من موقع الويب، ولا يعرفون العنوان الذي سيتم عرضه عليه. يمثل هذا المحتوى المكرر مشكلة خاصة عندما يرتبط الأشخاص بجميع الإصدارات المختلفة للمحتوى الخاص بك. الغرض من هذه المقالة هو مساعدتك على فهم الأسباب المختلفة للمحتوى المكرر ومن ثم التعرف على كيفية إصلاح كل سبب.
أسباب المحتوى المكرر
1. سوء فهم مفهوم URL
2. معرف الجلسة
3. معلمات تتبع URL
4. البحث عن المحتوى وتجميع المحتوى
5. ترتيب المعلمات
6. ترقيم الصفحات التعليق
7. طباعة الصفحة
8. شبكة الاتصالات العالمية مقابل لا شبكة الاتصالات العالمية
الحل المفاهيمي للعلامة "الكنسي".
1. تحديد المحتوى المكرر
2. أدوات مشرفي المواقع من جوجل
3. أمر البحث للاستعلام عن العنوان
خطوات عملية لحل المحتوى المكرر
1. تجنب المحتوى المكرر
2. 301 إعادة توجيه
4. استخدم العلامة rel="canonical".
5. رابط للمحتوى الأصلي
ملخص: يمكن، بل ويجب، معالجة المحتوى المكرر
يمكنك التفكير في المحتوى المكرر كما لو كنت تقف على مفترق طرق وهناك اتجاهان مختلفان على إشارات الطريق يشيران إلى نفس الوجهة. والأكثر من ذلك، أن الوضع يصبح أسوأ عندما تكون وجهتك مختلفة. كقارئ، لا يهمك مصدر المحتوى، ولكن يتعين على محركات البحث اختيار محتوى لعرضه في نتائج البحث لأنها لا تريد عرض نفس المحتوى مرتين.
على سبيل المثال، المحتوى المتعلق بالكلمة الرئيسية -x/ ، هذا الوضع ليس وهميًا، هذه المشكلة موجودة في العديد من أنظمة cms. على سبيل المثال، تم جمع مقالتك وإعادة نشرها من قبل بعض مستخدمي الإنترنت، ويرتبط بعض الأشخاص بعنوان URL الأول الخاص بك، ويرتبط بعض الأشخاص بعنوان URL الثاني الخاص بك. وهنا تأتي مشكلة المحتوى المكرر. إذا كانت جميع الروابط المتعلقة بهذه الكلمة الرئيسية تشير إلى عنوان URL واحد، فسيكون احتمال وجود الكلمة الرئيسية على الصفحة الرئيسية أعلى بكثير.
أسباب المحتوى المكرر
هناك العديد من العوامل التي يمكن أن تؤدي إلى محتوى مكرر. معظمها تقني، وليس من الشائع جدًا أن يقرر شخص ما وضع نفس المحتوى في مكانين مختلفين دون الإشارة إلى المصدر الأصلي، وسيجد معظم الناس ذلك غير مريح. الأسباب الفنية هي أيضا جيدة جدا. وأغلب أسباب ذلك أن المبرمجين لا يقفون من وجهة نظر المتصفحين أو المستخدمين، ولا يهتمون بعناكب محركات البحث، بل يتبعون تفكير المبرمج فقط. لنفترض أن المقالة المذكورة سابقًا تظهر على http://www.example.com/keyword-x/ و http://www.example.com/article-category/keyword-x/ ؟ ولو سألت المبرمج سيقول أنها تظهر مرة واحدة فقط.
سوء فهم مفهوم URL
إذن هل المبرمجون مجانين؟ لا، لا، لقد تحدث للتو بلغة أخرى مرة أخرى. من المحتمل أن يكون موقع الويب الذي تراه بأكمله مدفوعًا بقاعدة البيانات. في قاعدة البيانات هذه، هناك مقالة واحدة فقط، ويسمح برنامج موقع الويب بالوصول إلى مقالة في قاعدة البيانات من خلال عناوين URL مختلفة. لأنه في نظر المبرمجين، العلامة الوحيدة هي أن المقالات الموجودة في قاعدة البيانات لها معرفات فريدة، وليس عناوين URL. بالنسبة لمحركات البحث، عنوان URL هو المعرف الفريد للمقالة. إذا أخبرت مبرمجك بذلك، فسوف يفهم سبب المشكلة، وبعد ذلك، مثل معظم المبرمجين الذين أعمل معهم، سوف يتساءل لماذا محركات البحث غبية ولماذا لا يستطيع حل هذه المشكلة. وبهذه الطريقة ذهب إلى تفكير خاطئ آخر.
معرف الجلسة
غالبًا ما ترغب في تتبع تحركات زوار موقعك، مثل تخزين العناصر التي يشترونها في عربة التسوق الخاصة بهم. للقيام بذلك، يجب عليك منحهم جلسة. الجلسة هي في الأساس سجل موجز لما فعله الزائر على موقعك، والذي قد يتضمن محتوى مثل العناصر الموجودة في عربة التسوق. من أجل منع جلسة الزائر من النقر فوق صفحة ويب إلى أخرى، يجب تخزينها في مكان ما. الحل الأكثر شيوعًا هو ملفات تعريف الارتباط، إلا أن محركات البحث عادةً لا تقوم بتخزين ملفات تعريف الارتباط.
ما يحدث في هذه المرحلة هو أن بعض أنظمة مواقع الويب تستخدم معرف الجلسة في عنوان URL للعودة. في هذه المرحلة، سيتم إلحاق الروابط الداخلية لكل موقع ويب بمعرف الجلسة، ويكون معرف الجلسة فريدًا، مما يؤدي إلى إنشاء عنوان URL جديد وبالتالي محتوى مكرر.
استخدام تتبع وفرز معلمات URL
هناك سبب آخر للمحتوى المكرر وهو استخدام معلمات URL، على الرغم من أن المعلمات لا تغير محتوى الصفحة، كما هو الحال في روابط التتبع. ستلاحظ أن http://www.example.com/keyword-x/ و http://www.example.com/keyword-x/?source=rss ليسا نفس عناوين URL لمحركات البحث. قد يسمح لك هذا الأخير بتتبع المصادر، مما قد يجعل تصنيفك أصعب قليلاً، وهو تأثير سلبي سيء للغاية.
لا ينطبق هذا على معلمات التتبع فحسب، بل ينطبق أيضًا على كل معلمة تضيفها بعد عنوان URL دون تغيير المحتوى الفعلي على صفحتك. سيؤدي تضمين المعلمات إلى تغيير ترتيب المنتجات على صفحة الويب أو عرض شريط جانبي آخر، مما سيؤدي إلى تكرار المحتوى.
تجريف المحتوى وتجميع المحتوى
على الرغم من أن الغالبية العظمى من أسباب المحتوى المكرر هي خطأك أنت، أو على الأقل خطأ موقعك، إلا أنه في بعض الأحيان يكون استخدام موقع آخر للمحتوى الخاص بك دون موافقتك. فهي لا ترتبط دائمًا بالمحتوى الأصلي الخاص بك، ولا تعلم محركات البحث أنه سيتعين عليها معالجة نسخة أخرى من نفس مقالتك.
كلما أصبح موقعك أكثر شهرة، ستواجه المزيد والمزيد من عمليات الزحف، وستزداد مشاكلك سوءًا.
ترتيب المعلمة
سبب شائع آخر هو أن نظام إدارة المحتوى (CMS) لا يستخدم عناوين URL مختصرة ونظيفة، ولكنه يستخدم /؟ id=1&cat=2، المعرف هنا يشير إلى المقالة، وcat يشير إلى الفئة. في معظم أنظمة إنشاء مواقع الويب، يكون عنوان URL هذا /؟ سيعرض cat=2&id=1 نفس المحتوى أيضًا، لكنه سيكون مختلفًا تمامًا بالنسبة لمحركات البحث.
تعليق الصفحات
هناك خيار لترقيم التعليقات في نظام WordPRess أو البرامج الأخرى. سيؤدي هذا إلى تكرار محتوى المقالة في عنوان URL للمقالة نفسها والمقالة URL+/comment-page-1/، /comment-page-2/، وما إلى ذلك.
طباعة الصفحة
إذا قام نظام إدارة المحتوى الخاص بك بإنشاء صفحات مطبوعة وروابط من صفحات مقالاتك، فسيعثر Google في معظم الحالات على هذه الصفحات ما لم تمنعها على وجه التحديد. ما هو الإصدار الذي يجب أن يعرضه Google؟ صفحة تحتوي على إعلانات ومحتوى محيط بها أو صفحة تحتوي على مقالاتك فقط.
WWW مقابل غير WWW
هذا سؤال قديم، لكن في بعض الأحيان لا تزال محركات البحث تخلط بين محتوى WWW والمحتوى المكرر غير التابع لـ WWW عندما يكون من الممكن الوصول إلى كلا الإصدارين.
هناك موقف غير شائع وهو محتوى مكرر لـ http مقابل https.
الحل المفاهيمي للعلامة "الكنسي".
كما هو موضح أعلاه، يمثل المحتوى المكرر الناتج عن عناوين URL مختلفة لنفس المحتوى مشكلة، ولكن يمكن حلها. يمكن لأي إنسان عادةً أن يخبرك بسهولة بعنوان URL الصحيح لمقال ما عند نشر مقال. الشيء المضحك هو أنك أحيانًا تسأل 3 أشخاص في نفس الشركة وتحصل على 3 إجابات مختلفة.
ملخص: يمكن، بل ويجب، معالجة المحتوى المكرر
في هذه الحالات، يجب حل المشكلة لأنه في النهاية لا يمكن أن يكون هناك سوى عنوان URL واحد. يمكن تسمية عنوان URL الصحيح للمقالة باسم Canonical بواسطة محركات البحث.
تحديد المحتوى المكرر
قد لا تعرف ما إذا كان لديك محتوى مكرر على موقعك. اسمحوا لي أن أقدم لكم بعض النصائح.
أدوات مشرفي المواقع جوجل
تعد أدوات مشرفي المواقع من Google أداة رائعة لتحديد المحتوى المكرر. إذا انتقلت إلى أدوات مشرفي المواقع من Google وعرضت موقعك، فتحقق من التشخيص -> اقتراحات HTML، وسترى شيئًا كهذا
إذا كانت الصفحة تحتوي على عنوان مكرر أو وصف مكرر، فلن يحدث أي شيء جيد تقريبًا. سيؤدي النقر فوقه إلى إظهار عناوين URL التي تحتوي على عناوين أو أوصاف مكررة لمساعدتك في تحديد المشكلة. تكمن المشكلة في أنه إذا كان لديك مقال حول "الكلمة الرئيسية -X" معروضًا في فئتين، فقد تكون عناوينهما مختلفة. على سبيل المثال، ستكون عناوينها "الكلمة الرئيسية X - الفئة X - مثال للموقع" و"الكلمة الرئيسية X - الفئة Y - مثال للموقع". لن يتعامل Google معها على أنها عناوين مكررة، ولكن يمكنك العثور عليها من خلال البحث.
ابحث عن العنوان أو الأجزاء الأخرى
هناك العديد من عوامل تشغيل البحث التي تكون مفيدة جدًا في هذه الحالة. إذا كنت تريد العثور على جميع عناوين URL للمقالات الموجودة على موقع الويب الخاص بك والتي تحتوي على كلمتك الرئيسية "X"، فيمكنك إدخال الأمر التالي في مربع بحث Google:
الموقع:example.com intitle:"الكلمة الرئيسية X"
نسخ الرمز
ستعرض لك Google جميع الصفحات الموجودة على example.com التي تحتوي على هذه الكلمة الرئيسية. كلما بحثت عن كلمات رئيسية أكثر تحديدًا في قسم العنوان، أصبح من الأسهل العثور على المحتوى المكرر وإزالته. يمكنك أيضًا استخدام نفس الطريقة لتحديد المحتوى المكرر الخاص بك على مواقع الويب الخاصة بالأشخاص الآخرين. على سبيل المثال، العنوان الكامل لمقالتك هو Keyword X - يمكنك البحث عن سبب كونها رائعة
intitle:"الكلمة الرئيسية X - لماذا هي رائعة"
نسخ الرمز
ستقوم Google بإرجاع جميع مواقع الويب التي تحتوي على هذا العنوان. في بعض الأحيان يمكنك أيضًا البحث عن جملة أو جملتين في مقالتك، لأن بعض أدوات استخراج المحتوى قد تغير عنوانك. في بعض الحالات، عند البحث، قد يعرض Google المطالبة التالية في نهاية النتائج:
هذه علامة على أن Google قامت بإزالة نتائج البيانات المكررة. من الواضح أن هذا ليس جيدًا. يمكنك الاستمرار في النقر لعرض النتائج الأخرى لمعرفة ما إذا كان ذلك يساعدك على حل هذه المشكلات.
خطوات عملية لحل المحتوى المكرر
بمجرد أن تحدد عنوان URL الذي يجب تحديده بشكل أساسي لمقالتك، يجب عليك بدء بعض عمليات تحديد العنوان الأساسي (حسنًا، أعلم أنني مطول وقد قلت ذلك عدة مرات). وهذا يعني في الأساس السماح لمحركات البحث بمعرفة هذا الإصدار الأساسي وحثهم على اكتشافه في أسرع وقت ممكن. فيما يلي أربع طرق لحل هذه المشكلة:
1. لا تقم بإنشاء محتوى مكرر
2. إعادة توجيه المحتوى المكرر إلى عناوين URL الأساسية
3. قم بإضافة رابط العلامة Canonical إلى الصفحة المكررة
4. أضف رابطًا تشعبيًا إلى عنوان URL الأساسي في صفحة المحتوى المكررة
تجنب المحتوى المكرر
بالنسبة للأسباب المذكورة أعلاه للمحتوى المكرر، هناك بعض الطرق السهلة لإصلاحها.
1. معرف الجلسة في URL؟
عادة يمكنك إلغاء ذلك في إعدادات النظام الخاص بك
2. هناك صفحة مطبوعة
ليس أيًا من هذا ضروريًا، يمكنك استخدام ورقة أنماط الطباعة
3. استخدم ترقيم الصفحات للتعليقات في ووردبريس
لهذه المشكلة، هل يمكنك إلغاء ترقيم الصفحات للتعليق في الإعدادات؟
4. أوامر مختلفة من المعلمات
اطلب من المبرمج الخاص بك إنشاء رمز للفرز بنفس الترتيب (يشير هذا عادةً إلى مصنع URL)
5. تتبع مشكلات المعلمات
في معظم الحالات، يمكنك استخدام قيم التجزئة # بدلاً من المعلمات لتتبع الحملات التسويقية
6. مشكلة WWW مقابل مشكلة غير WWW
اختر الإصدار الذي تريده والتزم بإعادة التوجيه. يمكنك ضبط هذا في أدوات مشرفي المواقع من Google.
إذا لم يكن حل مشكلتك بهذه السهولة، فقد يكون الأمر يستحق بذل الجهد لمنع المحتوى المكرر تمامًا. هذا هو الحل الأفضل حتى الآن.
301 إعادة توجيه المحتوى المكرر
في بعض الحالات، لا يمكن منع محتوى مقالة النظام الذي تستخدمه تمامًا من إنشاء عناوين URL غير صحيحة، ولكن يمكنك إعادة توجيهها. إذا لم يكن هذا منطقيًا بالنسبة لك (وأنا أفهم ذلك)، فيجب عليك أن تتذكر ذكر ذلك للمبرمجين لديك. بالإضافة إلى ذلك، إذا قمت بحل مشكلة المحتوى المكرر، فتأكد من إعادة توجيه جميع عناوين URL للمحتوى المكرر القديم إلى عناوين URL الأساسية المناسبة.
استخدم rel="Canonical"
في بعض الأحيان قد لا ترغب في حل مشكلة المقالات المكررة أو لا تستطيع حلها، ولكن عليك أن تعلم أن عنوان URL هذا خاطئ. لهذه المشكلة بالذات، قدمت محركات البحث هذا أيضًا
العناصر الكنسية. يبدو الجزء الذي يتم وضعه على موقع الويب الخاص بك كما يلي:
<link rel="canonical" href=" http://example.com/keyword-x/"/ >
في جزء href من علامة الرابط Canonical، يمكنك وضع عنوان URL الأساسي الصحيح للمقالة. عندما يعثر Google أو محركات البحث الأخرى التي تدعم هذه السمة على عنصر الرابط هذا، فإنه سيجري قفزة ناعمة 301: سوف يمرر أيضًا الصفحة الأكثر. تنتقل قيمة الرابط إلى عنوان URL الأساسي الخاص بك.
ستكون هذه العملية أبطأ من عملية إعادة التوجيه 301، لذلك سيكون من الأفضل استخدام 301 التي ذكرها جون مولر من Google http://www.seroundtable.com/google-canonical-tag-vs-301-redirect-12611.html
رابط العودة إلى النسخة الأصلية الخاصة بك
إذا لم تتمكن من القيام بما ورد أعلاه، فمن المحتمل أنه لا يمكنك التحكم في قسم "الرأس" في موقعك حيث يتم عرض المحتوى، ومن الجيد أيضًا إضافة رابط إلى صفحتك الأصلية في أعلى أو أسفل الصفحة. هناك بعض المقالات الأخرى التي تريد إضافة رابط إليها في موجز RSS الخاص بك. قد تقوم بعض برامج الزحف بتصفية هذه الروابط، ولكن قد يبقى بعضها هناك، وإذا أحصى Google عدة روابط تشير إلى مقالتك، فسوف يعرف أيضًا بسرعة أن هذه هي النسخة الأساسية الدقيقة للمقالة.
ملخص: يمكن، بل ويجب، معالجة المحتوى المكرر
يحدث المحتوى المكرر في كل مكان. لم أصادف بعد موقع ويب يحتوي على أكثر من 1000 صفحة بدون محتوى مكرر واحد. وهذا يتطلب انتباهكم في جميع الأوقات. هذا أمر قابل للحل ويمكن أن تكون المكافآت كبيرة. قد ترتفع تصنيفات صفحات المحتوى عالي الجودة بشكل كبير بعد معالجة المحتوى المكرر. بالطبع، تحتاج أولاً إلى تحديد هذه المشكلات، ومساعدة المبرمجين لديك على التوصل إلى حلول للمشاكل، وحتى مساعدتك في حل المشكلات.
مؤلف الترجمة: زيبنغ
مصدر المقال: منتدى Lightyear ( http://www.gnbase.com/thread-474-1.html )
النص الإنجليزي الأصلي: http://yoast.com/articles/duplicate-content/
ملحوظة: تمت إعادة طباعة المقالة في صفحة مشرفي المواقع الرئيسية بترخيص من zhipeng، Lightyear Forum. إذا كنت بحاجة إلى إعادة طبع، يرجى الإشارة إلى مصدر المقال ورابطه.