1. ملف robots.txt والروبوتات التعريفية
تستخدم معظم مواقع الويب الآن نظام إدارة المحتوى (CMS)، ويجب أن يكون المحتوى الذي لا يحتاج إلى فهرسته موجودًا، لذا فإن ملف robots.txt مهم للغاية. بالإضافة إلى ذلك، من الأفضل أن يتم حظر المحتوى الذي لا يمكن التحكم فيه بشكل كامل بواسطة ملف robots.txt بواسطة الروبوتات الوصفية من فهرسة محرك البحث. لا تعتقد أنه كلما تم تضمين المزيد، كان ذلك أفضل، فكلما زاد المحتوى غير ذي الصلة الذي يتضمنه محرك البحث من موقع الويب، زادت احتمالية تشتيت وزن المحتوى ذي الصلة.
2. 301 إعادة التوجيه وتوحيد اسم المجال
يجب أن يستخدم المحتوى الذي يحتاج إلى إعادة التوجيه إعادة التوجيه 301، وهو حساس نسبيًا لـ Google ويمكن الحكم عليه بسهولة على أنه غش، ويتم تنفيذ معظم عمليات اختطاف الصفحات من خلال 302. فيما يتعلق بمسألة توحيد اسم النطاق، بالإضافة إلى إعادة توجيه www.xxx.com إلى xxx.com، يجب علينا أيضًا التأكد من إمكانية إعادة توجيه www.xxx.com/a.html بنجاح إلى xxx.com/a.html. هذه المشكلة تخص بايدو بشكل أساسي، ويمكن لجوجل حلها بشكل مخفي من خلال أدوات مشرفي المواقع.
3. المسارات النسبية وإدخالات الإدارة
كما ذكرنا سابقًا، تستخدم معظم مواقع الويب cms. من الأفضل استخدام المسارات المطلقة لبعض الروابط في قالب CMS، وإلا سيكون هناك العديد من 404 مع تغير المسارات؛ العديد من CMS لديها مداخل تسجيل دخول مسؤول محجوزة، والتي سيتم الزحف إليها بواسطة محركات البحث إذا بقي هذا المدخل على الصفحة ، حتى لو تم حظره من الفهرسة، فإن محركات البحث مثل Yahoo و Baidu ستدرجه أحيانًا في نطاق التضمين، لذلك من الأفضل التأكد من عزل الروابط ذات الصلة بالخلفية، أي حذف المدخل إلى الخلفية من الصفحة. وفي الوقت نفسه، يعد حجز رابط المسؤول أيضًا خطرًا أمنيًا ويمكن استغلاله بسهولة من قبل الأشخاص ذوي الدوافع الخفية.
المصدر: http://yeeeseo.com/html/3-neglected-seo-details.html