-
على الرغم من أن محركات البحث تطورت بشكل جيد للغاية، إلا أنها لا تزال تواجه العديد من التحديات التقنية، أهمها:
1. يجب أن يكون الزحف إلى الصفحة سريعًا وشاملاً
نحن نعلم أن الإنترنت عبارة عن تحديث ديناميكي للمحتوى كل يوم، ينشر العديد من الأشخاص محتوى جديدًا أو يقومون بتحديث المحتوى القديم على الإنترنت. يقوم محرك البحث بالزحف إلى صفحات الويب التي تلبي نوايا البحث الخاصة بالمستخدم على أفضل وجه من خلال هذا الكم الهائل من المعلومات. في مواجهة الكم الهائل من المعلومات الموجودة بالفعل وكمية المعلومات المتزايدة هندسيًا كل ثانية، فإن عبء العمل على محرك البحث كبير جدًا، ويستغرق تحديث برنامج محرك البحث الكثير من الوقت، خاصة عند ولادته للتو يمكن في بعض الأحيان تحديث الدورة كل بضعة أشهر. فقط تخيل، كم عدد تحديثات صفحات الويب والجديدة التي سيتم إنشاؤها في غضون بضعة أشهر؟ تميل نتائج البحث هذه إلى التأخر. من أجل الحصول على أفضل نتائج البحث، يجب على عناكب البحث الزحف إلى صفحة ويب شاملة قدر الإمكان، الأمر الذي يتطلب من محركات البحث حل العديد من المشكلات التقنية. وهذا أيضًا هو التحدي الرئيسي الذي يواجهه.
2. التخزين الشامل للبيانات
المعلومات الموجودة على الإنترنت ضخمة، ولا يمكن تصورها تقريبًا، ويتم إنشاء الكثير من المعلومات الجديدة كل يوم بعد زحف محركات البحث إلى هذه الصفحات، يجب تخزينها بتنسيق بيانات معين، وتتطلب بنية البيانات معقولاً، ويجب أن يكون لها. قابلية تطوير عالية جدًا. يجب أن تكون سرعة كتابة البيانات سريعة، ويجب أن تكون سرعة الوصول سريعة بدرجة كافية. بالإضافة إلى تخزين كمية كبيرة من المعلومات على الصفحة نفسها، يجب على محركات البحث أيضًا تخزين علاقات الارتباط بين الصفحات والبيانات التاريخية على الصفحة والكثير من معلومات الفهرس من أجل فهرسة وفرز أفضل. وكمية هذه البيانات ضخمة جدًا. من المؤكد أن هناك العديد من التحديات التقنية في تخزين وقراءة مثل هذه البيانات واسعة النطاق.
3. يجب أن تكون معالجة الفهرس سريعة وفعالة، ويجب أن تكون قابلة للتطوير.
بعد أن يقوم محرك البحث بالزحف إلى بيانات الصفحة وتخزينها، فإنه يحتاج أيضًا إلى فهرسة العديد من الصفحات. على سبيل المثال، حساب علاقات الارتباط بين الصفحات، والفهرس الأمامي، والفهرس العكسي، وما إلى ذلك. على سبيل المثال، هناك حساب العلاقات العامة الخاص بشركة Google، وما إلى ذلك. يجب على محركات البحث إجراء الكثير من أعمال الفهرسة لإرجاع نتائج البحث بسرعة، علاوة على ذلك، أثناء عملية الفهرسة، يتم إنشاء عدد كبير من الصفحات الجديدة، ويحتاج برنامج معالجة الفهرس الخاص بمحرك البحث قابلية التوسع جيدة.
4. معالجة الاستعلام سريعة ودقيقة
يتم تشغيل الخطوات السابقة كلها في برنامج الخلفية لمحرك البحث، ومرحلة الاستعلام هي خطوة يمكن للمستخدمين من خلالها رؤية النتائج. بعد أن نقوم بإدخال الكلمات الرئيسية في مربع البحث الخاص بمحرك البحث والنقر فوق بحث، غالبًا ما يتمكن محرك البحث من إرجاع النتائج إلينا في أقل من ثانية. على الرغم من أن الأمر يبدو بسيطًا على السطح، إلا أنه في الواقع أمر معقد للغاية بالنسبة لمحركات البحث عملية. هناك العديد من الخوارزميات المعنية. يحتاج إلى العثور بسرعة على صفحات معقولة من صفحات الويب التي تلبي الشروط الأساسية في أقل من ثانية وتحتل المرتبة الأولى في محركات البحث. نحن نعلم أن Baidu يمكنه رؤية ما يصل إلى 76 صفحة من النتائج، بينما لدى Google المزيد، ويمكنه رؤية ما يصل إلى 100 صفحة من النتائج.
مصدر المقال: http://www.suptb.cn/ يرجى الإشارة إلى المصدر عند إعادة الطبع، وشكراً
بفضل danieldu2008 لمساهمته