ล่าสุดเว็บไซต์ของเพื่อนหลายคนประสบปัญหาเดียวกัน กล่าวคือ ชื่อและคำอธิบายของเว็บไซต์ในผลการค้นหาของ Baidu แสดงอย่างผิดปกติและไม่สมบูรณ์ สแนปชอตของเว็บไซต์ไม่มีคำอธิบาย และไม่สามารถดูตัวอย่างสแนปชอตของเว็บไซต์ได้ แต่เว็บไซต์ สแน็ปช็อตได้รับการอัปเดตทุกวันเกี่ยวกับปัญหานี้ สาเหตุคืออะไร ผู้เขียนจะพูดคุยกับคุณเกี่ยวกับสาเหตุและวิธีแก้ไขปัญหานี้
1. ปัญหาที่เกิดจากไฟล์ robots.txt
โดยทั่วไป เหตุการณ์นี้จะเกิดขึ้นเมื่อ URL ใดถูกตั้งค่าเป็น "nofollow, noindex" ใน Robots.txt แม้ว่าคำสั่งนี้จะบอกให้เครื่องมือค้นหาไม่ต้องติดตามและรวมลิงก์นี้ไว้ด้วย แต่หากมีลิงก์ภายนอกจำนวนหนึ่งที่ชี้ไปยังลิงก์นี้ เครื่องมือค้นหาอาจรวม URL ดังกล่าวด้วย ในขณะนี้ ชื่ออาจเป็น URL และคำอธิบายอาจว่างเปล่า แน่นอนว่าสถานการณ์นี้ส่วนใหญ่เกิดขึ้นกับเครื่องมือค้นหาของ GOOGLE เป็นเรื่องยากที่ Baidu จะรวมลิงก์ "nofollow, noindex" แต่ความเป็นไปได้นี้ไม่ได้ถูกตัดออก
ผู้เขียนได้ปรับเว็บไซต์ให้เหมาะสมสำหรับลูกค้าเมื่อเดือนที่แล้ว และปัญหานี้ก็เกิดขึ้นเช่นกัน เนื่องจากไฟล์ robots.txt ได้รับการแก้ไข ส่งผลให้ภาพรวมของชื่อเว็บไซต์และคำอธิบายไม่สมบูรณ์ ฉันค้นหาสาเหตุมาหลายวันแล้ว และไม่เห็นผลลัพธ์ใด ๆ ฉันคิดว่าอาจเป็นปัญหากับ robots.txt แต่ฉันพบมันโดยไม่ได้ตั้งใจดังนั้นฉันจึงแก้ไขทันที ส่งผลให้เว็บไซต์กลับมาเป็นปกติในวันรุ่งขึ้น ดังนั้น แนะนำให้เพื่อนๆ ที่ประสบปัญหานี้ต้องตรวจสอบไฟล์ robots.txt
2. การเปลี่ยนแปลงเนื้อหาและชื่อเว็บไซต์
นี่เป็นสถานการณ์ที่ร้ายแรงกว่า เช่น หลังจากที่ชื่อ คำอธิบาย หรือเส้นทาง URL ของเว็บไซต์ของคุณทั้งหมดหรือส่วนใหญ่ได้รับการแก้ไขแล้ว ซึ่งจะทำให้เพจเสียจำนวนมากและจะสูญเสียความน่าเชื่อถือของเครื่องมือค้นหา หลังจากที่เพจหายไปจากเสิร์ชเอ็นจิ้นจะเริ่มรวมเพจอีกครั้งเนื่องจากลิงก์ภายนอกไปยังเพจ ในขณะนี้ คำอธิบายก็มีแนวโน้มว่าจะว่างเปล่าเช่นกัน
หลังจากการแก้ไขเว็บไซต์หรือการเปลี่ยนแปลงขนาดใหญ่ ขอแนะนำให้ตั้งค่าโรบ็อตเพื่อห้ามการรวบรวมข้อมูลหน้าข้อผิดพลาดและการสร้างหน้าข้อผิดพลาด 404 ซึ่งสามารถลดการสูญเสียผู้ใช้ในด้านหนึ่ง และในทางกลับกัน ก็สามารถบอกสไปเดอร์ได้ นี่เป็นที่อยู่ที่ไม่ถูกต้องและเป็นสิ่งต้องห้าม สไปเดอร์จะรวบรวมข้อมูลหน้าเว็บที่ไม่มีอยู่ และในช่วงเวลานี้จะคอยอัปเดตเนื้อหาต้นฉบับและลิงก์ภายนอกคุณภาพสูงสำหรับเว็บไซต์
3. ความสามารถของ Baidu ในการเก็บข้อมูลยังไม่เพียงพอ
พบว่าสถานการณ์นี้เกิดขึ้นสาเหตุหลักมาจากความสามารถของ Baidu ในการรวบรวมข้อมูลไม่แข็งแกร่งเพียงพอ โดยเฉพาะอย่างยิ่งสำหรับเว็บไซต์ที่ใช้ CDN โดยทั่วไปแล้ว โปรแกรมรวบรวมข้อมูล Baidu จะแคช IP ของเซิร์ฟเวอร์ที่สอดคล้องกับชื่อโดเมนเป็นเวลานานกว่าหนึ่งวัน เมื่อสไปเดอร์รวบรวมข้อมูลเว็บไซต์ จะไม่แคชบันทึก DNS ตามโปรโตคอล DNS แต่จะแคช บันทึก DNS นานกว่าหนึ่งวัน ดังนั้นเมื่อสไปเดอร์รวบรวมข้อมูลเว็บไซต์ จะไม่แคชบันทึก DNS ตามโปรโตคอล DNS หาก CDN เปลี่ยน IP Baidu Spider จะยังคงรวบรวมข้อมูล IP เซิร์ฟเวอร์เก่าที่ไม่สามารถเข้าถึงได้ ภายในหนึ่งวัน ซึ่งจะทำให้ข้อมูลของโหนดบางแห่งไม่ได้รับการรวบรวมข้อมูล และชื่อเว็บไซต์และคำอธิบายจะไม่แสดงอย่างถูกต้อง
ความสามารถในการวิเคราะห์และประมวลผลข้อมูลของ Baidu ยังคงต้องได้รับการเสริมความแข็งแกร่ง เว็บมาสเตอร์ที่เจอสถานการณ์นี้ไม่จำเป็นต้องตื่นตระหนก เพราะปกติจะกลับสู่สภาวะปกติภายในหนึ่งสัปดาห์
สุดท้ายนี้ ให้ฉันบอกเพื่อนผู้ดูแลเว็บของฉันว่าหากคุณไม่พบปัญหาเมื่อตรวจสอบเว็บไซต์และปัจจัยภายนอกไซต์ อย่าเพิ่งตกใจไป อาจเป็นปัญหากับ Baidu เองหรือการปรับฐานข้อมูลภายใต้สถานการณ์ปกติ จะฟื้นตัวได้ตามปกติภายในหนึ่งสัปดาห์ ในช่วงเวลานี้ คุณควรวิเคราะห์สิ่งที่เกิดขึ้นภายในและภายนอกไซต์ของคุณต่อไป
บทความนี้สนับสนุนโดยเว็บมาสเตอร์ ของ http://www.gzhj-gb.com ขอขอบคุณสำหรับความร่วมมือของคุณ
บรรณาธิการบริหาร: พื้นที่ส่วนตัวของ Yang Yang ผู้แต่ง Langli Taojin