เมื่อพูดถึงหัวข้อนี้คุณอาจต้องการถามว่าทำไมเราต้องบำรุงรักษาหุ่นยนต์แมงมุมเหล่านี้ด้วย ฉันจะอัปเดตเนื้อหาในเว็บไซต์ของฉันทุกวันไม่ได้หรือ ฉันไม่สนใจว่าหุ่นยนต์แมงมุมเหล่านี้จะมาหรือไม่ เว็บไซต์ ไม่เป็นไรถ้าคุณสร้างไว้ดูคนเดียว แต่เว็บไซต์ของเราไม่ได้สร้างมาเพื่อให้คุณดูเพลินที่บ้าน แต่เพื่อให้คุณวิเคราะห์ความสุขร่วมกับทุกคน ดังนั้นเราจึงต้องปฏิบัติต่อหุ่นยนต์แมงมุมเหล่านี้ในฐานะแขกผู้มีเกียรติและดูแลพวกมันอย่างดี ตอนนี้เรามาพูดถึงวิธีการเลี้ยงดูพวกเขากันดีกว่า
1. วิเคราะห์กิจกรรมของหุ่นยนต์สไปเดอร์ Baidu และ Google
วิธีที่ง่ายที่สุดคือการดูบันทึก IIS ของเซิร์ฟเวอร์ แต่นั่นมีไว้สำหรับผู้ที่มีเซิร์ฟเวอร์ของตนเองเท่านั้น หรือมีให้ในเว็บไซต์ของผู้ให้บริการพื้นที่บางแห่ง และเว็บไซต์ส่วนใหญ่ไม่สามารถมองเห็นได้ แล้วคุณจะเห็นข้อมูลอันมีค่านี้ได้อย่างไร? ฉันแนะนำซอร์สโค้ดให้กับทุกคน: Luzhu CMS พื้นหลังของซอร์สโค้ดของเว็บไซต์นี้สามารถบันทึกร่องรอยของโรบ็อตการค้นหาที่สำคัญได้อย่างชัดเจน โดยมีเวลาของการเยี่ยมชมของโรบ็อตแต่ละตัว หน้าที่เยี่ยมชม และข้อมูลรายละเอียดของการเยี่ยมชมนั้นได้รับการวิเคราะห์ และดำเนินการตลอด 24 ชั่วโมง การวิเคราะห์ส่วน การวิเคราะห์แต่ละช่อง และการวิเคราะห์ส่วนของเนื้อหาที่คุณเพิ่ม จะวิเคราะห์ว่าช่องและส่วนใดของเว็บไซต์ของคุณที่โรบ็อตการค้นหาหลักๆ ชอบ และยังให้คำแนะนำในการแก้ไขช่องและส่วนอื่นๆ อีกด้วย
ผมขอยกตัวอย่างวิธีการทำกิจกรรมโดยละเอียดของ Baidu และ Google ให้กับคุณ แน่นอนว่าวิธีการของแต่ละเว็บไซต์นั้นแตกต่างกันออกไป ตอนนี้ผมจะยกตัวอย่างเว็บไซต์ Luzhu ของผมให้คุณฟัง หุ่นยนต์แมงมุมของ Baidu ชอบรวบรวมข้อมูลหน้าแรกของเว็บไซต์มากที่สุด และจะรวบรวมข้อมูลทุกๆ ห้านาที นอกจากนี้ยังสามารถเข้าใจได้ว่า Baidu ใช้หน้าแรกของเว็บไซต์เป็นจุดเริ่มต้น จากนั้นจึงค้นพบว่ามีความแตกต่างระหว่าง หน้าแรกของลิงค์ครั้งนี้และครั้งสุดท้ายพวกเขาจะรวบรวมข้อมูลไปยังหน้าลิงค์ใหม่ทันที Google แตกต่างออกไป มันจะไม่รวบรวมข้อมูลหน้าแรกของคุณบ่อยนัก แต่ก็มีแผนที่สำหรับแต่ละเว็บไซต์ พวกเขาจะยังคงรวบรวมข้อมูลทุกลิงก์บนเว็บไซต์ของคุณ จากนี้ ไม่ใช่เรื่องยากที่จะเห็นว่า Baidu จะค้นพบเนื้อหาใหม่ของเว็บไซต์ของคุณอย่างรวดเร็ว แต่ Google จะไม่ค้นพบเนื้อหาใหม่ของคุณอย่างรวดเร็ว ฉันจำได้ครั้งหนึ่งหลังจากเพิ่มเนื้อหาลงในเว็บไซต์ของฉัน ฉันก็ตรวจสอบบันทึกของโปรแกรมรวบรวมข้อมูล Spider ทันทีที่ Baidu รวบรวมข้อมูลผ่านเนื้อหานั้น ฉันไปที่ Baidu เพื่อดาวน์โหลดเว็บไซต์และรวมเนื้อหานั้นไว้ด้วย แน่นอนว่าเนื้อหานี้เป็นบทความเบาๆ ที่เขียนเอง ซึ่งเป็นบทความที่ Baidu มองว่าเป็นบทความต้นฉบับจึงรวบรวมไว้อย่างรวดเร็ว
2. อย่าแก้ไขเว็บไซต์บ่อยๆ หรือเปลี่ยนแปลงเล็กน้อย
เหตุใดคุณจึงพูดเช่นนี้ Baidu และ Google จะบันทึกข้อมูลบางอย่างเกี่ยวกับเว็บไซต์ของคุณลงในฐานข้อมูลของพวกเขา หน้าเว็บที่รวบรวมข้อมูลในครั้งนี้จะถูกเปรียบเทียบและวิเคราะห์กับหน้าเว็บที่รวบรวมข้อมูลในครั้งล่าสุด เช่นเดียวกัน สำหรับเว็บไซต์ใหม่ การรวบรวมข้อมูลแบบสไปเดอร์จะถูกระงับเป็นระยะเวลาหนึ่ง ซึ่งหมายความว่าเว็บไซต์ของคุณจะเข้าสู่ช่วงสังเกตการณ์ทันที ในระหว่างนี้ พวกมันจะไม่มาบ่อยนัก ซึ่งหมายความว่า Baidu และ Google จะไม่รวมคุณไว้ด้วย ในช่วงเวลานี้ อำนาจของเพจของคุณอาจถูกลดระดับด้วย ฉันจำได้ว่าฉันเปลี่ยนเทมเพลตของเว็บไซต์หนึ่งครั้งในเดือนพฤษภาคม ทั้งสองเทมเพลตนั้นแตกต่างกันมาก เคยมีบางหน้าถูกรวมไว้ไม่มากก็น้อยทุกวัน หลังจากที่ฉันเปลี่ยน พวกเขาก็หยุดฉันประมาณหนึ่งสัปดาห์และ ไม่รวมหน้ารวมปริมาณก็ลดลงมากเช่นกัน นี่เป็นการเปลี่ยนแปลงที่ครอบคลุมบนเว็บไซต์ ฉันจำได้อีกครั้งในเดือนนี้ ฉันเพิ่มลิงก์ภายนอกมากกว่า 90 ลิงก์ในสามวัน ซึ่งเป็นการเปลี่ยนแปลงเล็กน้อยบนเว็บไซต์ จนกระทั่งหนึ่งสัปดาห์ต่อมา เมื่อฉันตรวจสอบจำนวนหน้าที่รวมไว้ และจู่ๆ ก็มีหลายร้อยหน้าที่หายไป จำนวนที่อยู่ IP ที่ดาวน์โหลดจาก Baidu และ Google ก็ลดลงเช่นกันเมื่อเทียบกับหมายเลขเดิม
3. เนื้อหาการอัปเดตเว็บไซต์ควรเป็นต้นฉบับหรือต้นฉบับปลอมที่สุดเท่าที่จะเป็นไปได้
ทุกคนรู้ดีว่า Baidu และ Google ชอบบทความต้นฉบับ ดังนั้นหากมีแขกเก่ามาที่บ้านของคุณ คุณจะต้องรู้จักอาหารจานโปรดและชาของเขา เรารู้ว่า Baidu และ Google ชอบสิ่งนี้ ทำไมเราไม่ใช้ประโยชน์จากสิ่งนี้ให้เป็นประโยชน์ล่ะ หากคุณอ่าน Sina และเว็บไซต์ดังๆ บ่อยๆ คุณจะพบว่าบางครั้งบทความเหล่านั้นไม่จำเป็นต้องเป็นบทความต้นฉบับ แต่เพื่อตอบสนองรสนิยมการค้นหาแบบสไปเดอร์ พวกเขาก็จะประมวลผลบทความบางส่วนด้วย ซึ่งเป็นบทความปลอม อีกครั้งที่มีข้อมูลมากมายอัพเดททุกวันบนอินเทอร์เน็ต จึงมีผลงานต้นฉบับมากมาย เช่นเดียวกับเรา มีคนดีและคนไม่ดี เว็บไซต์ที่มีชื่อเสียงมีส่วนร่วมในการประมวลผลแบบหลอกๆ ในฐานะผู้ดูแลเว็บขนาดเล็กและขนาดกลาง ทำไมเราไม่ทำเช่นนี้ หุ่นยนต์ของ Baidu และ Google ไม่ใช่เทพเจ้า แต่เป็นโปรแกรมที่เขียนโดยมนุษย์และดำเนินการด้วย เป็นไปไม่ได้ที่จะดำเนินการวิเคราะห์บทความปัจจุบันทุกบทความภายใต้โปรแกรมอย่างสมบูรณ์ เมื่อเราเพิ่มเนื้อหาลงในเว็บไซต์ของเรา ทำไมไม่เพิ่มเนื้อหาหลอกต้นฉบับจำนวนมากเพื่อเพิ่มการครอบคลุมเว็บไซต์ของเรา
4. ความทันเวลาของเนื้อหาการอัพเดตเว็บไซต์
ดังที่ได้กล่าวไว้ก่อนหน้านี้ Baidu และ Google จะรวบรวมข้อมูลเว็บไซต์ของคุณหลายครั้งต่อวัน และเราต้องใช้ประโยชน์จากสิ่งนี้ ดังนั้นเว็บไซต์ของเราเองควรอัปเดตเนื้อหาให้ทันเวลาเพื่อให้พวกเขาสามารถได้รับบางสิ่งบางอย่างเมื่อมาและจะมาบ่อยขึ้นเพื่อให้การรวมของคุณมีมากขึ้น ตามที่กล่าวไว้ข้างต้น คุณสามารถสร้างบทความปลอมได้เมื่ออัปเดตเนื้อหาเว็บไซต์ หากคุณสร้างบทความปลอมไม่เก่ง คุณเพียงแค่ต้องขยันหมั่นเพียร เมื่อบทความปรากฏบนเว็บไซต์ คุณก็สามารถอัปเดตบทความนั้นไปยังเว็บไซต์ของคุณได้ทันท่วงที จากนั้น Baidu และ Google อาจไม่ได้รวมไว้ในขณะนั้น และพวกเขาอาจเข้าใจผิดว่าเนื้อหาบนเว็บไซต์ของคุณเป็นต้นฉบับ หากคุณอัปเดตเนื้อหาเว็บไซต์ของคุณเป็นประจำตามเวลาที่กำหนด แม้ว่าจะเป็นผลงานต้นฉบับของผู้อื่น Baidu และ Google จะรวมทุกหน้าของคุณ
โดยสรุป หากเว็บไซต์ของเราต้องการให้ Baidu และ Google รวมเป็นจำนวนมากทุกวัน เราต้องมีความเข้าใจอย่างลึกซึ้งเกี่ยวกับเวลากิจกรรมและวิธีการของสไปเดอร์บนเว็บไซต์ของคุณ อย่าเปลี่ยนเลย์เอาต์ และเพิ่มบางส่วน บทความต้นฉบับในเวลาที่เหมาะสม
ข้างต้นเป็นความคิดเห็นของฉันเองซึ่งค่อนข้างผิวเผิน คุณสามารถแก้ไขฉันและสื่อสารกับฉันได้ที่ http://www.luzhuba.cn