ก่อนอื่น ฉันจะพูดถึงการรวบรวมเนื้อหาที่เพิ่งเปิดตัวอย่างรวดเร็วของ Baidu บนเว็บไซต์ ฉันจะบอกคุณถึงหลักการในการรวบรวมและการรวบรวมข้อมูลของเว็บไซต์ Baidu เพื่อให้คุณสามารถเข้าใจตัวอย่างที่แสดงด้านล่างได้ดียิ่งขึ้น
เกี่ยวกับปัญหาการรวมของ Baidu
เพื่อนหลายคนโพสต์ในฟอรัมว่าเว็บไซต์ของพวกเขาถูกรวบรวมข้อมูลโดยสไปเดอร์ Baidu แต่ไม่ได้รวมไว้หลังจากอ่านบันทึกของ IIS ซึ่งเกี่ยวข้องกับหลักการของเครื่องมือค้นหาของ Baidu
ขั้นแรกเครื่องมือค้นหาจะสร้างแผนที่เว็บ (Webmap) เพื่อบันทึกโครงสร้างลิงค์ของอินเทอร์เน็ต จากนั้นใช้โปรแกรมรวบรวมข้อมูลเว็บ (Robot) เพื่อรวบรวมข้อมูล (Crawl) หน้าเว็บคุณภาพสูงตามแผนที่เว็บและจัดเก็บไว้ใน ฐานข้อมูลสแนปชอตของเว็บเพจ จากนั้นโปรแกรมตัวสร้างดัชนี (Indexer) จะจัดเก็บหมายเลขหน้าเว็บในฐานข้อมูลสแน็ปช็อตลงในฐานข้อมูลดัชนีหน้าเว็บ ในขั้นตอนนี้ เทคโนโลยีที่เกี่ยวข้องจะถูกนำมาใช้เพื่อลบหน้าเว็บที่โกง (Spam) เมื่อผู้ใช้ป้อนคำค้นหาเพื่อค้นหา โปรแกรมคิวรีจะใช้คำค้นหานี้เพื่อเปรียบเทียบในฐานข้อมูลดัชนี หลังจากคำนวณความเกี่ยวข้องแล้ว หน้าเว็บจะถูกจัดเรียงตามระดับความเกี่ยวข้องยิ่งสูง อันดับที่สูงขึ้น การคำนวณความเกี่ยวข้องเป็นผลลัพธ์ที่ครอบคลุมซึ่งประกอบด้วยปัจจัยต่างๆ เช่น การจับคู่ชื่อเว็บไซต์หรือเนื้อหาหน้าเว็บกับคำค้นหา จำนวนครั้งที่เชื่อมโยงหน้าเว็บ เป็นต้น ตราบใดที่คุณอดทนรอการอัปเดตครั้งต่อไปของเครื่องมือค้นหา คุณสามารถดูเพจของคุณได้
ในเวลาเดียวกัน Baidu ก็มีสถานการณ์นี้เกี่ยวกับการรวมเนื้อหาใหม่: "ถ้าคุณเคยประมูลมาก่อน คุณจะไม่ทำตอนนี้ แต่ถ้าคุณไม่ทำ Baidu จะไม่รวมมัน"
SEOer เคยถามคำถามนี้กับเจ้าหน้าที่ของ Baidu และพวกเขากล่าวว่า:
1. หากคุณเคยทำมาก่อน แต่ถ้าคุณใช้การโกง คุณจะไม่ถูกรวมอยู่ใน Baidu แม้ว่าคุณจะเสนอราคาก็ตาม
2.ถ้าประมูลแล้วหยุดรวมแสดงว่าทำมาระยะหนึ่งแล้วบอกว่าถ้าทำเกินครึ่งปีจะรวมแน่นอนแต่ผมไม่เชื่อ สิ่งที่พวกเขาพูด นอกจากนี้ยังขึ้นอยู่กับสถานการณ์ของไซต์ของคุณเอง ไม่ว่าจะเป็นไซต์ใหม่หรือไซต์เก่า ไม่ว่าจะไม่เคยถูกรวมไว้หรือถูกรวมไว้ และคุณจะทำการวิเคราะห์ตามสถานการณ์เฉพาะ
ข้างต้นเป็นบทสรุปของปัญหา SEOer บางประการที่พบ ฉันหวังว่าจะเป็นข้อมูลอ้างอิงให้ทุกคนได้เรียนรู้
ด้านล่างนี้ ฉันจะวิเคราะห์ "วิธีทำให้ Baidu รวมเนื้อหาที่ออกใหม่อย่างรวดเร็ว" ในแต่ละกรณี:
ก่อนอื่น เรามาดูส่วนหนึ่งของคู่มือชีวิตของ 58 Life Service Navigation Site กันก่อน การสอบเข้าวิทยาลัยในปี 2009 เพิ่งสิ้นสุดลง ฉันคิดว่าเพื่อนๆ หลายคนกำลังเผชิญกับคำถามเกี่ยวกับคะแนนสอบเข้าวิทยาลัย ฉันจึงเปิดทางเข้าวิทยาลัยใหม่ หมวดหมู่คอลัมน์สอบถามคะแนนสอบ:
ฉันใช้เวลาประมาณครึ่งชั่วโมงในช่วงบ่ายเพื่อกรอกหมวดหมู่ของคอลัมน์นี้ แล้วแนะนำไปที่หน้าแรกของ Beijing Navigation ตำแหน่งของอัฒจันทร์ทางด้านขวา ซึ่งเป็นเวลาประมาณ 15.00 น. ต่อมา ฉันอยู่ที่ เว็บไซต์ Baidu: 010.58.com/gaokao/ พบว่ามีบทความเกือบ 33 บทความรวมอยู่ใน Baidu และมีโอกาสที่อัตราการรวมจะอยู่ที่ 90%
คุณต้องสับสนมาก! เหตุใด Baidu จึงถูกรวมไว้ในช่วงเวลาสั้น ๆ และอัตราการรวมค่อนข้างสูง มาดูประเด็นต่อไปนี้ที่ฉันสรุปปัญหาของการรวมอย่างรวดเร็วของ Baidu เพื่อใช้อ้างอิง:
1. ก่อนอื่น ฉันขอแนะนำคอลัมน์ที่เพิ่งเปิดใหม่ในหน้าแรกของการนำทางชีวิต หน้าแรกของการนำทางชีวิตปักกิ่ง pr5, alexa เพิ่มขึ้นจาก 1120 ในปี 2551 เป็น 659 ฉันเชื่อว่าน้ำหนักของหน้าแรกนี้ค่อนข้างมาก มาก ฉันใส่คอลัมน์ที่เพิ่งเปิดใหม่ คอลัมน์ที่แนะนำในหน้าแรกจะได้รับการสนับสนุนจากลิงก์ภายนอกที่มีน้ำหนักมากและ Baidu จะรวมไว้อย่างรวดเร็ว ฉันไม่คิดว่าจะมีข้อสงสัยเกี่ยวกับเรื่องนี้ หากคุณเผยแพร่เนื้อหาใหม่ในอนาคต คุณสามารถแนะนำได้ที่หน้าแรกของเว็บไซต์ของคุณเองเพื่อลองใช้เอฟเฟกต์
2. จากนั้นดูเฉพาะเวลาที่ฉันแนะนำและเผยแพร่ คุณจะเห็นว่าเวลาที่ฉันแนะนำคือประมาณ 15.00 น. ฉันพบว่าโดยทั่วไป Baidu จะอัปเดตฐานข้อมูลประมาณ 15.00 น. ถึง 16.00 น. นี่เป็นเวลาที่แน่นอนสำหรับพวกเขา ฐานข้อมูลและเนื้อหาที่ฉันเพิ่งโพสต์จะถูกรวมและแสดง
ครั้งหนึ่งฉันสงสัยว่าเวลาที่ฉันตัดสินนั้นผิด และฉันจงใจแนะนำเพจไปที่หน้าแรกของ Beijing Life Navigation เมื่อฉันไม่ได้อัปเดตโดยพวกเขาในครึ่งชั่วโมงต่อมา แต่มันก็เป็นเช่นนั้น ไม่รวมอยู่ใน Baidu ในเรื่องนี้ฉันไม่กล้าพูด 100% เมื่อพิจารณาจากเวลานี้ว่าเวลาอัปเดตฐานข้อมูล Baidu คือประมาณ 16.00 น. เพราะไม่มีอะไรสามารถสรุปได้ในบทความเดียวเหมือนกับที่ฉันบอกว่า 90% รวมอยู่ด้วย ในครึ่งชั่วโมง แต่ยังมีอีก 10% ที่ยังไม่ได้รวมไว้ บางทีหน้าที่ฉันฝึกอาจเป็นเพียง 10% เท่านั้น ดังนั้นฉันหวังว่าคุณจะได้จุดเวลาอัปเดตฐานข้อมูล Baidu เท่านั้น จะฝึกฝนให้มากกว่านี้ มีความแม่นยำในการพิสูจน์สิ่งนี้
3. ในที่สุด ฉันได้ฝึกปฏิบัติเล็กๆ น้อยๆ อีกประการหนึ่งเพื่อพิสูจน์วิจารณญาณครั้งแรกของฉัน เมื่อฉันทำเนื้อหาในคอลัมน์ทางการแพทย์ใน Life Guide: "ที่อยู่โรงพยาบาลปักกิ่ง 301 รายการเส้นทางโทรศัพท์และรถประจำทาง"
http://010.58.com/yiyuan/4255.shtml เนื้อหาของบทความที่นี่ทั้งหมดได้รับการจัดระเบียบด้วยตนเองและไม่ได้คัดลอกและวางดังนั้นจึงเป็นต้นฉบับหลอกและเหมาะสำหรับการรวบรวมข้อมูลของเครื่องมือค้นหา แต่ฉันไม่แนะนำ ในหน้าแรกของ Life Navigation เผยแพร่มาเป็นเวลาหนึ่งสัปดาห์แล้ว แต่ก็ยังไม่รวมอยู่ใน Baidu จากนั้นฉันก็แนะนำบางส่วนในตอนเช้า แต่ก็ยังไม่รวมอยู่ใน Baidu เวลาที่ Baidu อัพเดตฐานข้อมูล
ฉันเชื่อว่าผู้ดูแลเว็บจำนวนมากต้องการให้ทุกบทความที่พวกเขาเผยแพร่มีคุณค่า สามารถดึงดูดผู้เข้าชมได้ และในขณะเดียวกันก็ตอบสนองความต้องการของผู้ใช้ ที่นี่เราต้องปล่อยให้ Baidu รวมเนื้อหาล่าสุดที่เราเผยแพร่อย่างรวดเร็ว และเป็นการดีที่สุดที่จะมีทั้งหมด ซึ่งรวมโดย Baidu ทุกคนอย่าลืมค้นหาเวลาที่ Baidu อัปเดตฐานข้อมูล และเข้าใจทรัพยากรที่มีอยู่อย่างยืดหยุ่น เช่น การสนับสนุนลิงก์ภายนอกสำหรับไซต์ที่มีน้ำหนักมาก การสนับสนุนน้ำหนักสำหรับคอลัมน์ที่แนะนำ SEOers จำนวนมากที่เขียนคอลัมน์มี iResearch คอลัมน์, admin5, Matador ฯลฯ สำหรับคอลัมน์บนเว็บไซต์ที่มีการถ่วงน้ำหนัก คุณอาจใช้ URL ของเนื้อหาบทความต้นฉบับที่เพิ่งเปิดตัวเพื่อรองรับลิงก์ภายนอกจากแหล่งข้อมูลที่มีน้ำหนักมาก เมื่อรวมแล้ว คุณสามารถยกเลิกลิงก์ภายนอกและรีไซเคิลได้ ซึ่งจะช่วยให้ Baidu รวมเว็บไซต์ของคุณได้อย่างรวดเร็ว
ช่วงนี้ฉันยุ่งอยู่กับหลายๆ อย่าง และไม่ได้เขียนบล็อกเลย ฉันรู้สึกว่าตัวเองเสียเวลาไปกับการเชื่อมต่ออินเทอร์เน็ตไปมากแล้ว การเรียนของฉันในอนาคต บล็อก Xu Qian SEO www.hongren.org ยินดีต้อนรับทุกคนที่มาบ่อยๆ