เป็นที่ทราบกันดีว่าเว็บไซต์ได้รับการจัดทำดัชนีอย่างดีหรือไม่นั้นสัมพันธ์กับความถี่ของการรวบรวมข้อมูลแบบสไปเดอร์และหน้าที่รวบรวมข้อมูลหรือไม่ อย่างไรก็ตาม เราไม่ทราบว่าหน้าเว็บใดที่สไปเดอร์รวบรวมข้อมูล ดังนั้นเราจึงทำได้เพียงบันทึกการเข้าถึงที่รวบรวมข้อมูลโดย แมงมุมเพื่อการวิเคราะห์ เราสามารถวิเคราะห์ข้อมูลได้มากมายจากบันทึก ดังนั้นวันนี้ฉันจะอธิบายให้คุณทราบเป็นหลักถึงปัจจัยที่ส่งผลต่อการรวบรวมข้อมูลของแมงมุมและเวลาในการรวบรวมข้อมูล อย่าประมาทบันทึกนี้ เพราะสามารถช่วยให้คุณทราบว่าเว็บไซต์มีความหมายต่อแมงมุมหรือไม่ ระบุไม่ว่าสไปเดอร์จะชอบเว็บไซต์ของคุณหรือไม่ หากจำนวนการรวบรวมข้อมูลมีขนาดใหญ่ คุณก็สามารถสรุปได้ว่าเว็บไซต์นั้นเหมาะสำหรับสไปเดอร์มาก หากสไปเดอร์ไม่มาสองสามวันคุณต้องตรวจสอบว่าเป็นเช่นนั้น เว็บไซต์ ไม่มี "อาหาร" ที่แมงมุมชอบ นี่คือประเด็นที่เกี่ยวข้องที่ส่งผลต่อการคลาน:
ปัจจัยที่ 1 ที่ส่งผลต่อการรวบรวมข้อมูลของแมงมุม: มีแผนผังเว็บไซต์หรือไม่
สำหรับแมงมุม แผนที่เว็บไซต์เป็นแผนที่ถนนสำหรับการรวบรวมข้อมูล เมื่อแมงมุมมีแผนที่ถนนนี้ การรวบรวมข้อมูลบนเว็บไซต์จะไม่ต้องใช้กำลังมาก และจะไม่รู้สึกเวียนหัวตลอดเวลา แผนที่เว็บไซต์ถูกใช้โดยสไปเดอร์โดยเฉพาะ จุดประสงค์คือ เพื่อลดเวลาการรวบรวมข้อมูลของแมงมุมและเร่งความเร็วในการรวบรวมข้อมูลของแมงมุม อย่างไรก็ตาม หากเว็บไซต์ของคุณไม่มีแผนที่ หากไม่มีแผนที่ คุณต้องพึ่งพาการค้นหาแบบลับๆ ฉันไม่รู้ว่าจะต้องใช้เวลาอีกนานแค่ไหน ดังนั้นในทำนองเดียวกัน แผนที่เว็บไซต์ก็มีความสำคัญไม่แพ้กันกับสไปเดอร์ อย่าบันทึกอะไรโดยไม่มีแผนที่ มันคือการเตรียมการก่อนสงคราม ทิศทางระหว่างสงคราม และบทสรุปหลังสงคราม
ปัจจัยที่สองที่ส่งผลต่อการรวบรวมข้อมูลแบบสไปเดอร์คือต้องตั้งค่าหน้า 404 หรือไม่
เว็บไซต์หลายแห่งไม่สนใจเรื่องนี้เลย ตามประสบการณ์จริงของผู้เขียน สิ่งนี้สำคัญมากสำหรับเว็บไซต์ที่มีลิงก์เสีย เพราะสามารถช่วยให้เว็บไซต์บอกแมงมุมได้ว่าเมื่อมันคลานไปยังทางตัน ให้มัน หนทางที่จะกลับมามีชีวิตอีกครั้ง หน้า 404 ได้เตรียมการไว้เพื่อป้องกันไม่ให้สไปเดอร์เข้าสู่ทางตันและไม่สามารถออกไปได้ ใครสามารถรับประกันได้ว่าเว็บไซต์ของพวกเขาจะไม่มีลิงก์เสีย บนเว็บไซต์มีความสำคัญมาก หากเว็บไซต์มีลิงก์เสียมากเกินไปและไม่มีหน้า 404 เมื่อคุณใช้เครื่องมือของผู้ดูแลเว็บเพื่อสอบถามและวิเคราะห์ คุณจะพบว่ามีการรวบรวมข้อมูลหน้าเว็บหลายหน้าอย่างไม่ถูกต้อง แมงมุมและทำให้แมงมุมสร้างความรู้สึกถูกปฏิเสธ ดังนั้นจึงต้องเพิ่มหน้า 404 ลงในเว็บไซต์ จึงไม่กินพื้นที่มากนัก แล้วทำไมไม่เพิ่มเข้าไปล่ะ
ปัจจัยที่สามที่ส่งผลต่อการรวบรวมข้อมูลของ Spider คือมีลิงก์ที่ส่งออกมากเกินไปหรือไม่
ลิงก์ส่งออกที่มากเกินไปบนเว็บไซต์จะมีผลกระทบอย่างมากต่อความเข้มข้นของน้ำหนักของเว็บไซต์ และจะมีผลอย่างมากต่อเวลาอยู่ของสไปเดอร์ เพราะเมื่อสไปเดอร์รวบรวมข้อมูลเว็บไซต์ของคุณ มันมักจะรวบรวมข้อมูลตั้งแต่ต้นจนจบ จากนั้นแมงมุมก็คลานตามวิธีจัดลำดับความกว้าง และบางครั้งก็ตามวิธีจัดอันดับเชิงลึก เมื่อมันคลานตามวิธีจัดลำดับความกว้าง มันก็คลานไปจนสุดแต่ยังไม่ได้เข้าสู่หน้าภายใน ลิงก์ส่งออก จากนั้นสไปเดอร์จะติดตามลิงก์ส่งออกด้วย นี่คือเหตุผลว่าทำไมแมงมุมที่คุณพบเห็นบ่อยๆ แต่ไม่มีหน้าใดๆ ดังนั้นเว็บไซต์ไม่ควรตั้งค่าลิงก์ส่งออกมากเกินไป เนื่องจากจะไม่เกิดประโยชน์ใดๆ กับเว็บไซต์ของคุณ
ปัจจัยที่สี่ที่ส่งผลต่อการรวบรวมข้อมูลของ Spider คือมีลิงก์ที่นำเข้าน้อยเกินไปหรือไม่
เมื่อเปรียบเทียบกับลิงก์ส่งออก ยิ่งลิงก์นำเข้ามากก็ยิ่งดี ลิงก์นำเข้าควรเป็นไปตามหลักการสองประการ: ความกว้างและคุณภาพ คุณภาพต้องมาก่อนปริมาณ ดังนั้น เมื่อเราสร้างลิงก์ที่เข้ามา เราต้องใส่ใจกับคุณภาพของลิงก์ที่เข้ามาก่อน แล้วค่อยติดตามปริมาณ หากคุณพลิกกลับไม่เพียงแต่จะไม่ทำให้เว็บไซต์เป็นมิตรกับเครื่องมือค้นหาเท่านั้น แต่ยังจะทำให้เว็บไซต์เสียคะแนนในสายตาของเครื่องมือค้นหาอีกด้วย เพราะเมื่อคุณติดตามปริมาณ คุณมักจะลืมเรื่องคุณภาพ ส่งผลให้มีลิงก์ขยะมากเกินไปและลิงก์ที่ไม่ถูกต้อง ดังนั้นสิ่งที่สำคัญที่สุดเกี่ยวกับลิงก์ที่เข้ามาคือคุณภาพและความกว้าง เมื่อทั้งสองอย่างรวมกันอย่างดีเท่านั้นที่น้ำหนักอันดับของเว็บไซต์จะเพิ่มขึ้น
สี่ประเด็นข้างต้นสรุปโดยการวิเคราะห์ความเป็นมิตรของเว็บไซต์ต่อเครื่องมือค้นหา สี่ประเด็นนี้เป็นประสบการณ์ของผู้เขียนที่ได้รับจากการฝึกฝน หวังว่ามันจะช่วยให้คุณเข้าใจเว็บไซต์ได้ไม่มากก็น้อย ในทางกลับกัน เว็บไซต์ของคุณจะถูกรวมไว้ดีขึ้น มีน้ำหนักมากขึ้น สแนปช็อตที่อัปเดต และอันดับที่ดีขึ้น บทความนี้จัดทำขึ้นโดย http://www.yisoo.org (Yisoo Cinema) โดยเฉพาะ โปรดทิ้งลิงก์ไว้เพื่อพิมพ์ซ้ำ ขอขอบคุณ!
บรรณาธิการรับผิดชอบ: พื้นที่ส่วนตัวของผู้เขียน Chen Long yuqing
-