เมื่อวันที่ 25 มิถุนายน ผู้เขียนได้ตีพิมพ์บทความ "การใช้การเปลี่ยนเส้นทาง 301 อย่างชาญฉลาดเพื่อแปลงข้อผิดพลาด 404 เป็นลิงก์ภายนอกของเว็บไซต์" และพูดคุยเกี่ยวกับวิธีใช้การเปลี่ยนเส้นทาง 301 เพื่อแปลง URL ข้อผิดพลาดที่ได้รับจากภายนอกให้เป็น URL ที่สามารถเข้าถึงได้ เพื่อให้บรรลุผล การถ่ายโอนบทความถ่วงน้ำหนัก
วันนี้ฉันเห็นบทความใน A5 ชื่อ "การอภิปรายสั้น ๆ เกี่ยวกับอันตรายของการใช้การเปลี่ยนเส้นทาง 301 เพื่อถ่ายโอนหน้า 404 ไปยังลิงก์ภายนอกของคุณเอง" ซึ่งหักล้างความคิดเห็นในบทความก่อนหน้าของฉัน ฉันคิดว่ามันดีมาก อุตสาหกรรม SEO ควรมีจิตวิญญาณของการตั้งคำถามและมีความสามารถในการคิดอย่างเป็นอิสระ ฉันอ่านบทความอย่างละเอียดและพบว่าผู้เขียนเข้าใจความหมายของฉันผิด ผมจะเขียนอีกบทความหนึ่งเพื่อชี้แจงมุมมองและแนะนำบทบาทของการเปลี่ยนเส้นทาง 301 อันดับแรก ฉันอธิบายแนวคิดสองประการในบทความ "การใช้ 301 Redirect เพื่อแปลงข้อผิดพลาด 404 เป็นลิงก์ภายนอกของเว็บไซต์":
บทความนี้พูดถึงการเปลี่ยนเส้นทาง URL ข้อผิดพลาด 404 กลับไปยัง URL ดั้งเดิมผ่าน 301 ประเด็นนี้ต้องอธิบาย ฉันไม่ได้พูดถึง 301 ใด ๆ ไปยังหน้าแรกหรือหน้าอื่น ๆ ในบทความ ตัวอย่างในบทความนี้เกี่ยวกับการเชื่อมโยงจากเว็บไซต์ภายนอก (เว็บไซต์ B) ไปยังเว็บไซต์ของตัวเอง (เว็บไซต์ A) อาจเกิดขึ้นในกระบวนการนี้ การสะกด URL ผิด การเพิ่มลิงก์ผิด หรือแม้แต่จงใจสร้าง URL ผิด แทนที่จะเป็นข้อผิดพลาด 404 บนเว็บไซต์ A เอง
ข้อความต้นฉบับจะอยู่ที่นั่นเสมอ และเพื่อนๆ ที่มีคำถามสามารถอ่านอย่างละเอียดได้ ผมขอหักล้างมุมมองของเพื่อนคนนี้ด้านล่าง (คำสีฟ้าคือความคิดเห็นของเพื่อนที่มีความคิดเห็นโต้แย้ง):
หักล้างย่อหน้าแรก
ผู้เขียนต้นฉบับระบุถึงข้อผิดพลาด 404 ในลิงก์ภายนอกที่ชี้ไปยังด้านนอกของเว็บไซต์ อย่างไรก็ตาม การเกิดข้อผิดพลาด 404 นี้จะถูกกำหนดโดยโปรแกรมเว็บไซต์ของตัวเองเช่นกัน หลีกเลี่ยงมันเช่น อาจมีหน้า 404 จำนวนมากที่มีส่วนต่อท้ายเช่นนี้หรือหน้านั้นในหน้า A5 เพียงเพิ่ม 1.html และ 2.html ต่อท้ายแค่นั้นเอง เช่นเดียวกับหน้าเว็บนี้นั่นคือการนำลิงก์ไปยังเว็บไซต์นั่นเอง อย่างมากก็จะสร้างหน้า 404 และไม่มีอะไรอื่นอีก
หากเกิดข้อผิดพลาด 404 บนเว็บไซต์ ก็ไม่จำเป็นต้องเป็นปัญหากับโปรแกรมภายในของเว็บไซต์ หากสไปเดอร์รวบรวมข้อมูลไปยังเว็บไซต์ของตัวเอง (ใช้เว็บไซต์ A เป็นตัวอย่าง) ผ่าน URL ที่ไม่ถูกต้องบนเว็บไซต์ภายนอก (ใช้เว็บไซต์ B เป็นตัวอย่าง) ก็จะทำให้เกิดข้อผิดพลาด 404 เช่นกัน กล่าวคือ URL ที่ไม่ถูกต้องนำไปสู่ หน้าผิด สไปเดอร์ไม่สนใจว่า URL ที่เชื่อมโยงของคุณมีอยู่ภายในหรือภายนอกเว็บไซต์ ตราบใดที่ "ไม่มีเพจ" เกิดขึ้นระหว่างการรวบรวมข้อมูลตาม URL ข้อผิดพลาด 404 จะถูกบันทึก
เราจะเห็นสิ่งนี้ได้อย่างชัดเจนในคอลัมน์ "สถานะการดำเนินการ" - "ข้อผิดพลาดในการรวบรวมข้อมูล" - "ไม่พบ" ของเครื่องมือผู้ดูแลระบบของ Google ข้อผิดพลาด 404 แบ่งโดย Google ออกเป็นสองหมวดหมู่: "ในแผนผังไซต์" (สาเหตุภายใน) และ "โดเมนที่เชื่อมโยงกับหน้าเว็บไซต์ของคุณ" (สาเหตุภายนอก)
ตามชื่อที่แนะนำ "โดเมนที่เชื่อมโยงไปยังหน้าเว็บไซต์ของคุณ" หมายถึง URL ที่เชื่อมโยงจากเว็บไซต์ B ไปยังเว็บไซต์ A
ย่อหน้าที่สองของการโต้แย้ง
ผู้เขียนต้นฉบับหมายถึงวิธีที่จะเข้าใจน้ำหนักของแง่มุมนี้ และต้องการคืนน้ำหนักของลิงก์ภายนอกนี้โดยตรง แทนที่จะปล่อยมันไป ที่นี่ ผู้เขียนก็มีมุมมองของตนเองเช่นกัน ลิงก์ภายนอกประเภทนี้เอง "http :/ /www.xxxxx.com/rich-snippets.htmlGFQ" ลิงก์ภายนอกประเภทนี้เชื่อมโยงไปยังหน้า 404 หากคุณ 301 หน้าเหล่านี้ สถานการณ์นี้จะเหมือนกับจำนวนหน้า 404 จำนวนมากในเว็บไซต์ และ สถานการณ์ของหน้า 404 และหน้า 301 เหมือนกัน ดังนั้นหากเว็บไซต์ของคุณมีหน้า 404 เพื่อป้องกันการสูญเสียน้ำหนัก หน้าเหล่านี้ทั้งหมดควรเป็น 301 ในหน้าแรก สิ่งนี้ไม่สอดคล้องกับ ข้อกำหนดของเครื่องมือค้นหา หากคุณต้องการ หากคุณรู้ชัดเจน เพียงค้นหา "อันตรายของ 404 หน้า 301 ไปที่หน้าแรก" ใน Baidu แล้วคุณจะรู้มากขึ้น
ประการแรก เครื่องมือค้นหามีความแตกต่างที่ชัดเจนระหว่าง "พฤติกรรมของตัวเอง" และ "พฤติกรรมภายนอก" ใช้การสร้างลิงค์เป็นตัวอย่าง ลิงค์ภายในและลิงค์ภายนอกมีผลกระทบที่แตกต่างกันในแง่ของน้ำหนัก ทุกคนรู้เรื่องนี้ แนวคิดหลักคือลิงก์ภายนอกอยู่นอกเหนือการควบคุมของผู้ดูแลเว็บ ในขณะที่ผู้ดูแลเว็บสามารถตั้งค่าลิงก์ภายในได้ แม้ว่าในกระบวนการพัฒนาเครื่องมือค้นหา แต่ปัจจัยของ "ลิงก์ภายนอกที่ผู้ดูแลเว็บสามารถควบคุมได้" ก็ปรากฏขึ้น (นั่นคือ การสร้างลิงก์ภายนอกทั่วไป) แต่ไม่ว่าจะควบคุมได้หรือควบคุมไม่ได้ก็ตาม แนวคิดหนึ่งที่ชัดเจน นั่นคือ จะไม่มีใครส่ง URL ผิดโดยสมมุติว่าเว็บไซต์ของผู้อื่นสามารถเผยแพร่ URL ที่ถูกต้อง ทำให้ผู้ใช้ไม่สามารถเข้าถึงเว็บไซต์ของตนเองได้ตามปกติหรือ ทำให้ไม่สามารถเข้าถึงเว็บไซต์ของตนเองได้ คำว่า "ไม่มีหน้านี้" ปรากฏบนเว็บไซต์
ประการที่สอง ไม่ว่า 301 จะไปที่หน้าเว็บต้นฉบับหรือ 301 จะไปที่หน้าแรกก็ตาม ฉันไม่อยากจะพูดมากกว่านี้ ทุกคนสามารถเข้าใจสิ่งที่ฉันหมายถึงได้โดยการอ่านข้อความต้นฉบับ สิ่งที่ฉันต้องการจะพูดต่อไปนี้เป็นสัญญาณว่าเครื่องมือค้นหาระบุแหล่งที่มาของข้อความต้นฉบับได้อย่างไร:
ที่ที่เครื่องมือค้นหาเห็นเนื้อหาเป็นอันดับแรก
ความน่าเชื่อถือของชื่อโดเมนที่มีเนื้อหาคล้ายคลึงกันมากมาย
ตำแหน่งที่มีลิงก์มากที่สุด (ลิงก์ภายในในข้อความต้นฉบับ)
ไม่ว่าสำเนาจะลิงก์กลับไปยังแหล่งต้นฉบับหรือไม่ (ลิงก์ลิขสิทธิ์)
เนื่องจากการมีอยู่ของสัญญาณที่สอง เนื้อหาจำนวนมากที่เผยแพร่หรือพิมพ์ซ้ำบนเว็บไซต์อื่นโดยผู้เขียนต้นฉบับของเราไม่สามารถได้รับการจัดอันดับที่ดี ผู้เขียนหลายคนก็บ่นเกี่ยวกับเรื่องนี้เช่นกัน แต่เราสามารถใช้สัญญาณ 1, 3 และ 4 จุดเพื่อแก้ไขข้อผิดพลาดนี้ได้
ไป่ตู้ไม่ค่อยเก่งในเรื่องนี้ แต่ Google สามารถระบุแหล่งที่มาของข้อความต้นฉบับได้อย่างรวดเร็วและแม่นยำ นี่เป็นเพราะ 3 ประเด็นข้างต้น ปัจจัยที่ว่า "การคัดลอกลิงก์กลับไปยังแหล่งต้นฉบับ" ก็เป็นหนึ่งในวัตถุประสงค์ที่อธิบายไว้ในบทความของฉัน "การใช้ 301 Redirect เพื่อแปลงข้อผิดพลาด 404 เป็นลิงก์ภายนอกของเว็บไซต์" มีจุดประสงค์อื่นที่คุณได้เห็นเช่นกัน น้ำหนัก
สุดท้าย เปลี่ยนเส้นทาง URL ที่ไม่ถูกต้องซึ่งผู้ใช้ไม่สามารถเข้าถึง URL ที่ถูกต้องผ่านทาง 301 ในลักษณะที่สมเหตุสมผล นอกจากนี้ยังช่วยในเรื่องประสบการณ์ผู้ใช้อีกด้วย เรายังเห็นประโยคนี้ใน "ข้อผิดพลาดที่พบเมื่อเข้ารวบรวมข้อมูล" ของเครื่องมือผู้ดูแลระบบของ Google
Googlebot ไม่สามารถรวบรวมข้อมูล URL ได้เนื่องจากชี้ไปยังหน้าที่ไม่มีอยู่ โดยทั่วไปแล้ว 404 จะไม่ส่งผลต่อการจัดอันดับเว็บไซต์ของคุณในผลการค้นหา แต่คุณสามารถใช้เพื่อปรับปรุงประสบการณ์ผู้ใช้ได้
วิธีเดียวที่จะแก้ไขข้อผิดพลาด 404 คือการบล็อก robots.txt หรือใช้การเปลี่ยนเส้นทาง 301 ฉันไม่คิดว่าการบล็อกจะปรับปรุงประสบการณ์ผู้ใช้ วิธีการ robots.txt สามารถปรับปรุงประสบการณ์สไปเดอร์เท่านั้น เพราะหลังจากที่ผู้ใช้คลิก URL ผิด พวกเขายังคงเข้าถึงเพจที่ไม่มีอยู่และเห็นข้อผิดพลาด 404
หักล้างย่อหน้าที่สาม
คัดลอกคำต้นฉบับโดยตรง "หากส่งคืนรหัสอื่นที่ไม่ใช่ 404 หรือ 410 สำหรับหน้าเว็บที่ไม่มีอยู่จริง (หรือผู้ใช้ถูกเปลี่ยนเส้นทางไปยังหน้าเว็บอื่นเช่นหน้าแรกแทนที่จะส่งคืน 404) ปัญหาอาจเกิดขึ้นได้ ก่อนอื่น ซึ่งเทียบเท่ากับการบอกเครื่องมือค้นหา ด้วยเหตุนี้เครื่องมือค้นหาจึงอาจรวบรวมข้อมูล URL นี้และจัดทำดัชนีเนื้อหาเนื่องจาก Googlebot ใช้เวลามากในการประมวลผลหน้าเว็บที่ไม่มีอยู่จริงและอาจไม่สามารถค้นหา URL ของคุณได้อย่างรวดเร็วหรือบ่อยครั้งเมื่อเข้าชม URL เหล่านี้ คุณจะไม่สามารถเข้าชมได้บ่อยพอที่จะส่งผลต่อการรวบรวมข้อมูลเนื้อหาของไซต์ของคุณ (รวมทั้งคุณไม่ต้องการให้ไซต์ของคุณปรากฏบ่อยครั้งในข้อความค้นหาสำหรับ "ไม่พบไฟล์") ซึ่งเป็นคำดั้งเดิมของ 404 หากคุณไม่ข้ามไปยังหน้าข้อผิดพลาดต่อไปตามที่ต้องการ สิ่งที่อาจเกิดขึ้นคือจะมีหน้าเดียวกันจำนวนมากบนเว็บไซต์ของคุณ ชื่อเดียวกัน คำอธิบายเดียวกัน เนื้อหาเดียวกัน ฯลฯ แล้วนี่จะแตกต่าง เรื่องราวระหว่าง URL และเนื้อหาเดียวกัน จะเกิดอะไรขึ้นในอนาคต คุณสามารถไปที่ Baidu หรือค้นหาใน Google เพื่อหาคำตอบ
เนื่องจากเพื่อนผู้โต้แย้งกล่าวถึงหลักเกณฑ์ของผู้ดูแลระบบ Google อย่าลืมตัดตอนมาอีกย่อหน้า:
โดยทั่วไปแล้ว ข้อผิดพลาด 404 จะไม่ส่งผลต่อการจัดอันดับเว็บไซต์ของคุณใน Google ดังนั้นคุณจึงสามารถเพิกเฉยต่อข้อผิดพลาดดังกล่าวได้อย่างปลอดภัย ข้อผิดพลาดเหล่านี้มักเป็นผลมาจากการสะกดผิด การกำหนดค่าที่ไม่ถูกต้อง (เช่น ลิงก์ที่สร้างโดยอัตโนมัติโดยระบบการจัดการเนื้อหา) หรือความพยายามที่เพิ่มขึ้นของ Google ในการระบุและรวบรวมข้อมูลลิงก์ในเนื้อหาที่ฝังไว้ เช่น JavaScript
หากต้องการดูแหล่งที่มาของลิงก์ที่ใช้งานไม่ได้ ให้คลิกที่ URL ที่ต้องการ ในกล่องโต้ตอบข้อผิดพลาด คลิกแท็บลิงก์จากหน้าต่อไปนี้ หากลิงก์ที่เกี่ยวข้องมาจากไซต์ของคุณ ให้แก้ไขหรือลบลิงก์เหล่านั้น หากลิงก์เหล่านี้มาจากเว็บไซต์ภายนอก คุณสามารถใช้ข้อมูลนี้เพื่อปรับปรุงประสบการณ์ผู้ใช้เว็บไซต์ของคุณได้ ตัวอย่างเช่น หากมีคนตั้งใจจะลิงก์ไปยังเว็บไซต์ของคุณแต่พิมพ์ผิด URL ที่ถูกต้องจะถูกสะกดผิด (เช่น www.example.com/awesome แทนที่จะเป็น www.example.com/awsome ) แทนที่จะส่งคืนข้อผิดพลาด 404 คุณสามารถ 301 เปลี่ยนเส้นทาง URL ที่สะกดผิดไปยัง URL ที่ถูกต้อง และรับปริมาณการใช้งานที่คาดหวังผ่านลิงก์นั้น คุณยังสามารถตรวจสอบให้แน่ใจว่าคุณช่วยให้ผู้ใช้ค้นพบสิ่งที่พวกเขาต้องการหลังจากที่คุณนำพวกเขาไปยังหน้า 404 แทนที่จะแสดงเพียง "404 ไม่พบ" อย่างไรก็ตาม เราแนะนำให้ทำตามขั้นตอนเหล่านี้หากลิงก์ที่ไม่ถูกต้องสร้างปริมาณการเข้าชมสูงเท่านั้น
ลิงก์ที่มา: https://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
น่าเสียดายที่เพื่อนคนนี้เห็นเพียงคนเดียวเท่านั้น แต่ยังไม่เห็นอีกคนหนึ่ง เมื่อเราทำ SEO ข้อมูลอย่างเป็นทางการมีความสำคัญมาก มีรายละเอียดมากมายซ่อนอยู่ในนั้น และต้องใช้เวลามากในการอ่านและทำความเข้าใจอย่างถี่ถ้วน
อันที่จริง การตั้งค่าและคำอธิบายหลายประการในเครื่องมือผู้ดูแลระบบของ Google นั้นสมเหตุสมผล เป็นเพียงว่า SEO บางคนของเราไม่ต้องการเข้าใจ เช่นเดียวกับสาเหตุภายในและภายนอกของ 404 การแยกแยะสาเหตุเหล่านี้ในรายการ "ข้อผิดพลาดที่พบเมื่อเข้ารวบรวมข้อมูล" ก็สมเหตุสมผล แทนที่จะทำทั้งๆ ที่ไม่มีอะไรทำ
สรุป: ในฐานะ SEO เราจำเป็นต้องซึมซับความรู้มากมาย และในขณะเดียวกันก็พัฒนาแนวคิดและวิธีการวิเคราะห์ปัญหาของเราเอง แต่คุณต้องแน่ใจว่าความรู้ที่คุณเรียนรู้นั้นก้าวหน้าและไม่ล้าสมัย มิฉะนั้น ความคิดของคุณอาจถูกเข้าใจผิดได้ง่าย และส่งผลให้เกิดผลลัพธ์ที่ไม่ดี
การโต้วาทีความคิดเห็นก็เป็นส่วนสำคัญของงาน SEO เช่นกัน ไม่มีใครสามารถพูดได้อย่างมั่นใจว่าความเข้าใจของพวกเขาถูกต้อง เราสามารถใช้เพียงข้อมูลที่เป็นทางการบางส่วนที่เปิดเผยและข้อสรุปของเราเองผ่านการวิเคราะห์ข้อมูลเพื่อพิสูจน์ความถูกต้องของแนวคิดและทฤษฎีของเรา
บทความนี้เผยแพร่ครั้งแรกโดย Yang Fan เกี่ยวกับ SEO ของ Yang โปรดเก็บลิงก์ไว้เพื่อการพิมพ์ซ้ำ: http://www.seoyangs.com/404-301-Original-page.html
(บรรณาธิการ: Chen Long) พื้นที่ส่วนตัวของผู้เขียน AimarYang