เว็บมาสเตอร์ส่วนใหญ่รู้อยู่แล้วว่าเนื้อหาที่ซ้ำกันอาจส่งผลเสียต่อการจัดอันดับของเว็บไซต์ได้ แต่คุณจะตรวจสอบได้อย่างไรว่าเว็บไซต์ใดประสบปัญหานี้ และคุณจะลดหรือหลีกเลี่ยงได้อย่างไร
ตั้งแต่เริ่มแรก เนื้อหาที่ซ้ำกันสามารถแบ่งออกเป็นสองประเภทหลัก:
เนื้อหาซ้ำเนื่องจากโครงสร้างเว็บไซต์
เนื้อหาที่ซ้ำกันเนื่องจากการขโมยเนื้อหา
เกี่ยวกับเนื้อหาที่ซ้ำกันที่เกิดจากโครงสร้างเว็บไซต์
โครงสร้างเว็บไซต์บางอย่างทำให้เกิดเนื้อหาที่ซ้ำกันโดยธรรมชาติ ตัวอย่าง ได้แก่:
หน้าที่เป็นมิตรต่อ ptint
โดยทั่วไปมีเนื้อหาที่คล้ายกันในหลายหน้าที่สามารถเข้าถึงได้ผ่านที่อยู่ URL ที่แตกต่างกัน
มีหน่วยที่คล้ายกันมากในหน้า เช่น ชุดของซับในสีต่างๆ พร้อมคำอธิบายที่คล้ายกันในหมวดหมู่อีคอมเมิร์ซ
หน้านี้เป็นส่วนหนึ่งของโปรแกรมสมาชิกสำหรับแอปพลิเคชันการติดตาม และโปรแกรมได้รับการกำหนดค่าไม่ถูกต้อง
หลายหน้ามีชื่อซ้ำหรือค่าเมตาแท็กซ้ำกัน
ใช้รหัสเซสชันในที่อยู่ URL
ประเด็นเรื่องมาตรฐาน
เพื่อค้นหาเนื้อหาที่ซ้ำกันที่เกิดจากโครงสร้างเว็บไซต์ คุณสามารถใช้สตริงการสืบค้น site:www.yingyuxuexi.org.cn เพื่อตรวจสอบที่อยู่ URL ของเว็บไซต์ที่ได้รับการจัดทำดัชนีโดยเครื่องมือค้นหา เครื่องมือค้นหาหลักๆ ทั้งหมด (Google, Yahoo!, Microsoft Live Search) รองรับฟีเจอร์นี้ โดยทั่วไป หน้าที่ "เหมาะกับการพิมพ์" จะปรากฏขึ้นอย่างรวดเร็วหากได้รับการจัดทำดัชนี
Google มักจะวางสิ่งที่ถือว่าเป็นเนื้อหาที่ซ้ำกันไว้ใน "ดัชนีเสริม" มีเครื่องหมายวัสดุเสริมที่ด้านล่างของผลลัพธ์ของเครื่องมือค้นหา และเนื้อหานี้จะถูกวางไว้ แน่นอนว่า Google ได้ซ่อนโลโก้นี้ไว้แล้ว หากเว็บไซต์มีหลายหน้าที่ปรากฏในดัชนีเสริม อาจหมายความว่าหน้าเหล่านี้เป็นเนื้อหาที่ซ้ำกัน อย่างน้อย Google ก็คิดเช่นนั้น หากเป็นไปได้ ให้ศึกษาที่อยู่ URL ของหน้าเหล่านี้และมองหาสถานการณ์ข้างต้น โดยเฉพาะหน้าที่ติดตามผลลัพธ์ ปัญหาเนื้อหาที่ซ้ำกันนั้นสร้างได้ง่ายเป็นพิเศษหากคุณไม่ระวัง ดังนั้นจึงเป็นประโยชน์ที่จะพิจารณาปัญหาเหล่านี้จากมุมมองของเครื่องมือค้นหา
เกี่ยวกับเนื้อหาที่ซ้ำกันเนื่องจากการขโมยเนื้อหา
การขโมยเนื้อหาสร้างปัญหาที่แตกต่างไปจากเดิมอย่างสิ้นเชิง เช่นเดียวกับที่ขโมยสามารถขโมยทรัพย์สินได้ พวกเขาก็สามารถขโมยเนื้อหาได้เช่นกัน ไม่ต้องสงสัยเลยว่านี่คือเหตุผลว่าทำไมจึงเรียกว่าการขโมยเนื้อหา สิ่งนี้สร้างปัญหาให้กับเครื่องมือค้นหา ซึ่งเนื่องจากเครื่องมือค้นหาทำงานอย่างหนักเพื่อกรองเนื้อหาที่ซ้ำกันออกจากผลการค้นหา (และจากเว็บไซต์ต่างๆ) บางครั้งจึงทำให้เกิดความเข้าใจผิดเกี่ยวกับเนื้อหาที่เป็นต้นฉบับและเชื่อถือได้
ในบางกรณี นี่เป็นปัญหาที่ซ่อนอยู่และอาจส่งผลเสียต่อการจัดอันดับได้ หากคุณตกเป็นเหยื่อของการขโมยเนื้อหาและต้องการดำเนินการ ให้เริ่มต้นด้วยการส่งจดหมายยุติและเลิกใช้ไปยังบุคคลที่ใช้เนื้อหาที่ผิดกฎหมาย คุณสามารถใช้ข้อมูลติดต่อที่ได้รับจากเว็บไซต์ หรือใช้ข้อมูลติดต่อในบันทึก WHOIS สำหรับชื่อโดเมนได้ หากไม่สำเร็จ ให้ติดต่อเครื่องมือค้นหาหลักๆ เพื่อเตือนเกี่ยวกับการขโมยเนื้อหา
นี่คือที่อยู่ URL ที่เครื่องมือค้นหาสำคัญ ๆ รับผิดชอบ:
กูเกิล: http://www.google.com/dmca.html
Yahoo!: http://docs.yahoo.com/info/copyrighffcopyright.html
โดยพื้นฐานแล้ว ตราบใดที่เว็บไซต์ยืนยันที่จะอัปเดตเนื้อหาต้นฉบับอย่างต่อเนื่อง เครื่องมือค้นหาเช่น Baidu, Google และ Yahoo ก็สามารถระบุแหล่งที่มาดั้งเดิมของเนื้อหาต้นฉบับได้เป็นอย่างดี สิ่งที่เว็บมาสเตอร์ต้องทำคืออัปเดตเนื้อหาเว็บไซต์คุณภาพสูงทุกวัน
ผู้แต่ง: Street Dancer-HipHop-แพลตฟอร์มการสื่อสารนักเต้นที่ใหญ่ที่สุดของจีน ที่มา: http://www.jiewuzhe.com