Semua orang pasti tahu tentang duplikat konten. Seperti namanya, itu berarti konten situs web berulang, atau disebut juga halaman web duplikat, yaitu halaman web konten duplikat. Karena lingkungan Internet di Tiongkok, pengumpulan plagiarisme menjadi cukup populer. Terutama setelah banyak CMS diluncurkan dalam beberapa tahun terakhir, semakin banyak webmaster yang mendaftarkan nama domain, mengunggah program CMS, dan mulai mengumpulkan serta membangun situs web. Pendekatan ini sebenarnya tidak disarankan. Pertama, pengguna akan merasa jijik dengan banyaknya konten yang diulang-ulang. Mesin pencari didasarkan pada pengalaman pengguna, jadi mereka juga tidak akan menyukainya.
Beberapa situs web dapat menggunakan URL berbeda untuk mengakses halaman yang sama karena masalah dengan programnya sendiri. Saya telah menyebutkan hal ini di artikel saya sebelumnya tentang standardisasi URL. Standarisasi URL sangat penting, jadi saya tidak akan membahasnya di sini menyebutkan bahwa standarisasi URL bisa dikatakan suatu keharusan untuk semua optimasi SEO. Mesin pencari tidak menyukai konten duplikat. Program akan secara otomatis menentukan versi mana yang merupakan versi aslinya, dan kemudian mengabaikan halaman lainnya. Namun untuk mesin pencari, yang satu menghabiskan sumber daya broadband dan yang lainnya hanya membuang-buang waktu. Bagi administrator situs web, banyak URL tidak hanya akan menyebarkan bobot dan menurunkan peringkat, tetapi juga menghadapi risiko dihukum oleh mesin pencari. Dan Anda harus tahu bahwa laba-laba hanyalah sebuah program, dan URL standar yang dipilihnya sendiri mungkin bukan yang kita inginkan. Mengenai masalah hukuman untuk menyalin halaman konten, telah terjadi perdebatan di industri SEO, yaitu masalah hukuman dan non-hukuman. Secara pribadi, menurut saya Anda tetap akan dihukum. Meskipun Google telah dengan jelas menyatakan dalam panduan resmi untuk webmaster bahwa halaman web konten duplikat tidak akan dihukum, namun mohon jangan membuat halaman web konten duplikat dalam jumlah besar, karena ini tidak kondusif. untuk peringkat situs web. Baidu juga telah memperjelas: Jika sebagian besar konten di halaman web Anda diduplikasi dengan konten yang sudah ada di Internet, kemungkinan besar situs Anda akan ditinggalkan oleh Baidu. Dan ketika URL duplikat ini disertakan, ketika mesin pencari mengembalikan halaman web konten duplikat ini kepada pencari, hal ini akan sangat mempengaruhi pengalaman pengguna, karena mesin pencari didasarkan pada pengalaman pengguna sebagai intinya, dan tidak menginginkannya. hasil pencarian yang dicantumkan harus sama. Dia hanya bersedia mencantumkan satu salinan konten duplikat, dan untuk halaman konten duplikat lainnya, mesin pencari akan menurunkan versi halaman tersebut atau menghapusnya langsung dari indeks.
Ketika saya membaca "Mempercepat Lalu Lintas Situs Web Edisi Kedua" akhir-akhir ini, saya menemukan bahwa situasi lain untuk halaman web dengan konten berulang adalah penjual dan agen produk menyalin informasi produk dari situs web produsen, jadi bagi produsen Tidak apa-apa, karena produsen umumnya setuju; tapi ini menimbulkan masalah: banyak konten duplikat muncul di halaman web berbeda, yang tidak disukai mesin pencari. Untuk membuat produk mereka lebih dikenal oleh pelanggan, situs web ini mungkin menyediakan beberapa versi yang lebih sesuai untuk dicetak. Jika URL ini tidak diproses, halaman konten juga akan disalin.
Situasi lainnya adalah jebakan laba-laba yang disebutkan dalam sebuah artikel kemarin. Artinya, beberapa situs e-niaga akan menggunakan ID sesi untuk memberikan ID yang berbeda kepada pengguna yang berbeda halaman konten. Untuk lebih jelasnya, Anda dapat membaca artikel tentang menghindari perangkap laba-laba ini. Ketika mesin pencari menentukan apakah akan menyalin halaman web, mesin tersebut akan memiliki serangkaian mekanisme algoritma terkait untuk memprosesnya. Hal ini melibatkan algoritma mekanisme pendeteksian duplikat konten yang berbeda dari mesin pencari. Karena bobot situs web yang berbeda, mesin pencari mungkin menganggap sumber asli yang asli sebagai salinan, dan yang disalin sebagai sumber asli. Hal ini terutama berlaku untuk situs web dengan bobot terlalu tinggi di Baidu, seperti artikel saya ini disertakan oleh Baidu setelah saya publikasikan, jika dicetak ulang oleh Sina, Baidu masih dapat menilai bahwa saya mencetak ulang.
Selain bagian konten halaman web, halaman konten duplikat juga memiliki judul yang berulang, struktur yang berulang, template yang berulang, dll. Sekarang semua orang yang melakukan SEO tahu bahwa judul halaman web itu sangat penting, jadi ketika Anda memberi nama sebuah judul untuk halaman web, coba Buka Baidu dan Google dan cari apakah sudah ada judul seperti ini atau mirip dengan ini. Mengenai duplikasi struktural, yang umum mencakup beberapa sistem CMS, program pembuatan situs web, program forum, dll. Karena program ini banyak digunakan, struktur URL-nya sering kali memiliki area duplikasi yang luas. Anda dapat mempelajarinya sendiri dan mencoba mencapai struktur URL seunik mungkin. Jadi apa itu duplikasi template? Saat ini, ambang batas untuk membangun sebuah situs web semakin rendah. Banyak orang mengunggah sebuah program, menerapkan template default dan melupakannya. Meskipun konten adalah yang paling penting, tetap disarankan untuk mengubah defaultnya Download Template bawaan umumnya digunakan dengan sangat luas.Struktur tata letaknya dan kode HTML atau kode CSS dalam template sering menyebabkan duplikasi.Meskipun mesin pencari menilai bahwa halaman tersebut akan menghapus semua kode HTML, bagi kami para pecinta SEO Dengan kata lain bagi para praktisi SEO, agar lebih meningkatkan performa SEO, disarankan untuk memodifikasinya.
Ada juga situs mirror yang disebutkan di blog ini. Anda dapat mencarinya, tetapi saya tidak akan menjelaskannya di sini. Kami tidak akan menguraikan lebih lanjut masalah halaman konten yang disalin yang disebabkan oleh pencetakan ulang dan plagiarisme artikel. Hal lain yang harus dihindari adalah konten situs web terlalu sedikit. Misalnya, beberapa situs memiliki konten substantif yang terlalu sedikit di halaman kontennya. Selain itu, setiap halaman pasti memiliki bagian yang sama, seperti bilah navigasi, bagian bawah halaman, dan lain-lain. dll. Jika jumlah konten substantif kurang dari konten tersebut, halaman tersebut juga dapat dinilai sebagai halaman konten duplikat oleh mesin pencari. Ada juga detailnya. Beberapa website memiliki halaman kosong karena kelalaian atau alasan lain.
Ada juga situs web jenis layanan atau produk. Saat beroperasi berdasarkan wilayah, beberapa produk atau jenis layanan memiliki rentang yang lebih kecil, atau sama. Halaman semacam ini hanya mengubah wilayah dan informasi parameter lainnya, tetapi sebagian besar konten lainnya masih sama. Ada juga situs berita umum yang menggunakan RSS feed untuk menghasilkan konten web, dan konten ini juga rentan terhadap banjir. Beberapa situs web menghasilkan file statis nyata sebelum direvisi, dan halaman html asli ini tidak dihapus setelah revisi. Jika struktur situs web diubah tetapi kontennya tetap tidak berubah, file html di direktori asli ini tidak boleh dihapus juga akan menyebabkan tingginya tingkat duplikasi konten web. Demikian pula, pengaturan ringkasan yang tidak tepat juga dapat menyebabkan halaman konten duplikat. Untuk meningkatkan pengalaman pengguna, semakin banyak situs web, terutama situs berita, sekarang mengaktifkan fungsi ringkasan artikel Menurut saya, duplikat konten, dan situasi lain yang tidak biasa adalah http dan https, dll. Penting untuk mengerjakan detail untuk pengoptimalan situs web, dan duplikat konten di situs web akan memengaruhi peringkat situs web sampai batas tertentu. Sumber artikel ini: Sumber SEO Shenzhen http://www.zhsem.com/ Harap sebutkan saat mencetak ulang, terima kasih!
Ruang pribadi penulis Xiao Wuming