Sebagian besar webmaster sudah mengetahui bahwa duplikat konten dapat berdampak negatif pada peringkat situs web. Namun bagaimana cara memeriksa apakah situs web tertentu mengalami masalah ini, dan bagaimana cara mengurangi atau menghindarinya?
Sejak awal, duplikat konten dapat dibagi menjadi dua kategori utama:
Konten duplikat karena struktur situs web
Duplikat konten karena pencurian konten
Tentang duplikat konten yang disebabkan oleh struktur situs web
Beberapa struktur situs web secara inheren menyebabkan duplikat konten, contohnya meliputi:
halaman ramah ptint
Secara umum memiliki konten serupa di beberapa halaman yang dapat diakses melalui alamat URL berbeda
Ada unit yang sangat mirip di halaman tersebut, seperti serangkaian lapisan berwarna berbeda dengan deskripsi serupa dalam kategori e-niaga
Halaman ini merupakan bagian dari program keanggotaan untuk aplikasi pelacakan, dan program tersebut dikonfigurasi dengan tidak benar
Beberapa halaman memiliki judul duplikat atau nilai tag meta duplikat
Gunakan ID sesi di alamat URL
Masalah standardisasi
Untuk menemukan duplikat konten yang disebabkan oleh struktur situs web, Anda dapat menggunakan string kueri site:www.yingyuxuexi.org.cn untuk memeriksa alamat URL situs web yang telah diindeks oleh mesin pencari. Semua mesin pencari utama (Google, Yahoo!, Microsoft Live Search) mendukung fitur ini. Biasanya, halaman yang "ramah cetak" akan muncul dengan cepat jika diindeks.
Google sering kali menempatkan konten yang dianggap duplikat dalam "indeks tambahan". Ada tanda materi tambahan di bagian bawah hasil mesin pencari, dan konten ini ditempatkan. Tentu saja Google kini telah menyembunyikan logo tersebut. Jika sebuah situs Web memiliki banyak halaman yang muncul di indeks tambahan, itu mungkin berarti bahwa halaman-halaman tersebut merupakan konten duplikat—setidaknya, menurut Google demikian. Jika memungkinkan, teliti alamat URL laman ini dan cari situasi di atas. Perhatikan terutama pada halaman yang mengikuti hasilnya. Masalah duplikat konten sangat mudah terjadi jika Anda tidak berhati-hati, jadi ada baiknya untuk melihatnya dari sudut pandang ramah mesin pencari.
Tentang duplikat konten karena pencurian konten
Pencurian konten menciptakan masalah yang sangat berbeda. Sama seperti pencuri yang dapat mencuri properti, mereka juga dapat mencuri konten. Tidak diragukan lagi inilah alasan mengapa hal ini disebut pencurian konten. Hal ini menimbulkan masalah bagi mesin telusur, yang karena bekerja keras menyaring konten duplikat dari hasil penelusuran (dan dari situs web berbeda), terkadang menimbulkan kesalahpahaman tentang konten asli dan otoritatif.
Dalam beberapa kasus, ini adalah masalah tersembunyi dan dapat berdampak buruk pada peringkat. Jika Anda pernah menjadi korban pencurian konten dan ingin mengambil tindakan, mulailah dengan mengirimkan surat penghentian kepada orang yang menggunakan konten ilegal tersebut. Anda dapat menggunakan informasi kontak yang disediakan oleh situs web, atau informasi kontak dalam data WHOIS untuk nama domain. Jika gagal, dekati mesin pencari utama untuk memperingatkan mereka tentang pencurian konten.
Berikut adalah alamat URL yang menjadi tanggung jawab mesin pencari utama:
Google: http://www.google.com/dmca.html
Yahoo!: http://docs.yahoo.com/info/copyrighffcopyright.html
Pada dasarnya, selama sebuah website bersikeras untuk terus memperbarui konten asli, mesin pencari seperti Baidu, Google, dan Yahoo sudah dapat mengidentifikasi dengan baik sumber asli dari konten aslinya. Yang perlu dilakukan webmaster adalah memperbarui konten website berkualitas tinggi setiap hari.
Penulis: Street Dancer-HipHop-platform komunikasi penari terbesar di Tiongkok Sumber: http://www.jiewuzhe.com