Kewajiban mesin pencari untuk mengidentifikasi halaman secara akurat bukanlah sebuah hadiah.

Penulis：Eve Cole Waktu Pembaruan：2012-08-22 10:34:20

Pada tanggal 13 April 2010, di Klub Webmaster Baidu Tieba, ZAC, seorang pakar SEO Tiongkok terkenal, bertanya dalam postingan "Mengajukan pertanyaan atas nama orang lain bahwa konten asli tidak dapat diidentifikasi": "Peringkat konten asli saya sendiri sering kali tidak sebagus konten yang dicetak ulang atau dijiplak. Apa yang dapat dilakukan webmaster untuk mencegah atau memperbaikinya? Situs web saya memperbarui konten asli setiap hari, dan Baidu juga memperbaruinya setiap hari, namun setelah cetakan ulang orang lain disertakan, artikel saya tidak dapat dicari. Saya bertahan hampir 4 kali. Ini adalah karya asli saya, tetapi Baidu masih menurunkan saya ke lebih dari 500 tempat!”

Dua tahun lalu, webmaster perwakilan ZAC berdialog dengan Lee, yang mewakili Baidu, mengenai masalah penyertaan asli.

Lebih dari dua tahun telah berlalu, dan situasi yang disebutkan dalam pertanyaan di atas tidak berubah, dan bahkan semakin memburuk. Berbagai halaman konten asli berharga yang "disalin dan dikumpulkan" dengan mudah direkomendasikan untuk dicari oleh netizen melalui pencarian web Baidu melalui pengindeksan kata kunci. Namun, situs peluncuran konten asli telah kehilangan reputasinya. Hal ini secara obyektif memaafkan penyebaran apa yang disebut SEO berdasarkan "menyalin dan mengumpulkan dokumen asli palsu" yang menargetkan kekurangan Baidu.

Tidak mengherankan, pada acara "Hari Terbuka Klinik Webmaster" Baidu pada 10 Agustus tahun ini, masalah identifikasi orisinalitas menjadi pertanyaan yang terus ditanyakan oleh webmaster dan SEOER kepada insinyur pencarian Baidu, Lee.

Juga tidak mengherankan, jawaban insinyur pencari Baidu Lee adalah replika dari jawabannya dua tahun lalu: "Ya, hanya dapat dikatakan bahwa strategi Baidu belum sempurna, dan kami telah memperbaikinya." Algoritme identifikasi asli yang sempurna".

Orang-orang yang mengikuti berita Baidu dapat dengan mudah menemukan bahwa jawaban Baidu Lee "Kami sedang merancang serangkaian algoritme identifikasi asli yang relatif lengkap" sepenuhnya merupakan tanggapan terhadap "Tindakan terhadap situs berkualitas rendah" dari tim anti-penipuan penelusuran web Baidu pada 2 Juli. "Tindakan terhadap situs web berkualitas rendah (situs web asli dan non-asli palsu) telah berlaku" - Semua orang masih ingat bahwa pada saat itu, "Tindakan terhadap situs web berkualitas rendah telah berlaku" berkata dengan megah: "Untuk menyediakan situs web berkualitas tinggi, Untuk webmaster sumber daya asli, karena kami mengurangi atau bahkan menghilangkan peringkat situs berkualitas rendah, Anda akan mendapatkan lebih banyak lalu lintas dari Baidu."

Namun kurang dari dua bulan kemudian, jawaban insinyur pencarian Baidu Lee sepenuhnya menyangkal pernyataan tim anti-penipuan pencarian web Baidu, yang sungguh mengejutkan.

Terlebih lagi, ketika dihadapkan pada pertanyaan tentang mengidentifikasi "konten asli" dua kali setelah dua tahun, Baidu Lee mengadopsi metode "melihat-lihat dan membicarakannya" untuk menghadapinya secara asal-asalan: Dua tahun lalu, jawaban Lee adalah "Dari sudut pandang pengalaman pengguna, beberapa cetakan ulang mungkin tidak lebih buruk dari aslinya... hanya cetakan ulang dalam negeri, banyak yang terpotong dari awal hingga akhir, yang membuat penulis asli lebih terluka." Ini lebih ditujukan pada masalah domestik tidak teratur dicetak ulang; tahun ini, jawaban Baidu Lee adalah: "(Baidu menerima Lebih dari 80% keluhan yang diklaim asli tidak valid, dan bahkan ada banyak situs web yang mengklaim bahwa dokter pengobatan Tiongkok kuno dapat menyembuhkan penyakit mematikan di 3-5 hari. Seluruh konten tidak dapat dibaca dan diklaim sebagai situs web berkualitas tinggi."

Tidak dapat disangkal bahwa apa yang dikatakan Lee adalah fakta, tetapi akumulasi detail nyata tidak sama dengan keseluruhan yang sebenarnya tidak berarti bahwa tidak ada konten asli berkualitas tinggi di industri Internet Tiongkok, juga tidak itu berarti Baidu tidak dapat mengidentifikasi situs web. Alasan rilis aslinya. Seperti kata pepatah, “Jika Anda tidak memiliki berlian, jangan main-main dengan porselennya.” Pernyataan Baidu Lee hanya dapat membuktikan bahwa kemampuan Baidu dalam mengidentifikasi konten asli dan menghapus halaman duplikat belum membaik sama sekali.

Harus ditekankan bahwa, setelah memahami bahwa buruknya kemampuan mengidentifikasi halaman asli adalah kelemahan semua mesin pencari, banyak penulis asli akar rumput telah menambahkan pernyataan hak cipta di akhir artikel untuk menandai URL awal, dan pada saat yang sama, mereka dipandu oleh metode "sinkronisasi konten" dalam pengiriman situs web industri berkualitas tinggi. Mesin pencari dan webmaster yang mem-posting ulang - Meskipun sebagian besar tautan yang diperoleh adalah tautan teks biasa, insinyur pencarian Baidu Lee berkata, "Mari kita perjelas pertanyaannya: Bisakah tautan masuk bentuk teks biasa (non-tag) dikenali dan diproses? Jawabannya "Ya, laba-laba mesin pencari perlu menemukan dan merayapi tautan di Internet pada waktu yang tepat. Tidak masalah apa pun bentuk tautannya," yang memberi mereka kepercayaan diri.

Apa yang mengecewakan para webmaster ini adalah bahwa sejumlah besar situs web pengiriman dan cetak ulang otoritatif di industri tidak "mencetak ulang dari awal hingga akhir" seperti yang dikatakan Baidu Lee, dan halaman web dari situs web pengiriman atau cetak ulang berbobot tinggi dibuat dan disertakan. oleh mesin pencari jauh lebih awal daripada " Dalam kasus situs web "menyalin dan mengumpulkan pseudo-asli", masih ada sejumlah besar halaman halaman pertama asli yang diabaikan oleh Baidu. Peringkat "menyalin dan mengumpulkan pseudo-asli" situs web tetap tinggi - banyak dari halaman ini masih mencegat bagian artikel secara acak dan tidak sepenuhnya mengungkapkan tema artikel. Halaman ini tidak dapat memenuhi standar "pengalaman pengguna yang lebih baik" yang diiklankan oleh Baidu.

Perlu dicatat bahwa meskipun identifikasi halaman asli selalu menjadi kelemahan mesin pencari, tidak semua mesin pencari berkinerja buruk seperti Baidu dalam menghadapi banyak URL berbobot tinggi yang mengarah ke halaman peluncuran asli. Seperti yang dikatakan Wang Tong, seorang SEOER domestik terkenal, dalam menghadapi perkembangan "menyalin dan mengumpulkan dokumen asli palsu" di Internet Tiongkok, untuk halaman peluncuran asli dengan panduan URL pernyataan hak cipta (selain rilis waktu, universalitas tautan, dan bobot halaman situs web tautan, dll. Standar), Google tidak mengalami kegagalan total seperti Baidu, yang mengklaim "paling tahu bahasa Mandarin" - pencarian terkait blockbuster teratas ditempati oleh halaman asli palsu yang disalin dan dikumpulkan, dan halaman pertama yang asli menghilang tanpa bekas.

Hal ini menunjukkan bahwa Baidu, yang “paling tahu bahasa Mandarin”, harus menyelesaikan pekerjaan identifikasi asli dan penghapusan halaman duplikat (untuk mengidentifikasi halaman informasi berkualitas tinggi dan halaman tambahan penting untuk rekomendasi utama) sebelum merekomendasikan URL untuk mencari netizen melalui pengindeksan kata kunci. Itu belum selesai - alasannya adalah tingkat teknisnya sangat rendah dan ada kebutuhan mendesak untuk mengejar ketinggalan, dan pernyataan Baidu Lee hanya terus mencari alasan untuk Baidu.

Selain itu, sebagai perbandingan, kinerja Google yang lebih baik dalam mengidentifikasi alamat awal asli membuktikan bahwa Baidu tidak peduli dengan halaman awal asli, ia hanya peduli pada lebih banyak konten asli - tetapi kurang kesadaran hak cipta yang tepat lama, alasan utama keterbelakangan algoritma situs web asli adalah "tidak mungkin atau tidak".

Tak heran, begitu Wang Tong, seorang SEOER dalam negeri ternama, mengatakan bahwa "Penyesuaian 628 Baidu adalah menindak situs web asli", banyak webmaster dan SEOER merasa sedih.

Faktanya, jika teknologi identifikasi halaman pertama asli dapat ditingkatkan secara signifikan, hal ini dapat membantu meningkatkan kemampuan anti-kecurangan mesin pencari, secara langsung menggagalkan plot para SEOER yang menipu mesin pencari dengan berbagai cara demi keuntungan, dan menyediakan sebuah platform bagi mereka yang berkomitmen serius terhadap mesin pencari kelas atas. Percaya pada konten asli yang berkualitas.

Hanya ketika Baidu menghormati karya banyak webmaster situs web asli berukuran kecil dan menengah dengan tindakan praktis dan mendorong mereka untuk terus menggunakan kecerdasan dan bakat mereka untuk melakukan karya orisinal, barulah kami dapat membimbing lebih banyak webmaster dan SEOER yang terobsesi dengan "menyalin dan mengumpulkan pseudo-originals" untuk mencurahkan energinya untuk Buka konten asli yang "paling mencerminkan nilai inti situs web". Bagi Baidu, meski langkah ini sulit, namun merupakan langkah besar yang bermanfaat bagi perkembangan mesin pencari di masa depan.

Selain itu, saya harus mengingatkan penelusuran web Baidu bahwa Baidu bukanlah anugerah bagi banyak webmaster akar rumput untuk menyelesaikan "masalah pengumpulan konten asli" yang dilaporkan oleh webmaster sesegera mungkin dengan algoritme yang lebih masuk akal (situs web terkenal tidak membuat Baidu kesal. semua), Taobao secara langsung memblokir Baidu), tetapi ini adalah "kewajiban dasar" yang harus dipenuhi Baidu berdasarkan Undang-Undang Hak Cipta saat ini dan undang-undang terkait lainnya. Orang Baidu tidak bisa merasa terlalu nyaman dengan dirinya sendiri.

Ke mana harus pergi, jalan ada di depan Anda, semuanya tergantung pada pilihan mesin pencari itu sendiri (Artikel ini awalnya diterbitkan oleh gouyn12. Hak cipta dilindungi undang-undang. Anda bertanggung jawab atas artikel tersebut. Harap sebutkan sumber asli artikel di bentuk link saat mencetak ulang : http://www.gouyn12.com/cnnet/327.html ).

(Editor: Chen Long) Ruang pribadi penulis gouyn12