Standarisasi URL selalu menjadi masalah yang meresahkan para webmaster dan mesin pencari. Diperkirakan 10%-30% URL di Internet adalah URL non-standar dengan konten yang sama tetapi URL berbeda. Hal ini menimbulkan beberapa masalah. Misalnya:
Bagi webmaster, keberadaan beberapa URL akan menyebarkan bobot halaman dan tidak kondusif untuk peringkat.
Bagi mesin pencari, ini hanya membuang-buang sumber daya dan bandwidth.
Ketika mesin pencari menemukan bahwa beberapa URL memiliki konten yang sama, mereka tidak akan menghukumnya, tetapi akan berusaha semaksimal mungkin untuk menemukan URL yang harus distandarisasi. Namun bagaimanapun juga, sebuah program hanyalah sebuah program, dan bisa saja salah, dan URL yang dipilih mungkin bukan URL standar yang diinginkan webmaster.
Jika masalah standarisasi URL di situs web terlalu serius, hal ini juga dapat memengaruhi penyertaannya. Nama domain dengan otoritas rendah memiliki jumlah total halaman terbatas yang dapat dimasukkan. Mesin pencari menghabiskan sumber daya untuk memasukkan URL non-standar, sehingga menyisakan lebih sedikit sumber daya untuk konten yang benar-benar berbeda.
Ada banyak opsi untuk mengatasi masalah kanonikalisasi URL. Misalnya: atur versi dengan 3W dan tanpa 3W di alat administrator Google, mana yang merupakan versi standar, gunakan pengalihan 301, alihkan semua URL non-standar ke URL standar, dan memastikan sistem CMS yang digunakan Hanya menghasilkan URL kanonik, memastikan bahwa semua tautan internal di situs mengarah ke URL kanonik, dan menentukan semua URL kanonik di peta situs yang dikirimkan ke mesin pencari, namun metode ini memiliki keterbatasannya sendiri.
Alat administrator Google tidak berlaku untuk mesin pencari lain. Beberapa webmaster tidak dapat melakukan pengalihan 301 karena alasan tertentu. Dalam kebanyakan kasus, sistem CMS tidak berada di bawah kendali mereka. Mereka dapat mengontrol tautan internal, tetapi tautan orang lain ke situs web mereka tidak dapat dikontrol dikendalikan oleh mereka. Ini di luar kendali. Singkatnya, meskipun ada solusi alternatif, standarisasi URL masih menjadi masalah besar sejauh ini.
Beberapa hari yang lalu, Google, Yahoo, dan Microsoft bersama-sama merilis tag kanonik tag baru untuk memecahkan masalah kanonikalisasi URL.
Sederhananya, tambahkan kode ini ke kepala file HTML:
Artinya, URL standar halaman web ini harus:
http://www.example.com/product.php?item=swedish-fish
Kode ini dapat ditambahkan ke URL berikut:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
URL kanonik sebenarnya dari URL ini menjadi:
http://www.example.com/product.php?item=swedish-fish
Sederhananya, label ini setara dengan pengalihan 301 dalam sebuah halaman. Perbedaannya adalah pengguna tidak dialihkan, tetapi tetap berada pada URL yang sama, dan mesin pencari akan memperlakukannya sebagai pengalihan 301, yang berarti bobot tautan halaman akan terkonsentrasi pada URL standar yang ditentukan dalam kode.
Ada juga beberapa detail yang perlu diperhatikan webmaster:
Tag ini hanyalah saran atau petunjuk, bukan instruksi. Ini bukan instruksi seperti file robots. Oleh karena itu, mesin pencari akan mempertimbangkan sebagian besar kode ini, tetapi tidak 100%. Mereka juga akan mempertimbangkan situasi lain untuk menentukan URL kanonik. Ini juga mencegah webmaster salah memasukkan URL.
Kode ini dapat menggunakan alamat absolut atau relatif. Biasanya disarankan untuk menggunakan alamat absolut agar lebih aman. Konten pada URL kanonik yang ditentukan mungkin sedikit berbeda dari konten pada URL non-kanonik lainnya yang menggunakan kode ini, namun mungkin tidak sama persis. Misalnya, ada banyak situs e-commerce yang mengurutkan berdasarkan harga, warna, dan ukuran dalam urutan menaik dan menurun. Semua URL yang dihasilkan berbeda, tetapi kontennya kira-kira sama. Hanya ada sedikit perbedaan, jadi Anda dapat menggunakannya tanda ini.
URL normal yang ditentukan dapat berupa halaman yang tidak ada, menampilkan 404, atau halaman yang belum disertakan. Namun hal ini tidak disarankan dilakukan, jangan mencari masalah. Label ini berlaku untuk nama domain yang sama, termasuk nama domain tingkat kedua. Tapi itu tidak berlaku antara nama domain yang berbeda untuk mencegah seseorang membajaknya. Jangan gunakan tag ini sebagai penyelamat. Pertama-tama, Anda harus memiliki struktur situs web yang baik dan berusaha menghindari masalah normalisasi URL. Ini hanyalah pilihan terakhir.
Orang yang sensitif mungkin dapat melihat peluang untuk membangun sejumlah besar tautan eksternal dari standar baru ini. Terakhir, standar ini didukung oleh tiga mesin pencari utama Google, Yahoo, dan Microsoft. Mengapa Baidu tidak disebutkan? Saya ingat melihat laporan bahwa Baidu adalah mesin pencari terbesar kedua di dunia dalam hal volume pencarian dengan itu? Bagaimana kalau kita bermain bersama?
Penulis: Zac@SEO Satu posting sehari
Asli: Blog Optimasi Mesin Pencari Interaktif Dianshi