Стандартизация URL-адресов всегда была проблемой, беспокоящей веб-мастеров и поисковые системы. По оценкам, 10–30 % URL-адресов в Интернете представляют собой нестандартизированные URL-адреса с одинаковым содержанием, но разными URL-адресами. Это создает несколько проблем. например:
Для веб-мастеров наличие нескольких URL-адресов снижает вес страницы и не способствует ранжированию.
Для поисковых систем это пустая трата ресурсов и пропускной способности.
Когда поисковые системы обнаруживают, что несколько URL-адресов имеют одинаковое содержание, они не будут их наказывать, а сделают все возможное, чтобы найти URL-адрес, который следует стандартизировать. Но в конце концов программа — это всего лишь программа, и она может пойти не так, и выбранный URL-адрес может не соответствовать стандартному URL-адресу, который нужен веб-мастеру.
Если проблема стандартизации URL-адресов на веб-сайте слишком серьезна, это также может повлиять на включение. Доменное имя с низким авторитетом имеет ограниченное количество страниц, которые можно включить. Поисковые системы тратят ресурсы на включение нестандартных URL-адресов, оставляя меньше ресурсов для действительно другого контента.
Существует множество вариантов решения проблемы канонизации URL-адресов. Например: установить версию с 3W и без 3W в инструментах администратора Google, какая версия является стандартизированной, использовать перенаправление 301, перенаправить все нестандартизированные URL-адреса на стандартизированные URL-адреса и Убедитесь, что используется система CMS. Создавайте только канонические URL-адреса, убедитесь, что все внутренние ссылки на сайте указывают на канонические URL-адреса, и указывайте все канонические URL-адреса в карте сайта, отправленной в поисковые системы, но эти методы имеют свои ограничения.
Инструменты администратора Google неприменимы к другим поисковым системам. Некоторые веб-мастера по каким-то причинам не могут выполнять 301-перенаправления. В большинстве случаев система CMS не находится под их контролем. Они могут контролировать внутренние ссылки, но ссылки других людей на их собственные сайты не могут. под их контролем. Короче говоря, несмотря на то, что альтернативные решения существуют, стандартизация URL-адресов по-прежнему остается большой проблемой.
Несколько дней назад Google, Yahoo и Microsoft совместно выпустили новый тег canonical tag, призванный решить проблему канонизации URL-адресов.
Проще говоря, добавьте этот код в заголовок HTML-файла:
Это означает, что стандартизированный URL-адрес этой веб-страницы должен быть:
http://www.example.com/product.php?item=swedish-fish
Этот код можно добавить к следующим URL-адресам:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
Настоящие канонические URL-адреса этих URL-адресов становятся:
http://www.example.com/product.php?item=swedish-fish
Проще говоря, эта метка эквивалентна 301-редиректу внутри страницы. Разница в том, что пользователь не перенаправляется, а остается на том же URL-адресе, и поисковая система воспримет это как 301-редирект, а это значит, что вес ссылки на страницу будет сконцентрирован на стандартизированном URL-адресе, указанном в коде.
Есть также несколько деталей, на которые веб-мастерам следует обратить внимание:
Этот тег — всего лишь предложение или подсказка, а не инструкция. Это не инструкция, подобная файлу robots. Поэтому поисковые системы будут учитывать этот код в значительной степени, но не на 100%. Они также будут учитывать другие ситуации для определения канонического URL. Это также не позволяет веб-мастерам неправильно указать URL-адрес.
Этот код может использовать как абсолютные, так и относительные адреса. Обычно рекомендуется использовать абсолютные адреса для большей безопасности. Содержимое указанного канонического URL-адреса может немного отличаться от содержимого других неканонических URL-адресов, использующих этот код, но может не совпадать в точности. Например, существует множество веб-сайтов электронной коммерции, которые сортируются по цене, цвету и размеру в порядке возрастания и убывания. Все сгенерированные URL-адреса разные, но содержание примерно одинаковое. Различия лишь незначительные, поэтому вы можете использовать их. этот тег.
Указанный нормализованный URL-адрес может быть несуществующей страницей, возвращающей 404, или страницей, которая не была включена. Но делать этого не рекомендуется, не ищите неприятностей. Эта метка применяется к одному и тому же доменному имени, включая доменные имена второго уровня. Но это не применяется к разным доменным именам, чтобы предотвратить их захват. Не используйте этот тег как спасательный круг. Прежде всего, у вас должна быть хорошая структура сайта и стараться избегать проблем с нормализацией URL-адресов. Это только последнее средство.
Чувствительные люди, вероятно, увидят возможность создать большое количество внешних ссылок на основе этого нового стандарта. Наконец, этот стандарт поддерживается тремя основными поисковыми системами Google, Yahoo и Microsoft. Почему я не упоминаю Baidu, когда видел сообщения о том, что Baidu является второй по величине поисковой системой в мире по объему поиска? с ним поиграем?
Автор: Zac@SEO Один пост в день
Оригинал: Интерактивный блог Dianshi по поисковой оптимизации