Большинство веб-мастеров уже знают, что дублированный контент может отрицательно повлиять на рейтинг сайта. Но как проверить, есть ли эта проблема на конкретном веб-сайте, и как ее уменьшить или избежать?
С самого начала дублированный контент можно разделить на две основные категории:
Дублируемый контент из-за структуры сайта.
Дублированный контент из-за кражи контента
О дублировании контента, вызванном структурой сайта
Некоторые структуры веб-сайтов по своей сути вызывают дублирование контента, например:
страницы, поддерживающие ptint
Иметь в целом схожий контент на нескольких страницах, доступ к которым можно получить через разные URL-адреса.
На странице есть очень похожие элементы, например серия разноцветных подкладок с похожими описаниями в категории электронной коммерции.
Страница является частью программы членства в приложении для отслеживания, и программа настроена неправильно.
Несколько страниц имеют повторяющиеся заголовки или повторяющиеся значения метатегов.
Использовать идентификатор сеанса в URL-адресе
Вопросы стандартизации
Чтобы найти дублированный контент, вызванный структурой веб-сайта, вы можете использовать строку запроса site:www.yingyuxuexi.org.cn для проверки URL-адресов веб-сайтов, проиндексированных поисковыми системами. Все основные поисковые системы (Google, Yahoo!, Microsoft Live Search) поддерживают эту функцию. Обычно страницы, пригодные для печати, появляются быстрее, если их проиндексировать.
Google часто помещает то, что он считает дубликатом контента, в «дополнительный индекс». Внизу результатов поисковой системы есть отметка о дополнительном материале, и этот контент размещается. Конечно, сейчас Google скрыл этот логотип. Если на веб-сайте есть много страниц, фигурирующих в дополнительном индексе, это может означать, что эти страницы представляют собой дублированный контент — по крайней мере, так считает Google. Если возможно, изучите URL-адреса этих страниц и найдите любую из вышеперечисленных ситуаций. Особенно обратите внимание на страницы, которые следуют за результатами. Проблемы с дублирующимся контентом особенно легко создать, если вы не будете осторожны, поэтому полезно взглянуть на них с точки зрения, удобной для поисковых систем.
О дублировании контента из-за кражи контента
Кража контента создает совершенно другую проблему. Точно так же, как воры могут украсть недвижимость, они также могут украсть контент. Без сомнения, именно по этой причине это называют кражей контента. Это создает проблемы для поисковых систем, которые, поскольку они усердно работают над фильтрацией дублированного контента из результатов поиска (и с разных веб-сайтов), иногда создают неправильные представления о том, что является оригинальным и авторитетным контентом.
В некоторых случаях это скрытая проблема, которая может иметь катастрофические последствия для рейтинга. Если вы стали жертвой кражи контента и хотите принять меры, начните с отправки письма о прекращении противодействия лицу, использующему незаконный контент. Вы можете использовать контактную информацию, предоставленную веб-сайтом, или контактную информацию в записи WHOIS для доменного имени. Если это не помогло, обратитесь к крупным поисковым системам и предупредите их о краже контента.
Вот URL-адреса, за которые отвечают основные поисковые системы:
Гугл: http://www.google.com/dmca.html.
Yahoo!: http://docs.yahoo.com/info/copyrighffcopyright.html.
По сути, пока веб-сайт настаивает на постоянном обновлении оригинального контента, поисковые системы, такие как Baidu, Google и Yahoo, уже могут хорошо идентифицировать первоначальный источник оригинального контента. Веб-мастеру необходимо ежедневно обновлять качественный контент сайта.
Автор: Street Dancer-HipHop — крупнейшая коммуникационная платформа танцоров Китая. Источник: http://www.jiewuzhe.com.