Каждый, кто занимается SEO, знает, что главное, чтобы веб-сайт был включен в поисковую систему. Если ваш сайт не включен в поисковую систему, о SEO не может быть и речи. Поэтому, если вы хотите, чтобы ваш веб-сайт обнаруживался поисковыми системами, а ваши веб-страницы правильно индексировались поисковыми системами, вы должны сначала сделать свой сайт удобным для сканирования пауками. Инструменты, используемые поисковыми системами для сканирования веб-страниц, называются пауками или роботами-сканерами, а их английское название — robot. Эти пауки сканируют многие наши страницы по гиперссылкам, но некоторые страницы не могут быть просканированы. Некоторые из них связаны с тем, что на самом веб-сайте есть некоторые проблемы, которые не способствуют сканированию пауками, что затрудняет индексацию соответствующих страниц поисковыми системами. , образуя таким образом «ловушку для пауков», как правило, относится к технологиям создания веб-сайтов, которые не дружественны к поисковым системам. Эти технологии не способствуют сканированию наших страниц пауками. Чтобы избежать этой ситуации, Сяовумин суммировал следующие факторы, предотвращающие проникновение пауков вход в ловушку.
1: Страницы, использующие идентификаторы сеансов. Некоторые сайты продаж используют идентификаторы сеансов для отслеживания пользователей с целью анализа определенной пользовательской информации. При доступе к сайту каждый пользователь добавляет идентификатор сеанса к URL-адресу. рассматривается как новый пользователь. Каждый раз, когда паук посещает URL-адрес, будет добавлен идентификатор сеанса. Это приведет к созданию одной и той же страницы, но с разными URL-адресами. Это приведет к дублированию страницы с контентом, что приведет к частому повторению страниц с контентом. также является одной из самых распространенных ловушек для пауков. Например, чтобы повысить эффективность продаж, некоторые веб-сайты проводят всплывающие окна, например «Привет, друзья из XXX» и т. д.
2. Ловушки для пауков, основанные на здравом смысле и использующие принудительную регистрацию или вход в систему для доступа к страницам. Это довольно сложно для пауков, поскольку пауки не могут пройти регистрацию и ввести имена пользователей и пароли для входа в систему для просмотра контента. «Нажмите, чтобы просмотреть напрямую» — это также контент, который могут видеть пауки.
3. Мне нравятся сайты, использующие Flash. Причина, по которой я говорю, что мне нравятся сайты, использующие Flash, заключается в том, что для некоторых малых и средних предприятий Flash сам по себе может оказывать множество эффектов, особенно когда он используется в навигации. имеет сильный визуальный эффект, поэтому веб-сайты многих предприятий любят использовать Flash, чтобы показать силу, культуру, продукцию и т. д. своей компании. Даже домашняя страница некоторых корпоративных сайтов представляет собой Flash, либо путем перехода на другую страницу через Flash после определенного периода времени. время или с помощью флэш-памяти. Ссылки позволяют пользователям переходить на новую страницу, но паукам трудно прочитать содержимое во флэш-памяти, поэтому паукам также сложно щелкать ссылки во флэш-памяти.
4. Динамический URL-адрес, добавление слишком большого количества символов или параметров URL-адреса и т. д. Этот вид ловушки для пауков я упоминал в разделе «Оптимизация URL-адресов». Хотя с развитием технологий поисковых систем динамические URL-адреса становятся менее эффективными для сканирования. становится все меньшей и меньшей проблемой, но с точки зрения удобства для поисковых систем статические или даже псевдостатические URL-адреса относительно лучше, чем динамические URL-адреса. Вы можете посмотреть, сколько коллег по SEO обрабатывают URL-адреса.
5: Фреймы. Раньше фреймы широко использовались повсюду, но теперь многие веб-сайты на фреймовых веб-страницах редко их используют. Во-первых, с развитием основных систем CMS обслуживание веб-сайтов стало относительно проще. Причина. используются фреймы, потому что это удобно для обслуживания страниц веб-сайта. Более того, это не способствует включению в поисковые системы и является одной из причин, по которой фреймы используются все меньше и меньше.
6: JS, хотя поисковые системы теперь могут отслеживать и даже пытаться разбирать и анализировать ссылки в JavaScript, нам лучше не ожидать, что поисковые системы преодолеют трудности самостоятельно. Хотя некоторая эффективная навигация может быть реализована с помощью JS, но CSS также может. сделайте это; чтобы улучшить удобство сайта для поисковых систем, рекомендуется сделать веб-страницу более доступной для сканирования пауками, старайтесь не использовать js. Конечно, в поисковой оптимизации одним из преимуществ js является то, что это делает веб-мастер. не хочу, чтобы страницы были включены. Или дружественные ссылки могут использовать js. Другой способ устранить ловушки Javascript-пауков — использовать тег <noscript>. Тег <noscript> предоставляет альтернативный код для браузеров, не поддерживающих JavaScript. Пауки не выполняют JavaScript, поэтому вместо этого они обрабатывают код <noscript>.
7. Глубокие веб-страницы, некоторые из которых не имеют входа и находятся далеко от главной страницы веб-сайта, относительно сложны для сканирования. Конечно, для веб-сайтов с большим весом ситуация может быть иной. Чтобы страница веб-сайта была включена, она должна сначала иметь базовый вес. Вес домашней страницы обычно является самым высоким, а затем вес домашней страницы может быть передан внутренним страницам. поднимется до порога, который может быть включен, страница будет. Согласно этой теории, передача веса между страницами уменьшится. Следовательно, чем ближе расстояние клика между внутренней страницей и домашней страницей, тем легче получить больший вес. переход на главную страницу. Хорошая структура веб-сайта может позволить включить больше страниц веб-сайта.
8. Принудительное использование файлов cookie эквивалентно прямому отключению файлов cookie для поисковых систем. Некоторые веб-сайты используют принудительные файлы cookie для выполнения определенных функций, таких как отслеживание путей доступа пользователей, запоминание информации о пользователях или даже кража конфиденциальности пользователей и т. д. если пользователь не активирует файлы cookie при посещении таких сайтов, отображаемая страница будет ненормальной, поэтому пауки не смогут нормально получить доступ к той же веб-странице.
9: Различные формы переходов. Я думаю, что многие дети-оптимизаторы уже хорошо знакомы с 301-м редиректом. Однако паукам очень неприятны другие 302-е или такие переходы, как метаобновление, javascript, flash и т. д., и 301-й не последний. При использовании любой прыжок в определенной степени создаст препятствия ползанию паука, как вы знаете.
10: Ошибки написания файла Robots.txt и различные методы мошенничества, такие как скрытый текст, скрытые ссылки и т. д., использование замаскированных веб-страниц для отображения разных веб-страниц, чтобы определить, является ли посетитель пауком или обычным браузером, а также использование ошибки по умолчанию. Страницы 404 и т. д. также создают препятствия для ползания пауков. Источник этой статьи: Shenzhen SEO Веб-сайт: http://www.zhsem.com/ Пожалуйста, уважайте оригинальность, указывайте при перепечатке, спасибо!
Личное пространство автора Сяо Умин