중복 콘텐츠는 누구나 알고 있을텐데요, 이름에서도 알 수 있듯 웹사이트의 내용이 반복되거나, 반복성이 높다는 뜻으로 중복 웹페이지, 즉 중복 콘텐츠 웹페이지라고도 합니다. 특히 최근에는 많은 CMS가 출시되면서 도메인 이름을 등록하고 CMS 프로그램을 업로드하며 웹사이트를 수집하고 구축하는 웹마스터들이 늘어나고 있다. 이 접근 방식은 실제로 바람직하지 않습니다. 첫째, 검색 엔진은 사용자 경험을 기반으로 하기 때문에 사용자도 이를 좋아하지 않을 것입니다.
일부 웹사이트에서는 자체 프로그램 문제로 인해 동일한 페이지에 액세스하기 위해 다른 URL을 사용할 수 있습니다. URL 표준화에 대한 이전 기사에서 이에 대해 언급한 바 있으므로 여기서는 다루지 않겠습니다. URL 표준화는 모든 SEO 최적화의 필수라고 할 수 있습니다. 검색 엔진은 중복된 콘텐츠를 좋아하지 않습니다. 프로그램은 원본 버전이 어떤 버전인지 자동으로 확인한 다음 다른 페이지를 무시합니다. 그러나 검색 엔진의 경우 하나는 광대역 리소스를 소비하고 다른 하나는 시간 낭비입니다. 웹사이트 관리자 입장에서 여러 개의 URL은 가중치를 분산시키고 순위를 낮출 뿐만 아니라 검색 엔진에 의해 처벌을 받을 위험도 있습니다. 그리고 스파이더는 결국 프로그램일 뿐이며 스파이더가 스스로 선택하는 표준화된 URL은 우리가 원하는 것이 아닐 수도 있다는 점을 알아야 합니다. 콘텐츠 페이지 복제에 대한 처벌 문제와 관련하여 SEO 업계에서는 논란이 있었는데, 이는 처벌과 비처벌의 문제입니다. 개인적으로는 그래도 처벌을 받을 것이라고 생각합니다. 구글이 웹마스터 공식 가이드에 중복 콘텐츠 웹페이지는 처벌하지 않는다고 명시했지만, 중복 콘텐츠 웹페이지를 대량으로 만드는 것은 도움이 되지 않으니 자제해 주시기 바랍니다. 웹사이트 순위에 Baidu는 또한 다음과 같이 분명히 밝혔습니다. 귀하의 웹페이지 콘텐츠 대부분이 인터넷의 기존 콘텐츠와 중복되면 귀하의 사이트는 Baidu에 의해 폐기될 가능성이 높습니다. 그리고 이러한 중복 URL이 포함되어 있으면 검색 엔진이 이러한 중복 콘텐츠 웹 페이지를 검색자에게 반환하면 사용자 경험에 심각한 영향을 미치게 됩니다. 그는 중복 콘텐츠의 사본 하나만 나열하려고 하며, 다른 중복 콘텐츠 페이지의 경우 검색 엔진이 페이지를 다운그레이드하거나 색인에서 직접 삭제합니다.
요즘 『웹사이트 트래픽 속도 향상 제2판』을 읽어보니 반복되는 내용이 있는 웹페이지의 또 다른 상황은 제품 판매자와 대리점이 제조사의 홈페이지에서 제품 정보를 복사하는 경우가 있어서 제조사 입장에서는 괜찮습니다. 일반적으로 동의하지만 이로 인해 문제가 발생합니다. 검색 엔진이 좋아하지 않는 여러 웹 페이지에 중복된 콘텐츠가 많이 나타납니다. 고객에게 제품을 더 친숙하게 만들기 위해 이러한 웹사이트에서는 인쇄에 더 적합한 일부 버전을 제공할 수 있습니다. 이러한 URL이 처리되지 않으면 콘텐츠 페이지도 복사됩니다.
또 다른 상황은 어제 기사에서 언급한 스파이더 트랩입니다. 즉, 일부 전자상거래 웹사이트에서는 세션 ID를 사용하여 사용자마다 다른 ID를 부여합니다. 이 경우 스파이더가 방문할 때마다 동일한 현상이 발생합니다. 자세한 내용은 거미 함정 방지에 대한 기사를 참조하세요. 검색 엔진이 웹 페이지를 복사할지 여부를 결정할 때 이를 처리하기 위한 일련의 관련 알고리즘 메커니즘이 있습니다. 여기에는 다양한 검색 엔진의 다양한 중복 콘텐츠 감지 메커니즘이 포함됩니다. 웹사이트의 가중치가 다르기 때문에 검색 엔진은 실제 원본 소스를 복사본으로 간주하고, 이는 내 기사처럼 Baidu에서 너무 높은 가중치를 갖는 웹사이트의 경우 특히 그렇습니다. 내가 게시한 후 Baidu에 포함되어 있으며 Sina에서 재인쇄한 경우 Baidu는 여전히 내가 재인쇄된 것으로 판단할 수 있습니다.
웹 페이지의 콘텐츠 부분 외에도 중복 콘텐츠 페이지에는 반복되는 제목, 반복되는 구조, 반복되는 템플릿 등이 있습니다. 이제 SEO를 수행하는 모든 사람은 웹 페이지의 제목이 매우 중요하다는 것을 알고 있으므로 제목에 이름을 지정할 때 웹페이지의 경우 Baidu 및 Google로 이동하여 이미 이와 같은 제목이 있는지 검색해 보세요. 제목을 반복하지 마세요. 구조적 중복과 관련하여 일반적인 프로그램에는 일부 CMS 시스템, 웹 사이트 구축 프로그램, 포럼 프로그램 등이 포함됩니다. 이러한 프로그램은 널리 사용되므로 해당 URL 구조는 종종 중복 영역이 넓습니다. 이를 스스로 연구하고 URL 구조를 얻으려고 노력할 수 있습니다. 최대한 독특하게. 그렇다면 템플릿 복제란 무엇일까요? 요즘에는 웹 사이트 구축의 기준이 점점 낮아지고 있습니다. 많은 사람들이 프로그램을 업로드하고 기본 템플릿을 적용하고 이를 잊어버리고 있습니다. 콘텐츠가 가장 중요하지만 여전히 기본 템플릿을 수정하는 것이 좋습니다. 기본 템플릿은 일반적으로 매우 널리 사용됩니다. 템플릿의 레이아웃 구조와 HTML 코드 또는 CSS 코드로 인해 검색 엔진에서는 페이지가 모든 HTML 코드를 제거한다고 판단하지만, 우리 SEO 매니아에게는 즉, SEO 실무자의 경우 SEO 성능을 더 향상시키기 위해 수정하는 것이 좋습니다.
이 블로그에 언급된 미러 웹사이트도 있습니다. 검색할 수 있지만 여기서는 설명하지 않겠습니다. 기사의 재인쇄 및 표절로 인한 콘텐츠 페이지 복사 문제에 대해서는 더 이상 설명하지 않겠습니다. 피해야 할 또 다른 점은 웹 사이트 콘텐츠가 너무 적다는 것입니다. 예를 들어 일부 사이트의 콘텐츠 페이지에는 필연적으로 탐색 표시줄, 페이지 하단과 같은 공통 부분이 있습니다. 등. 실질적인 콘텐츠의 양이 해당 콘텐츠보다 적을 경우 검색 엔진에서 중복 콘텐츠 페이지로 판단할 수도 있습니다. 일부 웹사이트에는 부주의나 기타 사유로 인해 빈 페이지가 많이 있을 경우 중복된 내용으로 오인될 수 있습니다.
지역별로 운영되는 서비스 또는 제품 유형 웹사이트도 있습니다. 일부 제품 또는 서비스 유형은 범위가 더 작거나 동일합니다. 이러한 종류의 페이지는 지역 및 기타 매개변수 정보만 수정하지만 다른 대부분의 콘텐츠는 동일합니다. 여전히 동일합니다. RSS 피드를 사용하여 웹 콘텐츠를 생성하는 일반적인 뉴스 웹사이트도 있으며 이러한 콘텐츠도 범람하기 쉽습니다. 일부 웹사이트는 수정되기 전에 실제 정적 파일을 생성하며 이러한 실제 html 페이지는 수정 후에도 삭제되지 않습니다. 웹사이트 구조가 변경되었으나 내용이 변경되지 않은 경우 이러한 실제 디렉토리에 있는 html 파일을 삭제하면 안 되는 경우가 있습니다. 또한 웹 콘텐츠의 높은 수준의 복제를 유발합니다. 마찬가지로, 부적절한 요약 설정으로 인해 콘텐츠 페이지가 중복될 수도 있습니다. 사용자 경험을 개선하기 위해 점점 더 많은 웹사이트, 특히 뉴스 웹사이트에서 이러한 요약 기능을 사용하여 사용자에게 편리한 탐색을 제공할 뿐만 아니라 오해를 불러일으킬 수도 있습니다. 콘텐츠가 중복되고, 또 다른 흔하지 않은 상황은 http, https 등이라고 생각합니다. 웹사이트 최적화를 위한 세부적인 작업이 필수적이며, 웹사이트의 중복 콘텐츠는 웹사이트 순위에 어느 정도 영향을 미칩니다. 이 기사의 출처: 심천 SEO 출처 http://www.zhsem.com/ 재인쇄 시 명시해 주세요. 감사합니다!
작가 Xiao Wuming의 개인 공간