대부분의 웹마스터는 중복된 콘텐츠가 웹사이트 순위에 부정적인 영향을 미칠 수 있다는 것을 이미 알고 있습니다. 하지만 특정 웹사이트에 이러한 문제가 있는지 어떻게 확인할 수 있으며, 이를 줄이거나 방지할 수 있는 방법은 무엇입니까?
처음부터 중복 콘텐츠는 두 가지 주요 범주로 나눌 수 있습니다.
웹사이트 구조로 인한 중복 콘텐츠
콘텐츠 도용으로 인한 중복 콘텐츠
웹사이트 구조로 인한 중복 내용에 대하여
일부 웹사이트 구조는 본질적으로 중복된 콘텐츠를 발생시킵니다. 예는 다음과 같습니다.
pint 친화적인 페이지
서로 다른 URL 주소를 통해 액세스할 수 있는 여러 페이지에 일반적으로 유사한 콘텐츠가 있어야 합니다.
전자상거래 카테고리에 유사한 설명이 포함된 다양한 색상의 안감 시리즈와 같이 페이지에 매우 유사한 단위가 있습니다.
페이지가 추적 애플리케이션에 대한 멤버십 프로그램의 일부이며 프로그램이 잘못 구성되었습니다.
여러 페이지에 중복된 제목이나 중복된 메타 태그 값이 있습니다.
URL 주소에 세션 ID 사용
표준화 문제
웹사이트 구조로 인해 발생한 중복 콘텐츠를 찾으려면 site:www.yingyuxuexi.org.cn 쿼리 문자열을 사용하여 검색 엔진에서 색인화한 웹사이트의 URL 주소를 확인할 수 있습니다. 모든 주요 검색 엔진(Google, Yahoo!, Microsoft Live Search)이 이 기능을 지원합니다. 일반적으로 "인쇄용" 페이지는 색인이 생성되면 빠르게 나타납니다.
Google은 중복된 콘텐츠로 간주되는 콘텐츠를 '보조 색인'에 배치하는 경우가 많습니다. 검색엔진 결과 하단에 보충자료 표시가 있는데, 이 내용이 배치되어 있습니다. 물론 Google은 이제 이 로고를 숨겼습니다. 웹사이트에 추가 색인에 나타나는 페이지가 많으면 해당 페이지가 중복된 콘텐츠일 수 있습니다. 적어도 Google에서는 그렇게 생각합니다. 가능하다면 해당 페이지의 URL 주소를 조사하여 위의 상황 중 하나를 찾아보세요. 특히 결과 다음에 나오는 페이지를 살펴보세요. 중복 콘텐츠 문제는 특히 주의하지 않으면 발생하기 쉽기 때문에 검색 엔진 친화적인 관점에서 살펴보는 것이 유용합니다.
콘텐츠 도용으로 인한 중복 콘텐츠에 대해
콘텐츠 도난은 완전히 다른 문제를 야기합니다. 도둑이 부동산을 훔칠 수 있는 것처럼 콘텐츠도 훔칠 수 있습니다. 의심할 바 없이 이것이 콘텐츠 도용이라고 불리는 이유입니다. 이로 인해 검색 엔진에 문제가 발생합니다. 검색 결과(및 다른 웹사이트)에서 중복된 콘텐츠를 필터링하기 위해 열심히 노력하기 때문에 때로는 원본 콘텐츠와 권위 있는 콘텐츠가 무엇인지에 대해 오해를 일으키게 됩니다.
경우에 따라 이는 숨겨진 문제이며 순위에 치명적인 영향을 미칠 수 있습니다. 콘텐츠 도난의 피해자였으며 조치를 취하고 싶다면 먼저 불법 콘텐츠를 사용하는 사람에게 중지 편지를 보내는 것부터 시작하세요. 웹사이트에서 제공하는 연락처 정보를 사용하거나 도메인 이름에 대한 WHOIS 기록의 연락처 정보를 사용할 수 있습니다. 이것이 실패하면 주요 검색 엔진에 접근하여 콘텐츠 도난에 대해 경고하십시오.
주요 검색 엔진이 담당하는 URL 주소는 다음과 같습니다.
구글: http://www.google.com/dmca.html
야후!: http://docs.yahoo.com/info/copyrighffcopyright.html
기본적으로 웹사이트가 원본 콘텐츠를 지속적으로 업데이트하도록 요구하는 한 Baidu, Google, Yahoo와 같은 검색 엔진은 이미 원본 콘텐츠의 원본 소스를 잘 식별할 수 있습니다. 웹마스터가 해야 할 일은 고품질의 웹사이트 콘텐츠를 매일 업데이트하는 것입니다.
저자: Street Dancer-HipHop-중국 최대 댄서 커뮤니케이션 플랫폼 출처: http://www.jiewuzhe.com