ほとんどのウェブマスターは、重複コンテンツがウェブサイトのランキングに悪影響を与える可能性があることをすでに知っています。しかし、特定の Web サイトにこの問題があるかどうかを確認するにはどうすればよいでしょうか。また、問題を軽減または回避するにはどうすればよいでしょうか?
そもそも、重複コンテンツは次の 2 つの主なカテゴリに分類できます。
ウェブサイトの構造によりコンテンツが重複する
コンテンツの盗難によるコンテンツの重複
ウェブサイトの構造上生じる重複コンテンツについて
一部の Web サイト構造では本質的にコンテンツの重複が発生します。例には次のようなものがあります。
ptint に優しいページ
異なる URL アドレスからアクセスできる複数のページに、一般に同様のコンテンツが含まれている
ページ上に非常によく似たユニットが存在します。たとえば、e コマース カテゴリに同様の説明が記載された一連の異なる色の裏地が含まれています。
このページは追跡アプリケーションのメンバーシップ プログラムの一部であり、プログラムは正しく構成されていません
複数のページに重複したタイトルまたは重複したメタタグ値があります
URLアドレスにセッションIDを使用する
標準化の問題
Web サイトの構造に起因する重複コンテンツを見つけるには、site:www.yingyuxuexi.org.cn クエリ文字列を使用して、検索エンジンによってインデックス付けされている Web サイトの URL アドレスを確認できます。すべての主要な検索エンジン (Google、Yahoo!、Microsoft Live Search) がこの機能をサポートしています。通常、「印刷に適した」ページはインデックス付けされていればすぐに表示されます。
Google は、重複コンテンツとみなしたコンテンツを「補足インデックス」に配置することがよくあります。検索エンジンの検索結果の下部に補足資料マークがあり、このコンテンツが配置されています。もちろん、Google は現在このロゴを非表示にしています。 Web サイトの補足インデックスに多数のページが表示されている場合、それらのページは重複コンテンツである可能性があります (少なくとも Google はそう考えています)。可能であれば、これらのページの URL アドレスを調べて、上記のいずれかの状況を探してください。特に結果に続くページに注目してください。重複コンテンツの問題は、注意しないと特に簡単に発生するため、検索エンジンに優しい観点から問題を検討すると役立ちます。
コンテンツ盗用による重複コンテンツについて
コンテンツの盗難は、まったく別の問題を引き起こします。泥棒は不動産を盗むことができるのと同じように、コンテンツも盗むことができます。これがコンテンツ窃盗と呼ばれる理由であることは間違いありません。これは、検索エンジンにとって問題を引き起こします。検索エンジンは、検索結果 (および別の Web サイト) から重複するコンテンツを懸命に除外するため、何がオリジナルで信頼できるコンテンツであるかについて誤解を招くことがあります。
場合によっては、これは隠れた問題であり、ランキングに悲惨な影響を与える可能性があります。コンテンツ盗難の被害に遭い、対策を講じたい場合は、まず違法コンテンツを使用している人に停止措置の手紙を送ります。 Web サイトから提供される連絡先情報、またはドメイン名の WHOIS レコード内の連絡先情報を使用できます。これが失敗した場合は、主要な検索エンジンに連絡して、コンテンツの盗難について警告してください。
主要な検索エンジンが担当する URL アドレスは次のとおりです。
Google: http://www.google.com/dmca.html
Yahoo!: http://docs.yahoo.com/info/copyrighffcopyright.html
基本的に、Web サイトがオリジナル コンテンツを常に更新することを主張している限り、Baidu、Google、Yahoo などの検索エンジンは、オリジナル コンテンツのオリジナル ソースをすでに十分に特定できます。ウェブマスターがしなければならないことは、質の高いウェブサイトのコンテンツを毎日更新することです。
著者:Street Dancer-HipHop-中国最大のダンサーコミュニケーションプラットフォーム出典:http://www.jiewuzhe.com