名前が示すように、重複コンテンツについては誰もが知っているはずです。これは、Web サイトのコンテンツが繰り返されること、または重複 Web ページ、つまり重複コンテンツ Web ページとも呼ばれます。中国のインターネット環境の影響で、特に近年多くの CMS が登場してからは、ドメイン名を登録し、CMS プログラムをアップロードして、Web サイトの収集と構築を始めるウェブマスターが増えています。このアプローチは実際にはお勧めできません。まず、検索エンジンはユーザー エクスペリエンスに基づいているため、大量のコンテンツが繰り返されることに嫌悪感を抱きます。
一部の Web サイトは、独自のプログラムの問題により、同じページにアクセスするのに異なる URL を使用することがあります。これについては、URL の標準化に関する以前の記事で説明しましたが、ここでは説明しません。 URL の標準化はすべての SEO 最適化にとって必須であると言えると述べています。検索エンジンは重複したコンテンツを好みません。プログラムは元のバージョンがどのバージョンであるかを自動的に判断し、他のページを無視します。しかし、検索エンジンにとって、1 つはブロードバンド リソースを消費し、もう 1 つは時間の無駄です。 Web サイト管理者にとって、複数の URL は重みを分散してランキングを下げるだけでなく、検索エンジンによって罰せられるリスクにも直面します。そして、スパイダーは結局のところ単なるプログラムであり、それ自体が選択する標準化された URL は私たちが望むものではない可能性があることを知っておく必要があります。コンテンツページのコピーに対する処罰の問題について、SEO業界では処罰の有無の問題が議論されている。個人的には、それでも罰せられると思いますが、Google はウェブマスター向けの公式ガイドで、重複したコンテンツの Web ページは罰せられないと明確に述べていますが、重複したコンテンツの Web ページを大量に作成しないでください。これは助長的ではありません。サイトランキングへ。 Baidu はまた、Web ページ上のコンテンツのほとんどがインターネット上の既存のコンテンツと重複している場合、あなたのサイトは Baidu によって放棄される可能性があることを明確にしています。これらの重複 URL が含まれている場合、検索エンジンがこれらの重複コンテンツ Web ページを検索者に返すと、ユーザー エクスペリエンスに深刻な影響を及ぼします。なぜなら、検索エンジンはユーザー エクスペリエンスを核としており、ユーザー エクスペリエンスを望まないからです。彼は、重複コンテンツのコピーを 1 つだけリストするつもりであり、他の重複コンテンツ ページについては、検索エンジンがそのページをダウングレードするか、インデックスから直接削除します。
最近「ウェブサイトのトラフィック高速化 第2版」を読んでいると、繰り返しのコンテンツを含むウェブページの別の状況は、製品の販売者や代理店がメーカーのウェブサイトから製品情報をコピーするというものであることがわかりました。一般的には同意しますが、これには問題が発生します。異なる Web ページに重複したコンテンツが大量に表示され、検索エンジンがこれを好まないのです。これらの Web サイトでは、製品をよりよく知っていただくために、印刷に適したバージョンが提供される場合があります。これらの URL が処理されない場合、コンテンツ ページもコピーされます。
もう 1 つの状況は、一昨日の記事で述べたスパイダー トラップです。つまり、一部の電子商取引 Web サイトではセッション ID を使用して、異なるユーザーに異なる ID が付与されます。この場合、スパイダーがアクセスするたびに同じことが発生します。詳細については、クモの罠の回避に関するこの記事をご覧ください。検索エンジンが Web ページをコピーするかどうかを決定する場合、Web ページを処理するための一連の関連アルゴリズム メカニズムが必要になります。これには、さまざまな検索エンジンのさまざまな重複コンテンツ検出メカニズムのアルゴリズムが含まれます。 Web サイトの重みが異なるため、検索エンジンは実際のオリジナルのソースをコピー、コピーしたものをオリジナルのソースとみなす可能性があります。これは、この記事のように、Baidu での重みが高すぎる Web サイトに特に当てはまります。私が公開した後、Baidu に掲載されますが、Sina によって転載された場合でも、Baidu は私が転載したと判断する可能性があります。
Web ページのコンテンツ部分に加えて、重複コンテンツ ページには、繰り返しのタイトル、繰り返しの構造、繰り返しのテンプレートなどが含まれます。今や SEO を行う人なら誰でも、Web ページのタイトルが非常に重要であることを知っているため、タイトルに名前を付けるときはWeb ページの場合は、Baidu や Google にアクセスして、このようなタイトルまたはこれに似たタイトルがすでに存在するかどうかを確認してください。タイトルを繰り返さないようにしてください。構造的な重複については、いくつかの CMS システム、Web サイト構築プログラム、フォーラム プログラムなどが一般的です。これらのプログラムは広く使用されているため、URL 構造には大きな重複領域が含まれることがよくあります。これを自分で調べて、URL 構造を実現してみることができます。できるだけユニークに。では、テンプレートの複製とは何でしょうか? 現在、多くの人がプログラムをアップロードしてデフォルトのテンプレートを適用し、それを忘れていますが、それでもデフォルトを変更することをお勧めします。デフォルトのテンプレートは一般的に非常に広く使用されており、そのレイアウト構造とテンプレート内の HTML コードまたは CSS コードが重複を引き起こすことがよくありますが、SEO 愛好家にとっては、ページがすべての HTML コードを削除すると判断されます。つまり、SEO 実践者にとって、SEO のパフォーマンスを向上させるために、SEO を変更することをお勧めします。
このブログでも紹介されているミラー Web サイトもありますので、検索してみてください。ここでは説明しません。記事の転載や盗用によるコンテンツページのコピー問題についてはこれ以上詳しく説明しません。避けるべきもう 1 つのことは、Web サイトのコンテンツが少なすぎることです。たとえば、一部のサイトでは、コンテンツ ページに実質的なコンテンツが少なすぎます。また、各ページには、ナビゲーション バー、ページの下部などの共通部分が必然的に含まれます。これらの内容に比べて実質的なコンテンツ量が少ない場合、検索エンジンによって重複コンテンツページと判断される場合もあります。また、Web サイトによっては、過失などにより空白ページが多数存在すると、重複コンテンツと誤認されてしまう場合もあります。
地域ごとに運営されているサービスまたは製品タイプの Web サイトもあります。一部の製品またはサービス タイプでは、地域およびその他のパラメータ情報のみが変更されますが、他の大部分のコンテンツは同じです。まだ同じです。 RSS フィードを使用して Web コンテンツを生成する一般的なニュース Web サイトもありますが、これらのコンテンツもフラッディングの傾向にあります。一部の Web サイトでは、改訂前に実際の静的ファイルが生成され、改訂後にこれらの実際の HTML ページが削除されない場合、これらの実際のディレクトリ内の HTML ファイルは削除しないでください。また、Web コンテンツの高度な重複も発生します。同様に、概要設定が不適切な場合、コンテンツ ページが重複する可能性があります。ユーザー エクスペリエンスを向上させるために、記事の概要機能を有効にする Web サイトが増えています。これは、ユーザーに便利な閲覧を提供するだけでなく、誤解を招く可能性もあります。重複コンテンツ、およびもう 1 つの一般的な状況は、http や https などです。Web サイトの最適化には詳細な作業が不可欠であり、Web サイト上の重複コンテンツは Web サイトのランキングにある程度影響します。この記事の出典: Shenzhen SEO Source http://www.zhsem.com/転載する際はその旨を明記してください。ありがとうございます。
著者シャオ・ウーミンのパーソナルスペース