今日は、ウェブマスターの友人たちに、小さなウェブサイトを Baidu に組み込んだ私の経験を簡単に紹介したいと思います。多くの友人がウェブサイトを構築する過程でそのような問題に遭遇したと思うので、私のアプローチを共有したいと思います。多くの Web サイトに対して、Baidu にはホームページが 1 つだけ含まれており、すべての内部ページが含まれていないのはなぜですか?実際、この問題は、IIS の Web サイトのログに注意を払うだけで簡単に解決できます。 Baidu Spiderのクローリングログが正常か確認してください。 Baidu Spider が Web サイトの内部ページをクロールしたかどうか、またクロール後にどのような記録が残るかを確認します。
私が最近構築した Web サイト www.745sf.com を例に挙げてみましょう。Web サイトが最初に公開されたとき、私はスパイダーを引き寄せるために a5 や Laocha などのフォーラムにいくつかの署名付き投稿を投稿しました。駅。すべてがうまくいったようです。ただし、その時点で含まれていたホームページは 1 つだけでした。中のページは付属しません。最初は、段階的にできていく新しいウェブサイトだと思っていました。数日後には、内側のページも自然に組み込まれます。 1 ~ 2 か月待ってもホームページだけが残っており、他のページが含まれていなかったのは残念です。とても憂鬱になります。百度に何か問題があるはずです。 Baidu では通常は含めることができません。そこで、分析のためにサーバーにアクセスし、当時のログをすべてダウンロードしました。長い間検索した結果、通常のスパイダーのクロール記録は表示されませんでした。1 日で内部ページをクロールしなかったか、クロール後に残ったレコードがすべて 200 0 64 でした。インターネットで関連情報を検索したところ、このような録音は異常であることがわかりました。 Baidu Spider が内部ページのクロールに成功した後に残るレコードは 200 0 0 であるはずです。しかし、Baidu Spider が私のサイトをクロールするときは常に 200 0 64 であり、これは間違いなく内部ページに問題があることを意味します。自分で作ったゴミステーションのことはよく知っていますし、ちょっと考えただけでもわかります。当初は、Web サイトが選択したキーワードの密度が人気が高すぎると考えられていました。独自性がなければ、すでに同じコンテンツが満載されているゴミサイトをバイドゥが含める理由はありません。第二に、ウェブサイトのコンテンツはオリジナルではありません。
理由を考えたら修正しないといけないので、サイトタイトルとページ内に最適化するキーワードをユニークな言葉に変更しました。 (Baiduが普通になったら元に戻します。笑) そこで、いくつかの記事を見つけて、それをめちゃくちゃにして疑似オリジナルにしてみました。バカ百度。この問題を修正した後、クモを呼び寄せるためのリンクをあらゆる場所に投稿しました。今、クモの這いの記録を見てください。後で、クモの這い記録が正常であることがわかりました。どちらも 200 0 0 です。百度蜘蛛が這うようにコンテンツが毎日更新されるからです。ついに昨日大型アップデートがあり、クロールしていたページが全て公開されました。今すぐ起きてウェブサイトのアドレスをチェックして、楽しんでください。 Baidu もとてもかわいいことがわかりました。毎日叱るだけでは十分ではなく、注意するだけで十分です。私たちにとっては難しいことではありません。すべての行動的なクモは這うときに私たちに通知するので、私たちは時間内にそれらを修正するだけで済みます。それで大丈夫です。
上記はあくまで私の勝手な意見です。すべての英雄からの唾を受け入れます。