H1N1 は最近大きな騒ぎを引き起こしており、誰もがそれを認識しています。ほんの数日前ではなく、百度さえも H1N1 ウイルスの被害に遭いました。
検索エンジンの更新速度に関して言えば、Baidu はポータル ニュース Web サイトやその他の頻繁に更新される Web サイトのインデックスを非常に早く作成し、基本的には同日に更新します。ただし、病院の Web サイトなど、更新量が少ない Web サイトでは、この 2 つの間に大きな違いがあります。たとえば、重みが高く、送信されたサイトマップと ping が多い Web サイトでは、Google のインデックス作成速度が数分のレベルに達することがあります。 、記事を更新しただけでは、インデックス速度は数分に達することがありますが、Baidu の場合、インデックス速度は通常、Web サイトのトップページにアクセスし、タイトルを検索するだけです。またはディレクトリ ページがありますが、記事のコンテンツ ページはほとんどありません。
新しい Web サイト www.wznanke.com を観察したところ、この Web サイトは主に医療サービスの Web サイトであり、含まれているスナップショットから、Baidu が Web サイトのホームページに特に注目していることがわかります。ウェブサイトのトップページの修正コンテンツが修正され、修正コンテンツが完全ではなかったとき、私は最初に外部のソフト記事リンク、Baidu の知識、および Tieba を補助として使用しました。関連する医療 Web サイトの分析を通じて、Baidu に掲載されるまでには通常 1 週間もかかりません。半月以内に掲載された記事については、Baiduで記事タイトルを検索すると上位に表示される記事は基本的に病院サイトからの転載または収集した記事が多いため、記事の内容は表示されません。検索エンジンが非常に小さいため、専門的なコンテンツの更新が少なく、業界の特徴が明らかな Wanzhong Men's Network のような Web サイトのトラフィックを増やすにはどうすればよいでしょうか。もし不幸にも Baidu も H1N1 ウイルスの影響を受けているとしたら、おそらくいくつかの理由が見つかるでしょう。
1. シミュレーションキャプチャ解析
(1) 5 月 16 日のサイト上の Baidu のクローラー記録によると、次のことがわかります。
#ソフトウェア: Microsoft インターネット インフォメーション サービス 6.0
#バージョン: 1.0
#日付: 2009-05-16 14:42:56
#フィールド: 日付時刻 s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2009-05-16 14:42:55 W3SVC490114653 61.129.14.17 GET /robots.txt - 80 - 61.135.190.55 Baiduspider+(+http://www.baidu.com/search/spider.htm) 404 0 64
まず、クローラーは Web サイトのホームページの上部にあるナビゲーション情報を見つけ、ロボットを 1 回読み取って 404 を返した後、一時停止しました。 Web サイトの内部ページのコンテンツはまだ完成していないため、Baidu はホームページを読んだ後、内部ページにアクセスするまでに長い時間がかかります。シミュレーションによると、Baidu の最初の効果的な訪問は次のとおりです。
2009-05-16 01:23:32 W3SVC490114653 61.129.14.17 GET /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
次に、Baidu の次回の読み取りでは、最初にホームページのコンテンツが読み取られる可能性が高く、site:wznanke.com のスナップショットを通じて表示できますが、ホームページを 2 回目にクロールする場合、ロボットは読み取られません (シミュレートされたクローラー表示)。 )。
2009-05-16 08:24:26 W3SVC490114653 61.129.14.17 GET /index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
次のステップでは、Web サイトは徐々に改善されているため、Baidu はホームページ上のリンクをさらに読み取る可能性があります。シミュレートされたクローラー レコードによると、Web サイトは関連する内部リンクを改善し、デッド リンクの出現を拒否する必要があります。
2009-05-1608:26:01W3SVC490114653 61.129.14.17 GET /remensousuo/RuHeJianFei/index.htm - 80 - 61.135.162.212 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
Baidu baiduspider クロール ネットワークの各段階のコンテンツに応じて、関連するルールに従って、Web サイトの関連するレイアウトを適時に調整できます。特にオンラインの新しい Web サイトの場合、Baidu は Web サイトが検索エンジンで一定の重要度を占め、特定の高品質の逆リンクがある場合にのみ、その Web サイトにしきい値を設定します。関連するコンテンツ ページが含まれ始め、Web サイトは Baidu からより多くのトラフィックを受け取るようになります。
特に、Web サイトのコンテンツがまだ徐々に改善されており、Baidu に登録されることを望んでいる Web マスターの場合は、盲目的に主要な検索エンジンに登録しないでください。その過程で、私はまず外部リンクに関連する記事を通じて Web サイトを宣伝し、Baidu を使用して Baidu Space、Tieba、Zhizhi の比重を高め、Baidu と協力して更新時間の速いポータル Web サイト (Sina、NetEase など) を頻繁に訪問しました。 , トム このようにして、Baidu は Web サイトの外部比重が高いと見なし、自主的に組み込みます。
もちろん、Baidu は H1N1 ウイルスの拡散者であるだけではありません。Baidu の収集ルールのための魔法の武器が見つかる限り、この H1N1 ウイルスも大多数のウェブマスターによって排除されるでしょう。
この記事は、www.wznanke.com のウェブマスターから寄稿されました。お問い合わせ先 QQ309067036。