最近、Webサイトや商品のプロモーションの仕事をしていて、わからないこともたくさんありますが、宣伝するものの中にはとても魅力的な名詞がたくさんあります。 1つ目はSEOを理解する過程で「外部リンク」に出会い、一度にたくさんの情報を得ることができました。単純ではありません。
そして今日は「蜘蛛が這う」という言葉についてお話したいと思います。私は後発なので最初に言及するわけではないと思いますが、私の説明がより多くの人にこの言葉を理解してもらうのに役立つことを願っています。結局のところ、多くの専門的な紹介は非常に専門的であり、あまりにも専門的であるため、そう感じます。理解できない。
まず、Baidu のインクルージョンを紹介します。オンラインの世界には非常に多くの Web サイトがあり、その Web サイトには私たちと同じように無数の Web ページが含まれており、人口は 60 億人を超えています。まあ、ジャッキー・チェン、ブルース・リー、マイケル・ジャクソンなど、世界に大きな影響力を持つ人もいますが、私たちのような無名の人はとても謙虚です。世の中に多大な貢献をした人は自然と有名になるので、言い換えれば、インターネット上で「貢献」した人は百度に含まれるということになります。含まれるという威信は、Baidu 検索の見出しに表示される可能性があることを意味し、見出しは常に大きな注目を集めます。SEO (検索エンジン最適化) が生まれたのは、誰もがこの位置を争うことを望んでいるからです。
そして、収集されたコンテンツは整然とライブラリに保存されます。このライブラリは、オンラインの世界では「データベース」と呼ばれています。データベースの原理については、ここでは主に説明しません。 「Spider Crawl」はこれを使用してデータを一定の形式で保存または記録するものです。もう一度「クモ」について説明します。もちろん、それは私たちが日常的に目にするクモではありません。簡単に言えば、クモのプロセスはアルゴリズムを実装するプロセスです。単純に日常の計算プロセスとして理解することはできません。その意味はイベントの計画プロセスに相当します) 最近、Baidu の検索アルゴリズムが変更されたようですが、変更方法を皆さんもゆっくり理解してください。
「スパイダー クローリング」はもう少し比喩的なもので、垂直方向のクローリングと水平方向のクローリングがあり、コンピューター用語では深さ方向のトラバースと幅方向のトラバースを指します。トラバースしたコンテンツは、大小さまざまな Web サイトまたは Web ページをアクティブにダウンロードします。返された Web ページは、検索エリアに配置される前にさまざまなプログラムによって計算され、その後、Baidu のデータベースに組み込まれ、最終的に Baidu の Web ページに表示されます。そしてここで、Baidu は 1 つの「スパイダー」だけではなく、複数の、おそらく 10、または数百、数千、さらには数万、または数十万の「スパイダー」を送信しました。コンピュータ用語: スレッド。明らかに、複数のスパイダーは複数のスレッドであり、複数のスレッドが検索を実行する場合にのみ効率が高くなります。複数の「スパイダー」が一緒に検索する場合、それは広範な検索になります。1 つの「スパイダー」が特定の規則に従っている場合、それは深い検索になります。 Web ページの検索は深さ優先、幅優先でページをクロールする際、開始サイト (つまり、シード サイトは一部のポータル サイトを参照します) からクロールし、より多くの URL と深さをクロールします。最初のクロールは、高品質の Web ページをクロールすることを目的としています。Baidu Spider は、より多くの逆接続を持つページのクロールのみを担当します。一般に、Web クローリングの正常範囲は 40% であり、60% が良好であると考えられ、もちろん 100% は不可能です。学習の過程で、スパイダー クローリングの安全性を紹介する記事を見つけました。その記事では、スパイダーは通常、これらの Web サイトを通過することを好み、ネットワークの脆弱性を回避するようになっています。これは私にとって非常に魅力的です。この記事の冒頭を思い出してください。動的 Web サイトでは無限ループが発生する可能性があるため、最初に静的 Web サイトを横断する必要があります。そのため、スパイダーは侵入後に抜け出すことができません。ただし、一般的なスパイダー検索プロセスでは、最初に Web サイトのセキュリティがチェックされ、次のことがわかります。破壊的な行為は避けられます。これは検討する価値があると思います。動的な Web サイトを構築する過程では、最終的にはスパイダーが侵入しないようにプログラム コードを厳密に管理する必要があります。
今日の紹介は以上です。不足点がたくさんありますので、修正していただければ幸いです。アジア セラミックス モール: www.asiachinachina.com
(担当編集:momo) 著者のパーソナルスペース アジアセラミックモール