C# を使用したスパイダープログラムの開発

C# を使用したスパイダープログラムの開発

C# ソースコード

v1.0

リソースがありません

スパイダーは、インターネット上で非常に便利なプログラムです。検索エンジンはスパイダープログラムを使用して Web ページをデータベースに収集します。企業はスパイダープログラムを使用して、競合他社の Web サイトを監視し、Web ページを削除するためにその変更を追跡します。コンピューター上で使用される場合、開発者はスパイダープログラムを使用して自分の Web をスキャンし、無効なリンクをチェックします... スパイダープログラムはユーザーごとに用途が異なります。
スパイダーは半自動プログラムであり、本物のスパイダーがその Web (クモの巣) 上を移動するのと同じように、スパイダープログラムも Web リンクによって編まれた Web 上を同様に移動します。スパイダープログラムが半自動である理由は、常に最初のリンク (開始点) が必要ですが、その後の動作はスパイダープログラムが開始ページに含まれるリンクをスキャンし、これらのリンクにアクセスすることによって決定されるためです。ページをポイントし、それらのページに含まれるリンクを分析して追跡します。理論上、インターネット上のほぼすべてのページは多かれ少なかれ他のページから常に参照されているため、スパイダープログラムは最終的にインターネット上のすべてのページを訪問することになります。

この記事では、C# 言語を使用して、Web サイト全体のコンテンツを指定したディレクトリにダウンロードできるスパイダープログラムを構築する方法を紹介します。プログラムの実行インターフェイスを図 1 に示します。この記事で提供されているいくつかのコアクラスを使用して、独自のスパイダープログラムを簡単に構築できます。

詳細については、http://info.codepub.com/2008/03/info-18319.html を参照してください。

拡大する

追加情報