WebSpider Web クローラー ツール 5.1 は、アクセスするためにログインが必要なページを含む、インターネットおよび WAP Web サイト上のあらゆる Web ページをクロールできます。キャプチャされたページのコンテンツを分析して、ニュースのタイトル、著者、ソース、テキストなどの構造化された情報を取得します。自動ページめくりやリストページのキャプチャをサポートし、テキストページの複数ページの結合をサポートし、画像やファイルのキャプチャをサポートし、パラメータを使用して静的なWebページまたは動的Webページをキャプチャすることができます。非常に強力です。
ユーザーは、クロールする Web サイト、クロールする Web ページの種類 (固定ページ、ページングで表示されるページなど) を指定し、データ項目 (ニュースのタイトル、著者、ソース、テキストなど) を解析する方法を設定します。 .)。システムはデータをリアルタイムで自動的にキャプチャでき、キャプチャの開始時刻も構成によって設定できるため、まさに「オンデマンドでのキャプチャ、一度構成すれば永続的なキャプチャ」を実現できます。取得したデータはデータベースに保存できます。 Oracle、SQLServer、MySQL などの現在の主流データベースをサポートします。
このツールは、従来の情報の編集と手動処理を完全に置き換えることができ、企業に最新の情報とインテリジェンスを 24 時間 365 日リアルタイムで正確に提供できるため、企業のコストを真に削減し、競争力を向上させることができます。
このツールの主な機能は次のとおりです。
※応用範囲が広く、あらゆるWebページ(ログイン後にのみアクセスできるWebページも含む)をクロール可能
*処理速度が速く、ネットワークが開いていれば、1 時間で 10,000 の Web ページをクロールして解析できます。
*独自の重複データ フィルタリング テクノロジーを採用し、増分データ キャプチャをサポートし、株式取引情報、天気予報などのリアルタイム データをキャプチャできます。
※取得した情報の精度が高く、データの正確性を保証する強力なデータ検証機能を備えています。
* クローリングのブレークポイント継続をサポートし、クラッシュまたは異常な状況の後にクローリングを再開し、その後のクローリング作業を継続できるため、システムのクローリング効率が向上します。
※リストページではページ送りがサポートされており、すべてのリストページのデータを取得できます。テキスト ページの場合、ページングで表示されるコンテンツを自動的にマージできます。
*詳細なページ クローリングをサポートし、ページをレベルごとにクロールできます。たとえば、リスト ページを介して本文ページの URL をクロールしてから、本文ページをクロールします。すべてのレベルのページを個別に保存できます。
*WEB操作インターフェース、一か所に設置してどこでも使用可能
*ステップバイステップ分析、ステップバイステップ保存
*一度設定すれば、永久にキャプチャできます