特徴:
*****************************************
1. asp.net を使用して開発され、IIS で実行されます。
2. 倉庫設定に応じて既存のウェブサイトシステムに自動的に接続でき、既存システムの収集プログラムを補完または置き換えるために既存システムとシームレスに統合できます。
3. 収集スケジュール、つまりスケジュールされたタスクでは、スケジュールされた時刻に繰り返し収集する時間を設定できます。設定された時刻に達すると、収集プログラムが自動的に実行されます。 Web サーバーのバックグラウンドで実行されるため、手動による更新の必要性が実際にわかります。
4. 収集した情報を自動的に分類できます。ターゲット分類が存在しない場合、分類マッピングを通じてターゲット分類を現在の Web サイトのコンテンツ分類と結合することもできます。カテゴリごとに収集タスクを作成する必要はありません。
5. 収集ルールの設定はシンプルで分かりやすいです。プログラムにはフォアグラウンド実行とバックグラウンドでスケジュールされた実行の 2 つの実行モードがあります。
6. コンテンツのページング、他のページの部分情報、小説の連載など、マスターとスレーブのテーブル関連付けによる情報収集など、多層レベルのWebページの詳細な収集を実現できます。
7. オリジナルのブレークポイント再開収集。収集プログラムは、ターゲット Web サイトが更新されたときにのみ収集し、更新された部分のみを収集するため、非常に効率的です。 この機能は、連載小説やテレビシリーズなどの連載サイトを収集する場合に特に便利です。
8. 関連する外部ファイルをローカル サーバーに自動的にダウンロードするか、画像、FLASH、ダウンロード ファイルなどのリモート パスに置き換えます。サーバーに手動でアップロードする必要はありません。
9. 収集モデルの定義をサポートします。必要に応じて、各モデルにサブモデルを含めることもできます。
10. ほとんどのコレクション サイトの Web ページ コードを自動的に識別します。たとえば、一般的なもの: GB2312、GBK、UTF-8、windows-1252、iso646-us など。
11. リスト ページからのサムネイルやその他の追加情報の収集をサポートします。
12. マルチスレッドの非同期収集、高い収集効率、および低いサーバー リソース消費。
v1.5.4
改善:自動再起動時にコレクションURLキュー数が5000を超えて停止できない問題を修正 2008-2-29
改善:収集アイテムの詳細フィルタリング設定で、置換ができるようになりました。形式は、元のフィルタリング ルールの後に「[to]」を追加します。 2008-2-29
追加: 収集ステーションのサーバーに大きな負荷をかけないようにするため、収集時間間隔の設定を追加しました。 追加: 収集 Web サイトでログイン検証が必要な状況を追加し、ログインと検証アドレスを設定する必要があることを追加しました。 2008-3-1
追加: リスト JS 送信メソッド (Post) ページネーション。使用法: 送信アドレスにパラメータ「?fc_action=post¶meter 1={$pageid}」を追加します。送信ページにすでに「?」が含まれている場合は、「&fc_action=post¶meter 1={$pageid}」になります。2008-3 -1