Nutch に関する最新情報については、次の Web サイトをご覧ください。
https://nutch.apache.org/
および私たちのウィキは次のとおりです。
https://cwiki.apache.org/confluence/display/NUTCH/Home
Nutch の使用を開始するには、チュートリアルをお読みください。
https://cwiki.apache.org/confluence/display/NUTCH/NutchTutorial
パッチを提供するには、次の手順に従ってください (Hub のインストールは必須ではありませんが、推奨されることに注意してください)。
git clone https://github.com/apache/nutch.git
cd nutch
git checkout -b NUTCH-xxxx
git status
(編集する予定のファイルが表示されていることを確認してください)git add <files>
git commit -m "fix for NUTCH-xxx contributed by <your username>"
hub fork
(ハブがインストールされていない場合は、Nutch Github プロジェクト ページの [フォーク] ボタンを使用してプロジェクトをフォークできます)git push -u <your git username> NUTCH-xxxx
hub pull-request
(ハブがインストールされていない場合は、フォークからプル リクエストを作成する手順に従ってください)Eclipseプロジェクトファイルを生成する
ant eclipse
そして、「既存のプロジェクトのインポート」の指示に従います。
実行する前に、nutch-site.xml を構成する必要があります。 http.agent.name
プロパティとplugin.folders
プロパティを追加していることを確認してください。 plugin.folders は通常、 <project_root>/build/plugins
を指します。
次に、Java アプリケーション構成を作成し、org.apache.nutch.crawl.Injector を選択し、引数として 2 つのパスを追加します。最初の 1 つは、crawldb ディレクトリで、2 番目のディレクトリは、インジェクターが URL を読み取ることができる URL ディレクトリです。次に、構成を実行します。
それでもNo plugins found on paths of property plugin.folders="plugins"
メッセージが表示される場合は、nutch-default.xml 内の plugin.folders を更新してください。これは簡単な修正ですが、使用しないでください。
まず、IvyIDEAプラグインをインストールします。次に、 ant eclipse
実行します。これにより、Intellij が次のステップでプロジェクトをインポートできるように、必要な .classpath ファイルと .project ファイルが作成されます。
Intellij IDEA で、[ファイル] > [新規作成] > [既存のソースからのプロジェクト] を選択します。 Nutchのホームディレクトリを選択し、「開く」をクリックします。
「プロジェクトのインポート」画面で「外部モデルからプロジェクトをインポート」ラジオボタンを選択し、「Eclipse」を選択します。 「作成」をクリックします。次の画面では、「Eclipse プロジェクト ディレクトリ」がすでに Nutch フォルダーに設定されているはずです。 「.classpath ファイルの近くにモジュール ファイルを作成する」ラジオ ボタンは選択したままにしておきます。次の画面で「次へ」をクリックします。プロジェクトSDK画面でJava 11を選択し、「作成」をクリックします。注意: homebrew がインストールされた openjdk を搭載した Mac を使用している場合は、 libexecの下のディレクトリを使用する必要があります: <openjdk11_directory>/libexec/openjdk.jdk/Contents/Home
。
プロジェクトがインポートされると、「Ant ビルド スクリプトが見つかりました」、「フレームワークが検出されました - IvyIDEA Framework が検出されました」というポップアップが表示されます。 「インポート」をクリックします。ポップアップが表示されない場合は、この問題が時々発生するため、手順をもう一度実行することをお勧めします。プロジェクトの構成を求める別の Ant ポップアップがあります。 「設定」をクリックしないでください。
コード スタイルをインポートするには、[Intellij IDEA] > [設定] > [エディター] > [コード スタイル] > [Java] に移動します。
[スキーム] ドロップダウンで [プロジェクト] を選択します。歯車アイコンをクリックし、「スキームのインポート」 > 「Eclipse XML ファイル」を選択します。
eclipse-format.xml ファイルを選択し、「開く」をクリックします。次の画面で「現在のスキーム」チェックボックスをオンにして、「OK」をクリックします。
Intellij での実行
注: 実行時に最新の更新された変更を取得するには、ANT を介してビルドを手動でトリガーする必要があります。これは、ant ビルド システムが Intellij ビルド システムとは別個であるためです。