Для получения последней информации о Nutch посетите наш веб-сайт по адресу:
https://nitch.apache.org/
и наша вики по адресу:
https://cwiki.apache.org/confluence/display/NUTCH/Home
Чтобы начать использовать Nutch, прочитайте руководство:
https://cwiki.apache.org/confluence/display/NUTCH/NutchTutorial
Чтобы добавить патч, следуйте этим инструкциям (обратите внимание, что установка Hub не является строго обязательной, но рекомендуется).
git clone https://github.com/apache/nutch.git
cd nutch
git checkout -b NUTCH-xxxx
git status
(убедитесь, что он показывает, какие файлы вы собираетесь редактировать)git add <files>
git commit -m "fix for NUTCH-xxx contributed by <your username>"
hub fork
(если хаб не установлен, вы можете форкнуть проект с помощью кнопки «вилка» на странице проекта Nutch Github)git push -u <your git username> NUTCH-xxxx
hub pull-request
(если хаб не установлен, следуйте инструкциям по созданию пул-реквеста из форка)Создание файлов проекта Eclipse
ant eclipse
и следуйте инструкциям в разделе Импорт существующих проектов.
Перед запуском необходимо настроить файл nutch-site.xml. Убедитесь, что вы добавили свойства http.agent.name
и plugin.folders
. Plugin.folders обычно указывает на <project_root>/build/plugins
.
Теперь создайте конфигурацию приложения Java, выберите org.apache.nutch.crawl.Injector и добавьте два пути в качестве аргументов. Первый из них — это каталог crawldb, второй — каталог URL-адресов, из которого инжектор может читать URL-адреса. Теперь запустите вашу конфигурацию.
Если мы по-прежнему видим сообщение No plugins found on paths of property plugin.folders="plugins"
, обновите плагин.folders в файле nutch-default.xml, это быстрое решение, но его не следует использовать.
Сначала установите плагин IvyIDEA. затем запустите ant eclipse
. При этом будут созданы необходимые файлы .classpath и .project, чтобы Intellij мог импортировать проект на следующем этапе.
В Intellij IDEA выберите «Файл» > «Создать» > «Проект из существующих источников». Выберите домашний каталог Nutch и нажмите «Открыть».
На экране «Импорт проекта» выберите переключатель «Импортировать проект из внешней модели» и выберите «Eclipse». Нажмите «Создать». На следующем экране «Каталог проектов Eclipse» уже должен быть установлен в папку nutch. Оставьте выбранным переключатель «Создавать файлы модулей рядом с файлами .classpath». Нажмите «Далее» на следующих экранах. На экране SDK проекта выберите Java 11 и нажмите «Создать». NB. Всем, кто пользуется Mac с установленным в домашних условиях openjdk, необходимо использовать каталог в libexec : <openjdk11_directory>/libexec/openjdk.jdk/Contents/Home
.
После импорта проекта вы увидите всплывающее окно с надписью «Обнаружены сценарии сборки Ant», «Обнаружены фреймворки — обнаружен IvyIDEA Framework». Нажмите «Импортировать». Если всплывающее окно не появилось, я бы посоветовал повторить шаги еще раз, поскольку это происходит время от времени. Существует еще одно всплывающее окно Ant, в котором вас просят настроить проект. НЕ нажимайте «Настроить».
Чтобы импортировать стиль кода, перейдите в Intellij IDEA > Настройки > Редактор > Стиль кода > Java.
В раскрывающемся списке «Схема» выберите «Проект». Щелкните значок шестеренки и выберите «Импортировать схему» > «XML-файл Eclipse».
Выберите файл eclipse-format.xml и нажмите «Открыть». На следующем экране установите флажок «Текущая схема» и нажмите «ОК».
Бег в Intellij
Примечание . Вам нужно будет вручную запустить сборку через ANT, чтобы получить последние обновленные изменения при запуске. Это связано с тем, что система сборки ant отличается от системы Intellij.