Untuk informasi terbaru mengenai Nutch, silahkan kunjungi website kami di:
https://nutch.apache.org/
dan wiki kami, di:
https://cwiki.apache.org/confluence/display/NUTCH/Home
Untuk mulai menggunakan Nutch, baca Tutorial:
https://cwiki.apache.org/confluence/display/NUTCH/NutchTutorial
Untuk menyumbangkan patch, ikuti petunjuk berikut (perhatikan bahwa menginstal Hub tidak sepenuhnya diperlukan, tetapi disarankan).
git clone https://github.com/apache/nutch.git
cd nutch
git checkout -b NUTCH-xxxx
git status
(pastikan itu menunjukkan file apa yang ingin Anda edit)git add <files>
git commit -m "fix for NUTCH-xxx contributed by <your username>"
hub fork
(jika hub tidak diinstal, Anda dapat melakukan fork proyek menggunakan tombol "fork" di halaman proyek Nutch Github)git push -u <your git username> NUTCH-xxxx
hub pull-request
(jika hub belum terpasang, silakan ikuti petunjuk cara membuat pull-request dari fork)Hasilkan file proyek Eclipse
ant eclipse
dan ikuti instruksi di Mengimpor proyek yang ada.
Anda harus mengkonfigurasi nutch-site.xml sebelum menjalankannya. Pastikan, Anda telah menambahkan properti http.agent.name
dan plugin.folders
. Plugin.folders biasanya menunjuk ke <project_root>/build/plugins
.
Sekarang buat Konfigurasi Aplikasi Java, pilih org.apache.nutch.crawl.Injector, tambahkan dua jalur sebagai argumen. Yang pertama adalah direktori crawldb, yang kedua adalah direktori URL tempat injektor dapat membaca url. Sekarang jalankan konfigurasi Anda.
Jika kami masih melihat No plugins found on paths of property plugin.folders="plugins"
, perbarui plugin.folders di nutch-default.xml, ini adalah perbaikan cepat, tetapi tidak boleh digunakan.
Pertama instal Plugin IvyIDEA. lalu jalankan ant eclipse
. Ini akan membuat file .classpath dan .project yang diperlukan sehingga Intellij dapat mengimpor proyek pada langkah berikutnya.
Di Intellij IDEA, pilih File > Baru > Proyek dari Sumber yang Ada. Pilih direktori home nutch dan klik "Buka".
Pada layar "Impor Proyek" pilih tombol radio "Impor proyek dari model eksternal" dan pilih "Eclipse". Klik "Buat". Pada layar berikutnya, "Direktori proyek Eclipse" seharusnya sudah disetel ke folder nutch. Biarkan tombol radio "Buat file modul di dekat file .classpath" dipilih. Klik "Berikutnya" di layar berikutnya. Pada layar proyek SDK pilih Java 11 dan klik "Buat". NB Bagi siapa pun yang menggunakan Mac dengan openjdk yang diinstal homebrew, Anda perlu menggunakan direktori di bawah libexec : <openjdk11_directory>/libexec/openjdk.jdk/Contents/Home
.
Setelah proyek diimpor, Anda akan melihat popup yang mengatakan "Skrip pembuatan semut ditemukan", "Kerangka terdeteksi - Kerangka IvyIDEA terdeteksi". Klik "Impor". Jika Anda tidak mendapatkan pop-up, saya sarankan untuk mengulangi langkah-langkah tersebut lagi karena hal ini terjadi dari waktu ke waktu. Ada popup Ant lain yang meminta Anda untuk mengkonfigurasi proyek. JANGAN klik "Konfigurasi".
Untuk mengimpor gaya kode, Buka Intellij IDEA > Preferensi > Editor > Gaya Kode > Java.
Untuk dropdown Skema pilih "Proyek". Klik ikon roda gigi dan pilih "Impor Skema" > "File XML Eclipse".
Pilih file Eclipse-format.xml dan klik "Buka". Pada layar berikutnya centang kotak "Skema Saat Ini" dan tekan OK.
Berjalan di Intellij
Catatan : Anda perlu memicu build secara manual melalui ANT untuk mendapatkan perubahan terbaru saat dijalankan. Ini karena sistem ant build terpisah dari sistem Intellij.