Kerangka Deteksi Objek Darknet dan YOLO
Logo !darknet dan hank.ai
Darknet adalah kerangka jaringan saraf sumber terbuka yang ditulis dalam C, C++ dan CUDA.
YOLO (You Only Look Once) adalah sistem deteksi objek real-time canggih yang berjalan dalam kerangka Darknet.
Baca bagaimana Hank.ai membantu komunitas Darknet/YOLO
Mengumumkan Darknet V3 "Jazz"
Kunjungi situs web Darknet/YOLO
Silakan baca FAQ Darknet/YOLO
Bergabunglah dengan server Darknet/YOLO Discord
Dokumen
1. Kertas YOLOv7
2. Kertas Berskala-YOLOv4
3. Kertas YOLOv4
4. Kertas YOLOv3
Informasi Umum
Kerangka kerja Darknet/YOLO lebih cepat dan akurat dibandingkan kerangka kerja lain dan versi YOLO.
Kerangka kerja ini sepenuhnya gratis dan open source. Anda dapat mengintegrasikan Darknet/YOLO ke dalam proyek dan produk yang sudah ada, termasuk produk komersial, tanpa lisensi atau biaya.
Darknet V3 ("Jazz"), dirilis pada Oktober 2024, dapat menjalankan video dataset LEGO secara akurat hingga 1000 FPS saat menggunakan GPU NVIDIA RTX 3090, artinya setiap frame video dapat diproses dalam 1 milidetik atau Baca, diubah ukurannya, dan diproses oleh Darknet /YOLO dalam waktu lebih singkat.
Jika Anda memerlukan bantuan atau ingin berdiskusi tentang Darknet/YOLO, silakan bergabung dengan server Darknet/YOLO Discord: https://discord.gg/zSq8rtW
Versi CPU Darknet/YOLO dapat berjalan di perangkat sederhana seperti Raspberry Pi, server cloud & colab, desktop, laptop, dan platform pelatihan kelas atas. Versi GPU Darknet/YOLO memerlukan GPU NVIDIA yang kompatibel dengan CUDA.
Darknet/YOLO diketahui berjalan di Linux, Windows, dan Mac. Lihat petunjuk pembuatan di bawah.
Versi jaringan gelap
Alat Darknet asli, yang ditulis oleh Joseph Redmon pada tahun 2013-2017, tidak memiliki nomor versi. Kami menganggap versi ini 0.x.
Repositori Darknet populer berikutnya yang dikelola oleh Alexei Bochkovskiy antara tahun 2017-2021 juga tidak memiliki nomor versi. Kami menganggap ini versi 1.x.
Repositori Darknet, disponsori oleh Hank.ai dan dikelola oleh Stéphane Charette mulai tahun 2023, adalah yang pertama memiliki perintah versi. Dari tahun 2023 hingga akhir tahun 2024, ia kembali ke versi 2.x "OAK".
Tujuannya adalah untuk sesedikit mungkin memecah fungsionalitas yang ada sambil membiasakan diri dengan basis kode.
Tulis ulang langkah-langkah pembangunan sehingga kita memiliki cara terpadu untuk membangun di Windows dan Linux menggunakan CMake.
Konversikan basis kode untuk menggunakan kompiler C++.
Chart.png yang ditingkatkan selama pelatihan.
Perbaikan bug dan optimalisasi terkait kinerja, terutama terkait dengan pengurangan waktu yang diperlukan untuk melatih jaringan.
Cabang terakhir dari basis kode ini adalah versi 2.1 di cabang v2.
Tahap pengembangan selanjutnya dimulai pada pertengahan tahun 2024 dan akan dirilis pada bulan Oktober 2024. Perintah versi sekarang mengembalikan 3.x "JAZZ".
Menghapus banyak perintah lama dan tidak terawat.
Banyak optimasi kinerja, baik pada waktu pelatihan maupun pada waktu inferensi.
C API tradisional telah dimodifikasi; aplikasi yang menggunakan Darknet API asli memerlukan sedikit modifikasi: https://darknetcv.ai/api/api.html
API Darknet V3 C dan C++ baru: https://darknetcv.ai/api/api.html
Aplikasi baru dan kode contoh dalam contoh src: https://darknetcv.ai/api/files.html
Jika Anda perlu menjalankan salah satu perintah ini, Anda selalu dapat memeriksa cabang v2 sebelumnya. Harap beri tahu kami sehingga kami dapat menyelidiki penambahan kembali perintah yang hilang.
Anak angkat beban MSCOCO yang telah dilatih sebelumnya
Untuk kenyamanan, beberapa versi YOLO yang populer telah dilatih sebelumnya pada kumpulan data MSCOCO. Kumpulan data ini berisi 80 kategori dan dapat dilihat pada file teks cfg/coco.names.
Ada beberapa kumpulan data sederhana dan anak timbangan terlatih lainnya yang tersedia untuk pengujian Darknet/YOLO, seperti LEGO Gears dan Rolodex. Untuk informasi lebih lanjut, lihat FAQ Darknet/YOLO.
Anak timbangan terlatih MSCOCO dapat diunduh dari sejumlah lokasi berbeda atau dari repositori ini:
1.YOLOv2, November 2016
* YOLOv2-kecil
*YOLOv2-penuh
2. YOLOv3, Mei 2018
* YOLOv3-kecil
*YOLOv3-penuh
3. YOLOv4, Mei 2020
* YOLOv4-kecil
*YOLOv4-penuh
4. YOLOv7, Agustus 2022
* YOLOv7-kecil
*YOLOv7-penuh
Anak timbangan MSCOCO yang telah dilatih sebelumnya hanya untuk tujuan demonstrasi. File .cfg dan .names yang sesuai untuk MSCOCO terletak di direktori cfg. Contoh perintah:
' pesta
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.nama yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.nama yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
Perhatikan bahwa seseorang harus melatih jaringannya sendiri. MSCOCO sering digunakan untuk memastikan bahwa semuanya baik-baik saja.
membangun
Berbagai metode pembangunan yang tersedia di masa lalu (sebelum tahun 2023) telah digabungkan menjadi satu solusi terpadu. Darknet memerlukan C++17 atau lebih tinggi, OpenCV, dan menggunakan CMake untuk menghasilkan file proyek yang diperlukan.
Anda tidak perlu mengetahui C++ untuk membuat, menginstal, atau menjalankan Darknet/YOLO, sama seperti Anda tidak perlu menjadi mekanik untuk mengendarai mobil.
Berhati-hatilah jika Anda mengikuti tutorial lama yang memiliki langkah-langkah pembuatan yang lebih kompleks, atau jika langkah-langkah pembuatannya tidak cocok dengan yang ada di readme ini. Mulai Agustus 2023, langkah-langkah build baru dijelaskan di bawah.
Pengembang perangkat lunak dianjurkan untuk mengunjungi https://darknetcv.ai/ untuk informasi lebih lanjut tentang internal kerangka deteksi objek Darknet/YOLO.
Google Kolab
Petunjuk Google Colab sama dengan petunjuk Linux. Ada beberapa notebook Jupyter yang menunjukkan cara melakukan tugas tertentu, seperti melatih jaringan baru.
Lihat notebook di subdirektori colab, atau ikuti petunjuk Linux di bawah.
Metode CMake Linux
Tutorial pembuatan Darknet untuk Linux
Opsional: Jika Anda memiliki GPU NVIDIA modern, Anda dapat menginstal CUDA atau CUDA+cuDNN saat ini. Jika dipasang, Darknet akan menggunakan GPU Anda untuk mempercepat pemrosesan gambar (dan video).
Anda harus menghapus file CMakeCache.txt dari direktori build Darknet untuk memaksa CMake menemukan kembali semua file yang diperlukan.
Ingatlah untuk membangun kembali Darknet.
Darknet dapat berjalan tanpanya, tetapi jika Anda ingin melatih jaringan khusus, Anda memerlukan CUDA atau CUDA+cuDNN.
Kunjungi https://developer.nvidia.com/cuda-downloads untuk mengunduh dan menginstal CUDA.
Kunjungi https://developer.nvidia.com/rdp/cudnn-download atau https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview untuk mengunduh dan Instal cuDNN.
Setelah menginstal CUDA, pastikan Anda dapat menjalankan nvcc dan nvidia-smi. Anda mungkin perlu mengubah variabel PATH.
Jika Anda menginstal CUDA atau CUDA+cuDNN di lain waktu, atau jika Anda mengupgrade ke versi perangkat lunak NVIDIA yang lebih baru:
Instruksi ini mengasumsikan (tetapi tidak memerlukan!) sistem yang menjalankan Ubuntu 22.04. Jika menggunakan distribusi lain, sesuaikan dengan kebutuhan.
' pesta
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
git klon https://github.com/hank-ai/darknet
cd darknet
mkdir membangun
pembuatan cd
cmake -DCMAKEBUILDTYPE=Lepaskan ..
buat paket -j4
sudo dpkg -i darknet-VERSION.deb
`
Jika Anda menggunakan CMake versi lama, Anda perlu memutakhirkan CMake sebelum menjalankan perintah cmake di atas. Upgrade CMake di Ubuntu dapat dilakukan dengan menggunakan perintah berikut:
' pesta
sudo apt-get pembersihan cmake
sudo snap install cmake --klasik
`
Jika Anda menggunakan bash sebagai shell perintah, Anda perlu me-restart shell Anda pada saat ini. Jika Anda menggunakan ikan, ia harus segera mengambil jalur baru.
Pengguna tingkat lanjut:
Jika Anda ingin membuat file instalasi RPM dan bukan file DEB, lihat baris yang relevan di CM_package.cmake. Sebelum menjalankan paket make -j4 Anda perlu mengedit dua baris ini:
`membuat
SET (CPACKGENERATOR "DEB")# SET (CPACKGENERATOR "RPM")
`
Untuk distribusi seperti Centos dan OpenSUSE, Anda perlu mengganti dua baris ini di CM_package.cmake ke:
`membuat
SET (CPACK_GENERATOR "DEB")
SET (CPACK_GENERATOR "RPM")
`
Untuk menginstal sebuah paket, gunakan manajer paket distribusi Anda yang biasa. Misalnya pada sistem berbasis Debian seperti Ubuntu:
' pesta
sudo dpkg -i darknet-2.0.1-Linux.deb
`
Menginstal paket .deb akan menyalin file berikut:
/usr/bin/darknet adalah Darknet biasa yang dapat dieksekusi. Jalankan versi darknet dari CLI untuk mengonfirmasi bahwa versi tersebut telah diinstal dengan benar.
/usr/include/darknet.h adalah API Darknet, yang digunakan oleh pengembang C, C++, dan Python.
/usr/include/darknet_version.h berisi informasi versi untuk pengembang.
/usr/lib/libdarknet.so adalah perpustakaan untuk menghubungkan pengembang C, C++ dan Python.
/opt/darknet/cfg/... adalah tempat semua templat .cfg disimpan.
Anda sudah selesai sekarang! Darknet dibangun dan diinstal ke /usr/bin/. Jalankan perintah berikut untuk menguji: versi darknet.
Jika Anda tidak memiliki /usr/bin/darknet, Anda tidak menginstalnya, Anda baru saja membuatnya! Pastikan untuk menginstal file .deb atau .rpm seperti dijelaskan di atas.
Metode Windows CMake
Petunjuk ini mengasumsikan instalasi baru Windows 11 22H2.
Buka jendela prompt perintah cmd.exe normal dan jalankan perintah berikut:
' pesta
dapatkan instal Git.Git
winget instal Kitware.CMake
winget instal nsis.nsis
winget instal Microsoft.VisualStudio.2022.Community
`
Pada titik ini, kita perlu memodifikasi instalasi Visual Studio untuk menyertakan dukungan untuk aplikasi C++:
Klik pada menu Start Windows dan jalankan Visual Studio Installer
Klik "Edit"
Pilih "Pengembangan desktop menggunakan C++"
Klik "Edit" di pojok kanan bawah, lalu klik "Ya"
Setelah semuanya diunduh dan diinstal, klik lagi menu Start Windows dan pilih Prompt Perintah Pengembang untuk Visual Studio 2022. Jangan gunakan PowerShell untuk langkah ini, Anda akan mengalami masalah!
Pengguna tingkat lanjut:
Daripada menjalankan command prompt pengembang, Anda dapat masuk ke perangkat menggunakan command prompt normal atau ssh dan menjalankan "Program FilesMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat" secara manual.
Setelah Anda menjalankan command prompt pengembang seperti di atas (bukan PowerShell!), jalankan perintah berikut untuk menginstal Microsoft VCPKG, yang akan digunakan untuk membangun OpenCV:
' pesta
CDC:
mkdir c:srccd c:src
git clone https://github.com/microsoft/vcpkg
cd vcpkg.dll
bootstrap-vcpkg.bat
.vcpkg.exe mengintegrasikan instalasi
.vcpkg.exe mengintegrasikan powershell.vcpkg.exe instal opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Harap bersabar dengan langkah terakhir ini karena mungkin memerlukan waktu lama untuk dijalankan. Ini membutuhkan banyak pengunduhan dan pembuatan.
Pengguna tingkat lanjut:
Perhatikan bahwa ada banyak modul opsional lain yang mungkin ingin Anda tambahkan saat membuat OpenCV. Jalankan .vcpkg.exe search opencv untuk melihat daftar lengkapnya.
Opsional: Jika Anda memiliki GPU NVIDIA modern, Anda dapat menginstal CUDA atau CUDA+cuDNN saat ini. Jika dipasang, Darknet akan menggunakan GPU Anda untuk mempercepat pemrosesan gambar (dan video).
Anda harus menghapus file CMakeCache.txt dari direktori build Darknet untuk memaksa CMake menemukan kembali semua file yang diperlukan.
Ingatlah untuk membangun kembali Darknet.
Darknet dapat berjalan tanpanya, tetapi jika Anda ingin melatih jaringan khusus, Anda memerlukan CUDA atau CUDA+cuDNN.
Kunjungi https://developer.nvidia.com/cuda-downloads untuk mengunduh dan menginstal CUDA.
Kunjungi https://developer.nvidia.com/rdp/cudnn-download atau https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows untuk mengunduh dan menginstal cuDNN.
Setelah menginstal CUDA, pastikan Anda dapat menjalankan nvcc.exe dan nvidia-smi.exe. Anda mungkin perlu mengubah variabel PATH.
Setelah mengunduh cuDNN, unzip dan salin direktori bin, include, dan lib ke C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[version]/. Anda mungkin perlu menimpa beberapa file.
Jika Anda menginstal CUDA atau CUDA+cuDNN di lain waktu, atau jika Anda mengupgrade ke versi perangkat lunak NVIDIA yang lebih baru:
CUDA harus diinstal setelah Visual Studio. Jika Anda memutakhirkan Visual Studio, ingatlah untuk menginstal ulang CUDA.
Setelah semua langkah sebelumnya berhasil diselesaikan, Anda perlu mengkloning Darknet dan membangunnya. Pada langkah ini kita juga perlu memberi tahu CMake di mana vcpkg berada sehingga dapat menemukan OpenCV dan dependensi lainnya:
' pesta
cd c:src
git klon https://github.com/hank-ai/darknet.git
cd darknet
pembuatan mkdir
pembuatan cd
cmake -DCMAKEBUILDTYPE=Rilis -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Rilis PACKAGE.vcxproj
`
Jika Anda menerima kesalahan tentang beberapa CUDA atau cuDNN DLL yang hilang (misalnya, cublas64_12.dll), salin file CUDA .dll secara manual ke direktori keluaran yang sama dengan Darknet.exe. Misalnya:
' pesta
salin "C:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(Ini adalah contohnya! Silakan periksa versi mana yang Anda jalankan dan jalankan perintah yang sesuai untuk versi yang telah Anda instal.)
Setelah menyalin file, jalankan kembali perintah msbuild.exe terakhir untuk menghasilkan paket instalasi NSIS:
' pesta
msbuild.exe /property:Platform=x64;Configuration=Rilis PACKAGE.vcxproj
`
Pengguna tingkat lanjut:
Perhatikan bahwa output dari perintah cmake adalah file solusi Visual Studio normal Darknet.sln. Jika Anda seorang pengembang perangkat lunak yang secara rutin menggunakan Visual Studio GUI alih-alih msbuild.exe untuk membangun proyek, Anda dapat mengabaikan baris perintah dan memuat proyek Darknet di Visual Studio.
Anda sekarang seharusnya sudah menyiapkan file ini untuk dijalankan: C:srcDarknetbuildsrc-cliReleasedarknet.exe. Jalankan perintah berikut untuk menguji: Versi C:srcDarknetbuildsrc-cliReleasedarknet.exe.
Untuk menginstal Darknet, pustaka, menyertakan file, dan DLL yang diperlukan dengan benar, jalankan wizard instalasi NSIS yang dibuat pada langkah terakhir. Lihat file darknet-VERSION.exe di direktori build. Misalnya:
' pesta
darknet-2.0.31-win64.exe
`
Menginstal paket instalasi NSIS akan:
Buat direktori bernama Darknet, misalnya C:Program FilesDarknet.
Instal aplikasi CLI darknet.exe dan aplikasi contoh lainnya.
Instal file .dll pihak ketiga yang diperlukan, seperti file dari OpenCV.
Instal file Darknet .dll, .lib, dan .h yang diperlukan untuk menggunakan darknet.dll dari aplikasi lain.
Instal file templat .cfg.
Anda sudah selesai sekarang! Setelah wizard instalasi selesai, Darknet akan diinstal ke C:Program FilesDarknet. Jalankan perintah berikut untuk menguji: C:Program FilesDarknetbindarknet.exe version.
Jika Anda tidak memiliki C:/Program Files/darknet/bin/darknet.exe, Anda tidak menginstalnya, Anda baru saja membuatnya! Harap pastikan untuk menyelesaikan setiap panel Wizard Instalasi NSIS pada langkah sebelumnya.
Menggunakan Darknet
CLI
Berikut ini bukan daftar lengkap semua perintah yang didukung oleh Darknet.
Selain CLI Darknet, perhatikan juga CLI proyek DarkHelp, yang menyediakan CLI alternatif untuk Darknet/YOLO. DarkHelp CLI juga memiliki beberapa fitur lanjutan yang tidak tersedia secara langsung di Darknet. Anda dapat menggunakan Darknet CLI dan DarkHelp CLI secara bersamaan, keduanya tidak eksklusif.
Untuk sebagian besar perintah yang ditampilkan di bawah, Anda memerlukan file .weights dan file .names dan .cfg yang terkait. Anda dapat melatih jaringan Anda sendiri (sangat disarankan!) atau mengunduh jaringan yang telah dilatih dan disediakan orang lain ke Internet secara gratis. Contoh kumpulan data pra-pelatihan meliputi:
1. LEGO Gears (temukan objek dalam gambar)
2. Rolodex (menemukan teks dalam gambar)
3. MSCOCO (deteksi target kategori standar 80)
Perintah yang dapat dijalankan meliputi:
Daftar beberapa perintah dan opsi yang dapat dijalankan:
' pesta
bantuan darknet
`
Periksa versi:
' pesta
versi darknet
`
Gunakan prediksi gambar:
V2: uji detektor darknet cars.data cars.cfg cars_best.weights image1.jpg
V3: darknet02displayannotatedimages cars.cfg image1.jpg
DarkHelp: DarkHelp mobil.cfg mobil.cfg mobil_best.weights image1.jpg
Koordinat keluaran:
V2: detektor darknet menguji animal.data animal.cfg animalbest.weights -extoutput dog.jpg
V3: darknet01inference_images hewan anjing.jpg
DarkHelp: DarkHelp --json animal.cfg animal.names animal_best.weights dog.jpg
Memproses video:
V2: demo detektor darknet animal.data animal.cfg animalbest.weights -extoutput test.mp4
V3: darknet03display_videos animal.cfg test.mp4
DarkHelp: DarkHelp animal.cfg animal.names animal_best.weights test.mp4
Membaca dari kamera web:
V2: demo detektor darknet animal.data animal.cfg animal_best.weights -c 0
V3: darknet08display_webcam hewan
Simpan hasil ke video:
V2: demo detektor darknet animal.data animal.cfg animalbest.weights test.mp4 -outfilename res.avi
V3: darknet05processvideoshewan multithread.cfg hewan.nama hewan_terbaik.uji bobot.mp4
DarkHelp: DarkHelp animal.cfg animal.names animal_best.weights test.mp4
JSON:
V2: demo detektor darknet animal.data animal.cfg animalbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
V3: darknet06imagestojson hewan image1.jpg
DarkHelp: DarkHelp --json animal.names animal.cfg animal_best.weights image1.jpg
Jalankan pada GPU tertentu:
V2: demo detektor darknet animal.data animal.cfg animal_best.weights -i 1 test.mp4
Periksa keakuratan jaringan saraf:
' pesta
peta detektor darknet Driving.data Driving.cfg Driving_best.weights ...
`
`
Nama Id Rata-rata Presisi TP FN FP TN Akurasi ErrorRate Precision Recall Spesifisitas FalsePosRate
-- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ---------- ----------
0 kendaraan 91,2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821
1 sepeda motor 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954
2 sepeda 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285
3 orang 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855
4 banyak kendaraan 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610
5 lampu hijau 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102
6 lampu kuning 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236
7 lampu merah 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
Periksa akurasi mAP@IoU=75:
' pesta
detektor darknet peta animal.data animal.cfg animalbest.weights -iouthresh 0.75
`
Menghitung ulang titik jangkar paling baik dilakukan di DarkMark karena akan berjalan 100 kali berturut-turut dan memilih titik jangkar terbaik dari semua titik jangkar yang dihitung. Namun, jika Anda ingin menjalankan versi lama di Darknet:
' pesta
detektor darknet calcanchors animal.data -numof_clusters 6 -width 320 -height 256
`
Latih jaringan baru:
' pesta
detektor darknet -peta -dont_show melatih hewan.data hewan.cfg
`
(Lihat juga bagian pelatihan di bawah)
kereta
Tautan cepat ke bagian yang relevan di FAQ Darknet/YOLO:
1. Bagaimana cara mengatur file dan direktori saya?
2. Profil mana yang harus saya gunakan?
3. Perintah manakah yang harus saya gunakan saat melatih jaringan saya sendiri?
Menggunakan DarkMark untuk membuat semua file Darknet yang diperlukan adalah cara termudah untuk membuat anotasi dan melatih. Ini jelas merupakan cara yang disarankan untuk melatih jaringan saraf baru.
Jika Anda ingin mengatur berbagai file secara manual untuk melatih jaringan khusus:
1. Buat folder baru untuk menyimpan file. Dalam contoh ini, Anda akan membuat jaringan saraf yang mendeteksi hewan, jadi buatlah direktori berikut: ~/nn/animals/.
2. Copy salah satu file konfigurasi Darknet yang ingin digunakan sebagai template. Misalnya, lihat cfg/yolov4-tiny.cfg. Tempatkan di folder yang Anda buat. Dalam contoh ini, kita sekarang memiliki ~/nn/animals/animals.cfg.
3. Buat file teks animal.names di folder yang sama tempat Anda meletakkan file konfigurasi. Dalam contoh ini, kita sekarang memiliki ~/nn/animals/animals.names.
4. Gunakan editor teks untuk mengedit file animal.names. Cantumkan kategori yang ingin Anda gunakan. Anda harus memiliki tepat 1 entri per baris, tidak ada baris kosong, tidak ada komentar. Dalam contoh ini, file .names akan berisi 4 baris:
`
anjing
kucing
burung
kuda
`
5. Buat file teks animal.data di folder yang sama. Dalam contoh ini, file .data akan berisi:
`
kelas=4
kereta=/home/nama pengguna/nn/animals/animals_train.txt
valid=/home/nama pengguna/nn/animals/animals_valid.txt
nama=/home/nama pengguna/nn/animals/animals.names
backup=/home/nama pengguna/nn/animals
`
6. Buat folder untuk menyimpan gambar dan anotasi Anda. Misalnya, ini bisa berupa ~/nn/animals/dataset. Setiap gambar memerlukan file .txt terkait yang menjelaskan anotasi untuk gambar tersebut. Format file komentar .txt sangat spesifik. Anda tidak dapat membuat file ini secara manual karena setiap anotasi harus berisi koordinat anotasi yang tepat. Lihat DarkMark atau perangkat lunak serupa lainnya untuk membuat anotasi pada gambar Anda. Format anotasi YOLO dijelaskan di FAQ Darknet/YOLO.
7. Buat file teks "train" dan "valid" yang diberi nama dalam file .data. Kedua file teks ini perlu mencantumkan semua gambar yang harus digunakan Darknet untuk pelatihan dan validasi, masing-masing, untuk validasi saat menghitung mAP%. Tepatnya ada satu gambar per baris. Jalur dan nama file bisa bersifat relatif atau absolut.
8. Gunakan editor teks untuk mengubah file .cfg Anda.
* Pastikan batch=64.
* Perhatikan subdivisi. Tergantung pada ukuran jaringan dan jumlah memori yang tersedia pada GPU, Anda mungkin perlu menambah subdivisi. Nilai terbaik untuk digunakan adalah 1, jadi mulailah dengan itu. Jika Anda tidak dapat menggunakan 1, silakan lihat FAQ Darknet/YOLO.
Perhatikan bahwa maxbatches=.... Saat memulai, nilai optimal untuk digunakan adalah sejumlah kelas 2000. Dalam contoh ini kita mempunyai 4 hewan, jadi 4 * 2000 = 8000. Artinya kita akan menggunakan maxbatches=8000.
*Catatan langkah=.... Ini harus diatur ke 80% dan 90% dari maxbatch. Dalam contoh ini, kita akan menggunakan langkah=6400,7200 karena maxbatches disetel ke 8000.
* Perhatikan bahwa lebar=... dan tinggi=.... Ini adalah dimensi jaringan. FAQ Darknet/YOLO menjelaskan cara menghitung ukuran optimal untuk digunakan.
* Cari semua instance yang berisi baris class=... dan modifikasi dengan jumlah kelas di file .names. Dalam contoh ini kita akan menggunakan kelas=4.
Di bagian [convolutional] sebelum setiap bagian [yolo], cari semua instance yang berisi baris filter=... . Nilai yang digunakan adalah (jumlah kategori + 5) 3. Artinya dalam contoh ini, (4 + 5) * 3 = 27. Oleh karena itu, kami akan menggunakan filter=27 untuk baris yang sesuai.
9. Mulai pelatihan! Jalankan perintah berikut:
' pesta
cd ~/nn/hewan/
detektor darknet -peta -dont_show melatih hewan.data hewan.cfg
`
Harap tunggu. Bobot terbaik akan disimpan sebagai animal_best.weights. Anda dapat mengamati kemajuan pelatihan dengan melihat file chart.png. Lihat FAQ Darknet/YOLO untuk parameter tambahan yang mungkin ingin Anda gunakan saat melatih jaringan baru.
Jika Anda ingin melihat detail selengkapnya selama pelatihan, tambahkan parameter --verbose. Misalnya:
' pesta
detektor darknet -peta -dont_show --verbose melatih hewan.data hewan.cfg
`
Alat dan tautan lainnya
Untuk mengelola proyek Darknet/YOLO Anda, memberi anotasi pada gambar, memvalidasi anotasi Anda, dan membuat file yang diperlukan untuk pelatihan dengan Darknet, lihat DarkMark.
Untuk CLI alternatif yang kuat untuk Darknet, untuk menggunakan ubin gambar, pelacakan objek di video Anda, atau untuk C++ API yang kuat yang dapat dengan mudah digunakan dalam aplikasi komersial, lihat DarkHelp.
Lihat FAQ Darknet/YOLO untuk mengetahui apakah ini dapat membantu menjawab pertanyaan Anda.
Lihat banyak tutorial dan contoh video di saluran YouTube Stéphane
Jika Anda memiliki pertanyaan dukungan atau ingin mengobrol dengan pengguna Darknet/YOLO lainnya, silakan bergabung dengan server Darknet/YOLO Discord.
peta jalan
Terakhir diperbarui: 30-10-2024
Selesai
1. Ganti qsort() yang digunakan selama pelatihan dengan std::sort() (beberapa yang aneh lainnya masih ada)
2. Singkirkan check_mistakes, getchar() dan system()
3. Konversi Darknet untuk menggunakan kompiler C++ (g++ di Linux, VisualStudio di Windows)
4. Perbaiki versi Windows
5. Perbaiki dukungan Python
6. Bangun perpustakaan darknet
7. Aktifkan kembali label dalam prediksi (kode "abjad")
8. Aktifkan kembali kode CUDA/GPU
9. Aktifkan kembali CUDNN
10. Aktifkan kembali separuh CUDNN
11. Jangan melakukan hardcode pada arsitektur CUDA
12. Informasi versi CUDA yang lebih baik
13. Aktifkan kembali AVX
14. Hapus solusi lama dan Makefile
15. Jadikan OpenCV non-opsional
16. Hapus ketergantungan pada perpustakaan pthread lama
17. Hapus STB
18. Tulis ulang CMakeLists.txt untuk menggunakan instrumentasi CUDA baru
19. Hapus kode “abjad” lama dan hapus lebih dari 700 gambar di data/label
20. Bangun di luar sumbernya
21. Memiliki keluaran nomor versi yang lebih baik
22. Optimalisasi kinerja terkait pelatihan (tugas berkelanjutan)
23. Optimalisasi kinerja terkait inferensi (tugas yang sedang berlangsung)
24. Gunakan referensi lewat bila memungkinkan
25. Bersihkan file .hpp
26. Tulis ulang darknet.h
27. Jangan konversikan cv::Mat ke void*, melainkan gunakan sebagai objek C++ yang sesuai
28. Memperbaiki atau membuat penggunaan struktur gambar internal menjadi konsisten
29. Perbaiki build untuk perangkat Jetson berbasis ARM
*Perangkat Jetson asli kemungkinan besar tidak akan diperbaiki karena tidak lagi didukung oleh NVIDIA (tidak ada kompiler C++17)
* Perangkat Jetson Orin baru berfungsi
30. Perbaiki Python API di V3
* Perlu dukungan Python yang lebih baik (apakah ada pengembang Python yang ingin membantu dalam hal ini?)
tujuan jangka pendek
1. Ganti printf() dengan std::cout (sedang dalam proses)
2. Periksa dukungan kamera zed lama
3. Penguraian baris perintah yang lebih baik dan lebih konsisten (sedang dalam proses)
tujuan jangka menengah
1. Hapus semua kode char* dan ganti dengan std::string
2. Jangan sembunyikan peringatan dan bersihkan peringatan kompiler (sedang berlangsung)
3. Penggunaan cv::Mat yang lebih baik daripada struktur gambar khusus di C (sedang dalam proses)
4. Ganti fungsi daftar lama dengan std::vector atau std::list
5. Memperbaiki dukungan untuk gambar skala abu-abu 1 saluran
6. Tambahkan dukungan untuk gambar saluran N dengan N > 3 (misalnya gambar dengan kedalaman tambahan atau saluran termal)
7. Pembersihan kode yang sedang berlangsung (berkelanjutan)
tujuan jangka panjang
1. Perbaiki masalah CUDA/CUDNN di semua GPU
2. Tulis ulang kode CUDA+cuDNN
3. Pertimbangkan untuk menambahkan dukungan untuk GPU non-NVIDIA
4. Kotak pembatas yang diputar, atau semacam penyangga "sudut".
5. Poin/kerangka kunci
6. Peta Panas (sedang berlangsung)
7. Berpisah