Kerangka Deteksi Objek Darknet dan YOLO
Disusun oleh editor Downcodes
Darknet adalah kerangka jaringan saraf sumber terbuka yang ditulis dalam C, C++ dan CUDA.
YOLO (You Only Look Once) adalah sistem deteksi objek real-time canggih yang berjalan dalam kerangka Darknet.
Baca bagaimana Hank.ai membantu komunitas Darknet/YOLO
Mengumumkan Darknet V3 "Jazz"
Kunjungi situs web Darknet/YOLO
Silakan baca FAQ Darknet/YOLO
Bergabunglah dengan server Darknet/YOLO Discord
Dokumen
1. Kertas YOLOv7
2. Kertas Berskala-YOLOv4
3. Kertas YOLOv4
4. Kertas YOLOv3
Informasi Umum
Framework Darknet/YOLO masih lebih cepat dan akurat dibandingkan framework dan versi YOLO lainnya.
Kerangka kerja ini sepenuhnya gratis dan open source. Anda dapat mengintegrasikan Darknet/YOLO ke dalam proyek dan produk yang sudah ada, termasuk produk komersial, tanpa lisensi atau biaya.
Darknet V3 ("Jazz"), yang dirilis pada Oktober 2024, dapat menggunakan GPU NVIDIA RTX 3090 untuk menjalankan video kumpulan data LEGO hingga 1000 FPS, artinya setiap bingkai video dihasilkan oleh pembacaan, pengubahan ukuran, dan proses Darknet/YOLO.
Jika Anda memerlukan bantuan atau ingin berdiskusi tentang Darknet/YOLO, silakan bergabung dengan server Darknet/YOLO Discord: https://discord.gg/zSq8rtW
Versi CPU Darknet/YOLO dapat berjalan di perangkat sederhana seperti Raspberry Pi, server cloud dan colab, desktop, laptop, dan peralatan pelatihan kelas atas. Versi GPU Darknet/YOLO memerlukan GPU NVIDIA yang didukung CUDA.
Darknet/YOLO diketahui berjalan di Linux, Windows dan Mac. Silakan lihat petunjuk pembuatan di bawah ini.
Versi Darknet
Alat Darknet asli, yang ditulis oleh Joseph Redmon pada tahun 2013-2017, tidak memiliki nomor versi. Kami pikir ini adalah versi 0.x.
Repo Darknet populer berikutnya yang dikelola oleh Alexei Bochkovskiy dari 2017-2021 juga tidak memiliki nomor versi. Kami yakin ini adalah versi 1.x.
Repo Darknet yang disponsori oleh Hank.ai dan dikelola oleh Stéphane Charette mulai tahun 2023 adalah repo pertama yang memiliki perintah versi. Dari tahun 2023 hingga akhir tahun 2024, ia kembali ke versi 2.x "OAK".
Tujuannya adalah untuk mengenal basis kode sambil meminimalkan fungsionalitas yang ada.
Tulis ulang langkah-langkah pembangunan sehingga kita memiliki cara terpadu untuk membangun di Windows dan Linux menggunakan CMake.
Konversikan basis kode untuk menggunakan kompiler C++.
Tingkatkan chart.png selama pelatihan.
Perbaikan bug dan optimalisasi terkait kinerja, terutama terkait dengan pengurangan waktu yang diperlukan untuk melatih jaringan.
Cabang terakhir dari basis kode ini adalah versi 2.1 di cabang v2.
Fase pengembangan berikutnya dimulai pada pertengahan tahun 2024, dengan rilis pada bulan Oktober 2024. Perintah versi sekarang mengembalikan 3.x "JAZZ".
Jika Anda perlu menjalankan salah satu perintah ini, Anda selalu dapat melakukan checkout cabang v2 sebelumnya. Harap beri tahu kami sehingga kami dapat menyelidiki penambahan kembali perintah yang hilang.
Menghapus banyak perintah lama dan tidak terawat.
Banyak pengoptimalan kinerja, baik selama pelatihan maupun inferensi.
C API lama telah dimodifikasi; aplikasi yang menggunakan Darknet API asli perlu melakukan sedikit modifikasi: https://darknetcv.ai/api/api.html
Darknet V3 C dan C++ API baru: https://darknetcv.ai/api/api.html
Aplikasi baru dan kode contoh dalam contoh src: https://darknetcv.ai/api/files.html
Anak Timbangan Terlatih MSCOCO
Untuk kenyamanan, beberapa versi YOLO populer telah dilatih sebelumnya pada kumpulan data MSCOCO. Dataset ini memiliki 80 kategori dan dapat dilihat pada file teks cfg/coco.names.
Ada beberapa kumpulan data sederhana dan anak timbangan terlatih lainnya yang tersedia untuk pengujian Darknet/YOLO, seperti LEGO Gears dan Rolodex. Lihat FAQ Darknet/YOLO untuk detailnya.
Anak timbangan terlatih MSCOCO dapat diunduh dari sejumlah lokasi berbeda dan juga dapat diunduh dari repo ini:
1. YOLOv2, November 2016
* YOLOv2-kecil
*YOLOv2-penuh
2. YOLOv3, Mei 2018
* YOLOv3-kecil
*YOLOv3-penuh
3. YOLOv4, Mei 2020
* YOLOv4-kecil
*YOLOv4-penuh
4. YOLOv7, Agustus 2022
* YOLOv7-kecil
*YOLOv7-penuh
Anak timbangan MSCOCO yang telah dilatih sebelumnya hanya untuk tujuan demonstrasi. File .cfg dan .names yang sesuai untuk MSCOCO terletak di direktori cfg. Contoh perintah:
' pesta
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.nama yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.nama yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
Perhatikan bahwa seseorang harus melatih jaringannya sendiri. MSCOCO biasanya digunakan untuk memastikan bahwa semuanya baik-baik saja.
Bangunan
Berbagai metode pembangunan yang tersedia di masa lalu (sebelum tahun 2023) telah digabungkan menjadi satu solusi terpadu. Darknet memerlukan C++17 atau lebih tinggi, OpenCV, dan menggunakan CMake untuk menghasilkan file proyek yang diperlukan.
Anda tidak perlu mengetahui C++ untuk membangun, menginstal, atau menjalankan Darknet/YOLO, sama seperti Anda tidak perlu menjadi mekanik untuk mengendarai mobil.
Google Kolab
Petunjuk Google Colab sama dengan petunjuk Linux. Ada beberapa notebook Jupyter yang memperlihatkan cara melakukan tugas tertentu, seperti melatih jaringan baru.
Lihat notebook di subdirektori colab, atau ikuti petunjuk Linux di bawah.
Metode CMake Linux
Tutorial pembuatan Darknet di Linux
Opsional: Jika Anda memiliki GPU NVIDIA modern, Anda dapat menginstal CUDA atau CUDA+cuDNN sekarang. Jika dipasang, Darknet akan menggunakan GPU Anda untuk mempercepat pemrosesan gambar (dan video).
Anda harus menghapus file CMakeCache.txt dari direktori build Darknet untuk memaksa CMake menemukan kembali semua file yang diperlukan.
Ingatlah untuk membangun kembali Darknet.
Darknet dapat berjalan tanpanya, tetapi jika Anda ingin melatih jaringan khusus, Anda memerlukan CUDA atau CUDA+cuDNN.
Kunjungi https://developer.nvidia.com/cuda-downloads untuk mengunduh dan menginstal CUDA.
Kunjungi https://developer.nvidia.com/rdp/cudnn-download atau https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview untuk mengunduh dan Instal cuDNN.
Setelah menginstal CUDA, pastikan Anda dapat menjalankan nvcc dan nvidia-smi. Anda mungkin perlu mengubah variabel PATH.
Jika Anda menginstal CUDA atau CUDA+cuDNN di lain waktu, atau meningkatkan ke versi perangkat lunak NVIDIA yang lebih baru:
Instruksi ini mengasumsikan (tetapi tidak wajib!) sistem yang menjalankan Ubuntu 22.04. Jika Anda menggunakan distribusi lain, silakan sesuaikan dengan kebutuhan.
' pesta
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
git clone https://github.com/hank-ai/darknetcd darknet
mkdir buildcd build
cmake -DCMAKEBUILDTYPE=Lepaskan ..
buat paket -j4
sudo dpkg -i darknet-VERSION.deb
`
Jika Anda menggunakan CMake versi lama, Anda perlu memutakhirkan CMake sebelum menjalankan perintah cmake di atas. Untuk mengupgrade CMake di Ubuntu Anda dapat menggunakan perintah berikut:
' pesta
sudo apt-get pembersihan cmake
sudo snap install cmake --klasik
`
Jika Anda menggunakan bash sebagai shell perintah, Anda mungkin perlu me-restart shell Anda. Jika Anda menggunakan ikan, ia harus segera mengambil jalur baru.
Pengguna tingkat lanjut:
Jika Anda ingin membuat file instalasi RPM dan bukan file DEB, lihat baris yang relevan di CM_package.cmake. Sebelum menjalankan paket make -j4, Anda perlu mengedit dua baris berikut:
`membuat
SET (CPACKGENERATOR "DEB")# SET (CPACKGENERATOR "RPM")
`
Untuk distribusi seperti Centos dan OpenSUSE, Anda perlu mengganti dua baris ini di CM_package.cmake ke:
`membuat
SET (CPACK_GENERATOR "DEB")
SET (CPACK_GENERATOR "RPM")
`
Untuk menginstal paket, setelah dibuat, gunakan manajer paket distribusi Anda yang biasa. Misalnya pada sistem berbasis Debian seperti Ubuntu:
' pesta
sudo dpkg -i darknet-2.0.1-Linux.deb
`
Menginstal paket .deb akan menyalin file berikut:
/usr/bin/darknet adalah Darknet biasa yang dapat dieksekusi. Jalankan versi darknet dari CLI untuk mengonfirmasi bahwa versi tersebut telah diinstal dengan benar.
/usr/include/darknet.h adalah API Darknet, yang digunakan oleh pengembang C, C++ dan Python.
/usr/include/darknet_version.h berisi informasi versi untuk pengembang.
/usr/lib/libdarknet.so adalah perpustakaan untuk ditautkan oleh pengembang C, C++ dan Python.
/opt/darknet/cfg/... adalah tempat semua templat .cfg disimpan.
Anda sudah selesai sekarang! Darknet dibangun dan diinstal ke /usr/bin/. Jalankan perintah berikut untuk menguji: versi darknet.
Jika Anda tidak memiliki /usr/bin/darknet, berarti Anda tidak menginstalnya, Anda hanya membuatnya! Pastikan Anda telah menginstal file .deb atau .rpm seperti yang disebutkan di atas.
Metode Windows CMake
Petunjuk ini mengasumsikan instalasi bersih Windows 11 22H2.
Buka jendela prompt perintah cmd.exe biasa dan jalankan perintah berikut:
' pesta
winget instal Git.Git
winget instal Kitware.CMake
winget instal nsis.nsis
winget instal Microsoft.VisualStudio.2022.Community
`
Pada titik ini, kita perlu memodifikasi instalasi Visual Studio untuk menyertakan dukungan untuk aplikasi C++:
1. Klik menu "Windows Start" dan jalankan "Visual Studio Installer".
2. Klik "Edit".
3. Pilih "Pengembangan desktop menggunakan C++".
4. Klik "Edit" di pojok kanan bawah, lalu klik "Ya".
Setelah semuanya diunduh dan diinstal, klik lagi menu Start Windows dan pilih Prompt Perintah Pengembang untuk VS 2022. Jangan gunakan PowerShell untuk langkah ini, Anda akan mengalami masalah!
Pengguna tingkat lanjut:
Selain menjalankan command prompt pengembang, Anda juga dapat menggunakan command prompt biasa atau ssh untuk masuk ke perangkat dan menjalankan "Program FilesMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat" secara manual.
Setelah Anda menjalankan command prompt pengembang seperti di atas (bukan PowerShell!), jalankan perintah berikut untuk menginstal Microsoft VCPKG, yang akan digunakan untuk membangun OpenCV:
' pesta
cd c:mkdir c:srccd c:src
git clone https://github.com/microsoft/vcpkgcd vcpkg
bootstrap-vcpkg.bat
.vcpkg.exe mengintegrasikan instalasi
.vcpkg.exe mengintegrasikan PowerShell
.vcpkg.exe instal opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Bersabarlah selama langkah terakhir ini karena ini mungkin memerlukan waktu lama untuk dijalankan. Ini memerlukan pengunduhan dan pembuatan banyak hal.
Pengguna tingkat lanjut:
Perhatikan bahwa ada banyak modul opsional lain yang mungkin ingin Anda tambahkan saat membuat OpenCV. Jalankan .vcpkg.exe search opencv untuk melihat daftar lengkapnya.
Opsional: Jika Anda memiliki GPU NVIDIA modern, Anda dapat menginstal CUDA atau CUDA+cuDNN sekarang. Jika dipasang, Darknet akan menggunakan GPU Anda untuk mempercepat pemrosesan gambar (dan video).
Anda harus menghapus file CMakeCache.txt dari direktori build Darknet untuk memaksa CMake menemukan kembali semua file yang diperlukan.
Ingatlah untuk membangun kembali Darknet.
Darknet dapat berjalan tanpanya, tetapi jika Anda ingin melatih jaringan khusus, Anda memerlukan CUDA atau CUDA+cuDNN.
Kunjungi https://developer.nvidia.com/cuda-downloads untuk mengunduh dan menginstal CUDA.
Kunjungi https://developer.nvidia.com/rdp/cudnn-download atau https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows untuk mengunduh dan menginstal cuDNN.
Setelah menginstal CUDA, pastikan Anda dapat menjalankan nvcc.exe dan nvidia-smi.exe. Anda mungkin perlu mengubah variabel PATH.
Setelah mengunduh cuDNN, unzip dan salin direktori bin, include, dan lib ke C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[version]/. Anda mungkin perlu menimpa beberapa file.
Jika Anda menginstal CUDA atau CUDA+cuDNN di lain waktu, atau meningkatkan ke versi perangkat lunak NVIDIA yang lebih baru:
CUDA harus diinstal setelah Visual Studio. Jika Anda memutakhirkan Visual Studio, ingatlah untuk menginstal ulang CUDA.
Setelah semua langkah sebelumnya berhasil diselesaikan, Anda perlu mengkloning Darknet dan membangunnya. Pada langkah ini kita juga perlu memberi tahu CMake di mana vcpkg berada sehingga dapat menemukan OpenCV dan dependensi lainnya:
' pesta
cd c:src
git clone https://github.com/hank-ai/darknet.gitcd darknet
mkdir buildcd build
cmake -DCMAKEBUILDTYPE=Rilis -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Rilis PACKAGE.vcxproj
`
Jika Anda mendapatkan kesalahan tentang beberapa CUDA atau cuDNN DLL yang hilang (misalnya cublas64_12.dll), salin file CUDA .dll secara manual ke direktori keluaran yang sama dengan Darknet.exe. Misalnya:
' pesta
salin "C:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(Ini contohnya! Periksa untuk memastikan versi mana yang Anda jalankan, dan jalankan perintah yang sesuai untuk versi yang telah Anda instal.)
Setelah menyalin file, jalankan kembali perintah msbuild.exe terakhir untuk menghasilkan paket instalasi NSIS:
' pesta
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
Pengguna tingkat lanjut:
Perhatikan bahwa output dari perintah cmake adalah file solusi Visual Studio normal, Darknet.sln. Jika Anda seorang pengembang perangkat lunak yang sering menggunakan Visual Studio GUI alih-alih msbuild.exe untuk membangun proyek, Anda dapat mengabaikan baris perintah dan memuat proyek Darknet di Visual Studio.
Anda sekarang seharusnya memiliki file ini yang dapat Anda jalankan: C:srcDarknetbuildsrc-cliReleasedarknet.exe. Jalankan perintah berikut untuk menguji: Versi C:srcDarknetbuildsrc-cliReleasedarknet.exe.
Untuk menginstal Darknet, pustaka, menyertakan file, dan DLL yang diperlukan dengan benar, jalankan wizard instalasi NSIS yang dibuat pada langkah terakhir. Periksa file darknet-VERSION.exe di direktori build. Misalnya:
' pesta
darknet-2.0.31-win64.exe
`
Menginstal paket instalasi NSIS akan:
Buat direktori bernama Darknet, misalnya C:Program FilesDarknet.
Instal aplikasi CLI, darknet.exe, dan contoh aplikasi lainnya.
Instal file .dll pihak ketiga yang diperlukan, seperti file dari OpenCV.
Instal file Darknet .dll, .lib, dan .h yang diperlukan untuk menggunakan darknet.dll dari aplikasi lain.
Instal file templat .cfg.
Anda sudah selesai sekarang! Setelah wizard instalasi selesai, Darknet akan diinstal ke C:Program FilesDarknet. Jalankan perintah berikut untuk menguji: C:Program FilesDarknetbindarknet.exe version.
Jika Anda tidak memiliki C:/Program Files/darknet/bin/darknet.exe, berarti Anda tidak menginstalnya, Anda baru membuatnya! Pastikan Anda menyelesaikan setiap panel Wizard Instalasi NSIS pada langkah sebelumnya.
Menggunakan Darknet
CLI
Berikut ini bukan daftar lengkap semua perintah yang didukung oleh Darknet.
Selain CLI Darknet, perhatikan juga CLI proyek DarkHelp, yang menyediakan CLI alternatif untuk Darknet/YOLO. DarkHelp CLI juga memiliki beberapa fitur lanjutan yang tidak ditemukan di Darknet. Anda dapat menggunakan Darknet CLI dan DarkHelp CLI secara bersamaan, keduanya tidak eksklusif.
Untuk sebagian besar perintah yang ditampilkan di bawah, Anda memerlukan file .weights dan file .names dan .cfg yang sesuai. Anda dapat melatih jaringan Anda sendiri (sangat disarankan!) atau mengunduh jaringan saraf yang telah dilatih orang lain dan tersedia secara gratis di Internet. Contoh kumpulan data pra-pelatihan meliputi:
LEGO Gears (temukan objek dalam gambar)
Rolodex (menemukan teks dalam gambar)
MSCOCO (deteksi target kategori standar 80)
Perintah yang dapat dijalankan meliputi:
Daftar beberapa perintah dan opsi yang dapat dijalankan:
' pesta
bantuan darknet
`
Periksa versi:
' pesta
versi darknet
`
Gunakan gambar untuk membuat prediksi:
V2: uji detektor darknet cars.data cars.cfg cars_best.weights image1.jpg
V3: darknet02displayannotatedimages cars.cfg image1.jpg
DarkHelp: DarkHelp mobil.cfg mobil.cfg mobil_best.weights image1.jpg
Koordinat keluaran:
V2: detektor darknet menguji animal.data animal.cfg animalbest.weights -extoutput dog.jpg
V3: darknet01inference_images hewan anjing.jpg
DarkHelp: DarkHelp --json animal.cfg animal.names animal_best.weights dog.jpg
Gunakan video:
V2: demo detektor darknet animal.data animal.cfg animalbest.weights -extoutput test.mp4
V3: darknet03display_videos animal.cfg test.mp4
DarkHelp: DarkHelp animal.cfg animal.names animal_best.weights test.mp4
Membaca dari kamera web:
V2: demo detektor darknet animal.data animal.cfg animal_best.weights -c 0
V3: darknet08display_webcam hewan
Simpan hasil ke video:
V2: demo detektor darknet animal.data animal.cfg animalbest.weights test.mp4 -outfilename res.avi
V3: darknet05processvideoshewan multithread.cfg hewan.nama hewan_terbaik.uji bobot.mp4
DarkHelp: DarkHelp animal.cfg animal.names animal_best.weights test.mp4
JSON:
V2: demo detektor darknet animal.data animal.cfg animalbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
V3: darknet06imagestojson hewan image1.jpg
DarkHelp: DarkHelp --json animal.names animal.cfg animal_best.weights image1.jpg
Jalankan pada GPU tertentu:
V2: demo detektor darknet animal.data animal.cfg animal_best.weights -i 1 test.mp4
Periksa keakuratan jaringan saraf:
' pesta
peta detektor darknet Driving.data Driving.cfg Driving_best.weights ...
Nama Id Rata-rata Presisi TP FN FP TN Akurasi ErrorRate Precision Recall Spesifisitas FalsePosRate
-- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ---------- ----------
0 kendaraan 91,2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821
1 sepeda motor 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954
2 sepeda 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285
3 orang 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855
4 banyak kendaraan 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610
5 lampu hijau 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102
6 lampu kuning 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236
7 lampu merah 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
Periksa akurasi mAP@IoU=75:
' pesta
peta detektor darknet animal.data animal.cfg animalbest.weights -iouthresh 0,75
`
Menghitung ulang titik jangkar paling baik dilakukan di DarkMark karena menjalankannya 100 kali berturut-turut dan memilih titik jangkar terbaik dari semua titik jangkar yang dihitung. Namun jika Anda ingin menjalankan versi lama di Darknet:
' pesta
detektor darknet calcanchors animal.data -numof_clusters 6 -width 320 -height 256
`
Latih jaringan baru:
' pesta
detektor darknet -peta -dont_show melatih hewan.data hewan.cfg
`
(Lihat juga bagian pelatihan di bawah)
Pelatihan
Tautan cepat ke bagian yang relevan dari FAQ Darknet/YOLO:
Bagaimana cara mengatur file dan direktori saya?
Profil mana yang harus saya gunakan?
Perintah mana yang harus saya gunakan saat melatih jaringan saya sendiri?
Buat semua file Darknet yang diperlukan menggunakan DarkMark, cara termudah untuk membuat anotasi dan melatih. Ini jelas merupakan cara yang disarankan untuk melatih jaringan saraf baru.
Jika Anda ingin mengatur berbagai file secara manual untuk melatih jaringan khusus:
1. Buat folder baru untuk menyimpan file. Dalam contoh ini, jaringan saraf akan dibuat untuk mendeteksi hewan, sehingga direktori berikut dibuat: ~/nn/animals/.
2. Copy salah satu file konfigurasi Darknet yang ingin digunakan sebagai template. Misalnya, lihat cfg/yolov4-tiny.cfg. Tempatkan di folder yang Anda buat. Dalam contoh ini, kita sekarang memiliki ~/nn/animals/animals.cfg.
3. Buat file teks animal.names di folder yang sama tempat Anda meletakkan file konfigurasi. Dalam contoh ini, kita sekarang memiliki ~/nn/animals/animals.names.
4. Gunakan editor teks untuk mengedit file animal.names. Cantumkan kategori yang ingin Anda gunakan. Hanya boleh ada satu entri per baris, tidak ada baris kosong dan tidak ada komentar. Dalam contoh ini, file .names akan berisi 4 baris:
`
anjing
kucing
burung
kuda
`
5. Buat file teks animal.data di folder yang sama. Dalam contoh ini, file .data akan berisi:
`
kelas = 4
kereta = /home/nama pengguna/nn/animals/animals_train.txt
valid = /home/nama pengguna/nn/animals/animals_valid.txt
nama = /home/nama pengguna/nn/animals/animals.names
backup = /home/nama pengguna/nn/animals
`
6. Buat folder untuk menyimpan gambar dan anotasi Anda. Misalnya, ini bisa berupa ~/nn/animals/dataset. Setiap gambar memerlukan file .txt terkait yang menjelaskan anotasi untuk gambar tersebut. Format file komentar .txt sangat spesifik. Anda tidak dapat membuat file ini secara manual karena setiap anotasi harus berisi koordinat anotasi yang tepat. Silakan merujuk ke DarkMark atau perangkat lunak serupa lainnya untuk memberi anotasi pada gambar Anda. Format anotasi YOLO dijelaskan di FAQ Darknet/YOLO.
7. Buat file teks "train" dan "valid" yang diberi nama dalam file .data. Kedua file teks ini masing-masing harus mencantumkan semua gambar yang harus digunakan Darknet untuk pelatihan dan validasi (saat menghitung peta%). Tepat satu gambar per baris. Jalur dan nama file bisa bersifat relatif atau absolut.
8. Gunakan editor teks untuk mengubah file .cfg Anda.
9. Pastikan batch=64.
10. Perhatikan subdivisinya. Bergantung pada ukuran jaringan dan memori yang tersedia pada GPU Anda, Anda mungkin perlu menambah subdivisi. Nilai terbaik untuk digunakan adalah 1, jadi mulailah dengan itu. Jika 1 tidak berhasil untuk Anda, silakan lihat FAQ Darknet/YOLO.
11. Catatan maxbatches=…. Nilai yang baik untuk digunakan saat memulai adalah jumlah kategori dikalikan dengan 2000. Dalam contoh ini kita mempunyai 4 hewan, jadi 4 * 2000 = 8000. Artinya kita akan menggunakan maxbatches=8000.
12. Catatan langkah=…. Ini harus disetel ke 80% dan 90% dari maxbatch. Dalam contoh ini, karena maxbatches disetel ke 8000, kita akan menggunakan langkah=6400,7200.
13. Perhatikan lebar=... dan tinggi=.... Ini adalah dimensi jaringan. FAQ Darknet/YOLO menjelaskan cara menghitung ukuran optimal untuk digunakan.
14. Cari semua instance baris class=... dan modifikasi dengan jumlah kelas di file .names. Dalam contoh ini kita akan menggunakan kelas=4.
15. Cari instance dari semua baris filter=... di bagian [convolutional] sebelum setiap bagian [yolo]. Nilai yang digunakan adalah (jumlah kategori + 5) 3. Artinya dalam contoh ini, (4 + 5) 3 = 27. Oleh karena itu, kami akan menggunakan filter=27 pada baris yang sesuai.
Mulai pelatihan! Jalankan perintah berikut:
' pesta
cd ~/nn/hewan/
detektor darknet -peta -dont_show melatih hewan.data hewan.cfg
`
Bersabarlah. Bobot terbaik akan disimpan sebagai animal_best.weights. Dengan melihat file chart.png, Anda dapat mengamati kemajuan pelatihan. Lihat FAQ Darknet/YOLO untuk parameter tambahan yang mungkin ingin Anda gunakan saat melatih jaringan baru.
Jika Anda ingin melihat detail selengkapnya selama pelatihan, tambahkan parameter --verbose. Misalnya:
' pesta
detektor darknet -peta -dont_show --verbose melatih hewan.data hewan.cfg
`
Alat dan Tautan Lainnya
Untuk mengelola proyek Darknet/YOLO Anda, memberi anotasi pada gambar, memvalidasi anotasi Anda, dan membuat file yang diperlukan untuk pelatihan dengan Darknet, lihat DarkMark.
Lihat DarkHelp untuk CLI alternatif yang solid untuk Darknet, menggunakan kolase gambar, pelacakan objek di video Anda, atau untuk C++ API solid yang dapat dengan mudah digunakan dalam aplikasi komersial.
Lihat apakah FAQ Darknet/YOLO dapat membantu menjawab pertanyaan Anda.
Lihat banyak tutorial dan contoh video di saluran YouTube Stéphane.
Jika Anda memiliki pertanyaan dukungan, atau ingin mengobrol dengan pengguna Darknet/YOLO lainnya, silakan bergabung dengan server Darknet/YOLO Discord.
Peta jalan
Terakhir diperbarui: 30-10-2024
Selesai
Mengganti qsort() dengan std::sort() selama pelatihan (beberapa yang tidak jelas lainnya masih ada)
Hapus check_mistakes, getchar() dan system()
Konversi Darknet untuk menggunakan kompiler C++ (g++ di Linux, Visual Studio di Windows)
Perbaiki versi Windows
Perbaiki dukungan Python
Bangun perpustakaan darknet
Mengaktifkan kembali label pada prediksi (kode "alfabet")
Aktifkan kembali kode CUDA/GPU
Aktifkan kembali CUDNN
Aktifkan kembali setengah CUDNN
Jangan melakukan hardcode pada arsitektur CUDA
Informasi versi CUDA yang lebih baik
Aktifkan kembali AVX
Hapus solusi lama dan Makefile
Jadikan OpenCV non-opsional
Hapus ketergantungan pada perpustakaan pthread lama
Hapus STB
Tulis ulang CMakeLists.txt untuk menggunakan deteksi CUDA baru
Menghapus kode "abjad" lama dan menghapus lebih dari 700 gambar di data/label
Bangun sumber luar
Memiliki keluaran nomor versi yang lebih baik
Optimalisasi kinerja terkait pelatihan (tugas yang sedang berlangsung)
Pengoptimalan kinerja terkait dengan inferensi (tugas yang sedang berlangsung)
Gunakan referensi berdasarkan nilai bila memungkinkan
Bersihkan file .hpp
Tulis ulang darknet.h
Jangan masukkan cv::Mat ke void, melainkan gunakan sebagai objek C++ yang tepat
Memperbaiki atau mempertahankan struktur gambar internal yang digunakan secara konsisten
Perbaiki build untuk perangkat Jetson berbasis ARM
Perangkat Jetson asli kemungkinan besar tidak akan diperbaiki karena tidak lagi didukung oleh NVIDIA (tidak ada kompiler C++17)
Perangkat Jetson Orin baru beraksi
Perbaiki Python API di V3
Butuh dukungan Python yang lebih baik (apakah ada pengembang Python yang ingin membantu dalam hal ini?)
tujuan jangka pendek
Ganti printf() dengan std::cout (sedang dalam proses)
Mencari dukungan kamera zed lama
Penguraian baris perintah yang lebih baik dan lebih konsisten (sedang dalam proses)
tujuan jangka menengah
Hapus semua kode char dan ganti dengan std::string
Jangan sembunyikan peringatan dan bersihkan peringatan kompiler (sedang dalam proses)
Lebih baik menggunakan cv::Mat daripada struktur gambar khusus di C (sedang dalam proses)
Ganti fungsi daftar lama dengan std::vector atau std::list
Perbaiki dukungan untuk gambar skala abu-abu 1 saluran
Tambahkan dukungan untuk gambar saluran N dengan N > 3 (misalnya gambar dengan kedalaman tambahan atau saluran termal)
Pembersihan kode yang sedang berlangsung (sedang berlangsung)
tujuan jangka panjang
Perbaiki masalah CUDA/CUDNN untuk semua GPU
Tulis ulang kode CUDA+cuDNN
Penelitian tentang penambahan dukungan untuk GPU non-NVIDIA
Kotak pembatas yang diputar, atau semacam penyangga "sudut".
poin/kerangka kunci
Peta panas (pekerjaan sedang berlangsung)
segmentasi