Darknet Object Detection Framework und YOLO
!darknet- und hank.ai-Logos
Darknet ist ein Open-Source-Framework für neuronale Netzwerke, das in C, C++ und CUDA geschrieben ist.
YOLO (You Only Look Once) ist ein hochmodernes Echtzeit-Objekterkennungssystem, das im Darknet-Framework läuft.
Lesen Sie, wie Hank.ai der Darknet/YOLO-Community hilft
Ankündigung von Darknet V3 „Jazz“
Schauen Sie sich die Darknet/YOLO-Website an
Bitte lesen Sie die Darknet/YOLO-FAQ
Treten Sie dem Darknet/YOLO Discord-Server bei
Papiere
1. Papier YOLOv7
2. Papierskalierung-YOLOv4
3. Papier YOlov4
4. Papier YOlov3
Allgemeine Informationen
Das Darknet/YOLO-Framework ist schneller und genauer als andere Frameworks und YOLO-Versionen.
Das Framework ist völlig kostenlos und Open Source. Sie können Darknet/YOLO ohne Lizenz oder Gebühren in bestehende Projekte und Produkte integrieren, auch in kommerzielle Produkte.
Darknet V3 („Jazz“), veröffentlicht im Oktober 2024, kann LEGO-Datensatzvideos bei Verwendung einer NVIDIA RTX 3090-GPU präzise mit bis zu 1000 FPS ausführen, was bedeutet, dass jedes Videobild in 1 Millisekunde verarbeitet oder von Darknet gelesen, in der Größe geändert und verarbeitet werden kann /YOLO in kürzerer Zeit.
Wenn Sie Hilfe benötigen oder über Darknet/YOLO diskutieren möchten, treten Sie bitte dem Darknet/YOLO Discord-Server bei: https://discord.gg/zSq8rtW
Die CPU-Version von Darknet/YOLO kann auf einfachen Geräten wie Raspberry Pi, Cloud- und Colab-Servern, Desktops, Laptops und High-End-Schulungsplattformen ausgeführt werden. Die GPU-Version von Darknet/YOLO erfordert die CUDA-kompatible GPU von NVIDIA.
Darknet/YOLO läuft bekanntermaßen unter Linux, Windows und Mac. Siehe Bauanleitung unten.
Darknet-Version
Die ursprünglichen Darknet-Tools, die 2013–2017 von Joseph Redmon geschrieben wurden, hatten keine Versionsnummern. Wir betrachten diese Version als 0.x.
Auch das nächste beliebte Darknet-Repository, das von Alexey Bochkovskiy von 2017 bis 2021 verwaltet wird, hat keine Versionsnummer. Wir betrachten diese Version als 1.x.
Das von Hank.ai gesponserte und seit 2023 von Stéphane Charette verwaltete Darknet-Repository ist das erste, das über einen Versionsbefehl verfügt. Von 2023 bis Ende 2024 erfolgt die Rückkehr zur Version 2.x „OAK“.
Ziel ist es, die vorhandene Funktionalität so wenig wie möglich zu beeinträchtigen und sich gleichzeitig mit der Codebasis vertraut zu machen.
Schreiben Sie die Build-Schritte neu, damit wir mit CMake eine einheitliche Möglichkeit haben, unter Windows und Linux zu erstellen.
Konvertieren Sie die Codebasis, um einen C++-Compiler zu verwenden.
Verbessertes chart.png während des Trainings.
Fehlerbehebungen und leistungsbezogene Optimierungen, hauptsächlich im Zusammenhang mit der Reduzierung der Zeit, die zum Trainieren des Netzwerks erforderlich ist.
Der letzte Zweig dieser Codebasis ist Version 2.1 im v2-Zweig.
Die nächste Entwicklungsphase beginnt Mitte 2024 und wird im Oktober 2024 veröffentlicht. Der Versionsbefehl gibt jetzt 3.x „JAZZ“ zurück.
Viele alte und nicht gepflegte Befehle wurden entfernt.
Viele Leistungsoptimierungen, sowohl zur Trainingszeit als auch zur Inferenzzeit.
Die traditionelle C-API wurde geändert; Anwendungen, die die ursprüngliche Darknet-API verwenden, erfordern geringfügige Änderungen: https://darknetcv.ai/api/api.html
Neue Darknet V3 C- und C++-API: https://darknetcv.ai/api/api.html
Neue Anwendungen und Beispielcode in src-examples: https://darknetcv.ai/api/files.html
Wenn Sie einen dieser Befehle ausführen müssen, können Sie sich jederzeit den vorherigen v2-Zweig ansehen. Teilen Sie uns dies bitte mit, damit wir das erneute Hinzufügen fehlender Befehle untersuchen können.
Vortrainierte MSCOCO-Gewichte
Der Einfachheit halber sind mehrere beliebte Versionen von YOLO auf dem MSCOCO-Datensatz vorab trainiert. Dieser Datensatz enthält 80 Kategorien und kann in der Textdatei cfg/coco.names eingesehen werden.
Es stehen mehrere andere einfachere Datensätze und vorab trainierte Gewichte zum Testen von Darknet/YOLO zur Verfügung, beispielsweise LEGO Gears und Rolodex. Weitere Informationen finden Sie in den Darknet/YOLO-FAQ.
Vorab trainierte MSCOCO-Gewichte können von verschiedenen Orten oder aus diesem Repository heruntergeladen werden:
1. YOLOv2, November 2016
* YOLOv2-tiny
*YOLOv2-full
2. YOlov3, Mai 2018
* YOLOv3-tiny
*YOlov3-full
3. YOlov4, Mai 2020
* YOLOv4-tiny
*YOlov4-full
4. YOLOv7, August 2022
* YOLOv7-tiny
*YOLOv7-voll
Die vortrainierten MSCOCO-Gewichte dienen nur zu Demonstrationszwecken. Die entsprechenden .cfg- und .names-Dateien für MSCOCO befinden sich im cfg-Verzeichnis. Beispielbefehl:
`Bash
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
Beachten Sie, dass man sein eigenes Netzwerk trainieren sollte. MSCOCO wird oft verwendet, um zu bestätigen, dass alles in Ordnung ist.
bauen
Die verschiedenen in der Vergangenheit (vor 2023) verfügbaren Bauweisen wurden zu einer einheitlichen Lösung zusammengeführt. Darknet erfordert C++17 oder höher, OpenCV und die Verwendung von CMake zum Generieren der erforderlichen Projektdateien.
Sie müssen C++ nicht beherrschen, um Darknet/YOLO zu erstellen, zu installieren oder auszuführen, genauso wenig wie Sie Mechaniker sein müssen, um ein Auto zu fahren.
Seien Sie vorsichtig, wenn Sie einem älteren Tutorial folgen, das komplexere Build-Schritte enthält, oder wenn die Build-Schritte nicht mit denen in dieser Readme-Datei übereinstimmen. Ab August 2023 werden die neuen Build-Schritte im Folgenden beschrieben.
Softwareentwicklern wird empfohlen, https://darknetcv.ai/ zu besuchen, um weitere Informationen zu den Interna des Darknet/YOLO-Objekterkennungs-Frameworks zu erhalten.
Google Colab
Die Anweisungen für Google Colab sind dieselben wie für Linux. Es gibt mehrere Jupyter-Notebooks, die zeigen, wie bestimmte Aufgaben ausgeführt werden, beispielsweise das Training neuer Netzwerke.
Sehen Sie sich das Notizbuch im Unterverzeichnis colab an oder befolgen Sie die nachstehenden Linux-Anweisungen.
Linux CMake-Methode
Darknet-Build-Tutorial für Linux
Optional: Wenn Sie über eine moderne NVIDIA-GPU verfügen, können Sie zu diesem Zeitpunkt CUDA oder CUDA+cuDNN installieren. Falls installiert, nutzt Darknet Ihre GPU, um die Bild- (und Video-)Verarbeitung zu beschleunigen.
Sie müssen die Datei CMakeCache.txt aus dem Darknet-Build-Verzeichnis löschen, um CMake zu zwingen, alle erforderlichen Dateien erneut zu finden.
Denken Sie daran, Darknet neu aufzubauen.
Darknet kann ohne ausgeführt werden, aber wenn Sie ein benutzerdefiniertes Netzwerk trainieren möchten, benötigen Sie CUDA oder CUDA+cuDNN.
Besuchen Sie https://developer.nvidia.com/cuda-downloads, um CUDA herunterzuladen und zu installieren.
Besuchen Sie https://developer.nvidia.com/rdp/cudnn-download oder https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview zum Herunterladen und installieren Sie cuDNN.
Stellen Sie nach der Installation von CUDA sicher, dass Sie nvcc und nvidia-smi ausführen können. Möglicherweise müssen Sie die PATH-Variable ändern.
Wenn Sie CUDA oder CUDA+cuDNN zu einem späteren Zeitpunkt installieren oder auf eine neuere Version der NVIDIA-Software aktualisieren:
Diese Anweisungen gehen von einem System aus, auf dem Ubuntu 22.04 läuft (aber erfordern es nicht!). Wenn Sie eine andere Distribution verwenden, passen Sie sie nach Bedarf an.
`Bash
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
Git-Klon https://github.com/hank-ai/darknet
CD Darknet
mkdir-Build
CD-Build
cmake -DCMAKEBUILDTYPE=Release ..
Erstellen Sie ein -j4-Paket
sudo dpkg -i darknet-VERSION.deb
`
Wenn Sie eine ältere Version von CMake verwenden, müssen Sie CMake aktualisieren, bevor Sie den oben genannten cmake-Befehl ausführen. Das Upgrade von CMake unter Ubuntu kann mit dem folgenden Befehl durchgeführt werden:
`Bash
sudo apt-get purge cmake
sudo snap install cmake --classic
`
Wenn Sie Bash als Befehls-Shell verwenden, müssen Sie an dieser Stelle Ihre Shell neu starten. Wenn Sie Fisch verwenden, sollte dieser sofort den neuen Weg einschlagen.
Fortgeschrittene Benutzer:
Wenn Sie eine RPM-Installationsdatei anstelle einer DEB-Datei erstellen möchten, sehen Sie sich die entsprechenden Zeilen in CM_package.cmake an. Bevor Sie make -j4 package ausführen, müssen Sie diese beiden Zeilen bearbeiten:
„cmake
SET (CPACKGENERATOR „DEB“)# SET (CPACKGENERATOR „RPM“)
`
Für Distributionen wie Centos und OpenSUSE müssen Sie diese beiden Zeilen in CM_package.cmake ändern zu:
„cmake
SET (CPACK_GENERATOR „DEB“)
SET (CPACK_GENERATOR „RPM“)
`
Um ein Paket zu installieren, verwenden Sie den üblichen Paketmanager Ihrer Distribution. Beispielsweise auf einem Debian-basierten System wie Ubuntu:
`Bash
sudo dpkg -i darknet-2.0.1-Linux.deb
`
Durch die Installation des .deb-Pakets werden die folgenden Dateien kopiert:
/usr/bin/darknet ist die übliche ausführbare Darknet-Datei. Führen Sie die Darknet-Version über die CLI aus, um zu bestätigen, dass sie korrekt installiert ist.
/usr/include/darknet.h ist die Darknet-API, die von C-, C++- und Python-Entwicklern verwendet wird.
/usr/include/darknet_version.h enthält Versionsinformationen für Entwickler.
/usr/lib/libdarknet.so ist eine Bibliothek zur Verknüpfung von C-, C++- und Python-Entwicklern.
/opt/darknet/cfg/... ist der Ort, an dem alle .cfg-Vorlagen gespeichert sind.
Jetzt sind Sie fertig! Darknet ist in /usr/bin/ eingebaut und installiert. Führen Sie zum Testen den folgenden Befehl aus: Darknet-Version.
Wenn Sie /usr/bin/darknet nicht haben, haben Sie es nicht installiert, sondern nur erstellt! Bitte stellen Sie sicher, dass Sie die .deb- oder .rpm-Datei wie oben beschrieben installieren.
Windows CMake-Methoden
Diese Anweisungen gehen von einer Neuinstallation von Windows 11 22H2 aus.
Öffnen Sie ein normales cmd.exe-Eingabeaufforderungsfenster und führen Sie den folgenden Befehl aus:
`Bash
Winget installiert Git.Git
Winget installiert Kitware.CMake
Winget installiert nsis.nsis
Winget installiert Microsoft.VisualStudio.2022.Community
`
An dieser Stelle müssen wir die Visual Studio-Installation ändern, um Unterstützung für C++-Anwendungen einzuschließen:
Klicken Sie auf das Windows-Startmenü und führen Sie den Visual Studio Installer aus
Klicken Sie auf „Bearbeiten“
Wählen Sie „Desktop-Entwicklung mit C++“
Klicken Sie unten rechts auf „Bearbeiten“ und dann auf „Ja“.
Sobald alles heruntergeladen und installiert ist, klicken Sie erneut auf das Windows-Startmenü und wählen Sie „Entwickler-Eingabeaufforderung für Visual Studio 2022“. Verwenden Sie für diese Schritte nicht PowerShell, da sonst Probleme auftreten werden!
Fortgeschrittene Benutzer:
Anstatt eine Entwickler-Eingabeaufforderung auszuführen, können Sie sich über eine normale Eingabeaufforderung oder SSH am Gerät anmelden und „ProgrammeMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat“ manuell ausführen.
Sobald Sie die Entwickler-Eingabeaufforderung wie oben ausgeführt haben (nicht PowerShell!), führen Sie den folgenden Befehl aus, um Microsoft VCPKG zu installieren, das zum Erstellen von OpenCV verwendet wird:
`Bash
CDC:
mkdir c:srccd c:src
Git-Klon https://github.com/microsoft/vcpkg
cd vcpkg
Bootstrap-vcpkg.bat
.vcpkg.exe integrieren installieren
.vcpkg.exe integrieren powershell.vcpkg.exe installieren opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Bitte haben Sie etwas Geduld mit diesem letzten Schritt, da die Ausführung lange dauern kann. Es erfordert viel Download und Erstellung.
Fortgeschrittene Benutzer:
Beachten Sie, dass Sie beim Erstellen von OpenCV möglicherweise viele weitere optionale Module hinzufügen möchten. Führen Sie „.vcpkg.exe search opencv“ aus, um die vollständige Liste anzuzeigen.
Optional: Wenn Sie über eine moderne NVIDIA-GPU verfügen, können Sie zu diesem Zeitpunkt CUDA oder CUDA+cuDNN installieren. Falls installiert, nutzt Darknet Ihre GPU, um die Bild- (und Video-)Verarbeitung zu beschleunigen.
Sie müssen die Datei CMakeCache.txt aus dem Darknet-Build-Verzeichnis löschen, um CMake zu zwingen, alle erforderlichen Dateien erneut zu finden.
Denken Sie daran, Darknet neu aufzubauen.
Darknet kann ohne ausgeführt werden, aber wenn Sie ein benutzerdefiniertes Netzwerk trainieren möchten, benötigen Sie CUDA oder CUDA+cuDNN.
Besuchen Sie https://developer.nvidia.com/cuda-downloads, um CUDA herunterzuladen und zu installieren.
Besuchen Sie https://developer.nvidia.com/rdp/cudnn-download oder https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows, um cuDNN herunterzuladen und zu installieren.
Stellen Sie nach der Installation von CUDA sicher, dass Sie nvcc.exe und nvidia-smi.exe ausführen können. Möglicherweise müssen Sie die PATH-Variable ändern.
Nachdem Sie cuDNN heruntergeladen haben, entpacken Sie die Verzeichnisse bin, include und lib und kopieren Sie sie nach C:/Programme/NVIDIA GPU Computing Toolkit/CUDA/[Version]/. Möglicherweise müssen Sie einige Dateien überschreiben.
Wenn Sie CUDA oder CUDA+cuDNN zu einem späteren Zeitpunkt installieren oder auf eine neuere Version der NVIDIA-Software aktualisieren:
CUDA muss nach Visual Studio installiert werden. Wenn Sie Visual Studio aktualisieren, denken Sie daran, CUDA neu zu installieren.
Nachdem alle vorherigen Schritte erfolgreich abgeschlossen wurden, müssen Sie Darknet klonen und erstellen. In diesem Schritt müssen wir CMake auch mitteilen, wo sich vcpkg befindet, damit es OpenCV und andere Abhängigkeiten finden kann:
`Bash
cd c:src
Git-Klon https://github.com/hank-ai/darknet.git
CD Darknet
mkdir-Build
CD-Build
cmake -DCMAKEBUILDTYPE=Release -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
Wenn Sie eine Fehlermeldung über eine fehlende CUDA- oder cuDNN-DLL erhalten (z. B. cublas64_12.dll), kopieren Sie die CUDA-DLL-Datei manuell in dasselbe Ausgabeverzeichnis wie Darknet.exe. Zum Beispiel:
`Bash
kopieren Sie „C:ProgrammeNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll“ src-cliRelease
`
(Dies ist ein Beispiel! Bitte überprüfen Sie, welche Version Sie verwenden, und führen Sie den entsprechenden Befehl für die von Ihnen installierte Version aus.)
Führen Sie nach dem Kopieren der Dateien den letzten msbuild.exe-Befehl erneut aus, um das NSIS-Installationspaket zu generieren:
`Bash
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
Fortgeschrittene Benutzer:
Beachten Sie, dass die Ausgabe des Befehls cmake die normale Visual Studio-Lösungsdatei Darknet.sln ist. Wenn Sie ein Softwareentwickler sind, der regelmäßig die Visual Studio-GUI anstelle von msbuild.exe zum Erstellen von Projekten verwendet, können Sie die Befehlszeile ignorieren und das Darknet-Projekt in Visual Studio laden.
Sie sollten jetzt diese Datei zur Ausführung bereit haben: C:srcDarknetbuildsrc-cliReleasedarknet.exe. Führen Sie zum Testen den folgenden Befehl aus: C:srcDarknetbuildsrc-cliReleasedarknet.exe-Version.
Um Darknet, Bibliotheken, Include-Dateien und erforderliche DLLs ordnungsgemäß zu installieren, führen Sie den im letzten Schritt erstellten NSIS-Installationsassistenten aus. Sehen Sie sich die Datei darknet-VERSION.exe im Build-Verzeichnis an. Zum Beispiel:
`Bash
darknet-2.0.31-win64.exe
`
Die Installation des NSIS-Installationspakets führt zu Folgendem:
Erstellen Sie ein Verzeichnis mit dem Namen Darknet, zum Beispiel C:Program FilesDarknet.
Installieren Sie die CLI-Anwendung darknet.exe und andere Beispielanwendungen.
Installieren Sie erforderliche DLL-Dateien von Drittanbietern, z. B. die von OpenCV.
Installieren Sie die erforderlichen Darknet-Dateien .dll, .lib und .h, um Darknet.dll aus anderen Anwendungen zu verwenden.
Installieren Sie die .cfg-Vorlagendatei.
Jetzt sind Sie fertig! Nachdem der Installationsassistent abgeschlossen ist, wird Darknet in C:ProgrammeDarknet installiert. Führen Sie zum Testen den folgenden Befehl aus: C:ProgrammeDarknetbindarknet.exe-Version.
Wenn Sie C:/Program Files/darknet/bin/darknet.exe nicht haben, haben Sie es nicht installiert, sondern nur erstellt! Bitte stellen Sie sicher, dass Sie alle Bereiche des NSIS-Installationsassistenten in den vorherigen Schritten abgeschlossen haben.
Nutzung von Darknet
CLI
Im Folgenden finden Sie keine vollständige Liste aller von Darknet unterstützten Befehle.
Beachten Sie neben der Darknet-CLI auch die DarkHelp-Projekt-CLI, die eine alternative CLI für Darknet/YOLO bereitstellt. DarkHelp CLI verfügt außerdem über mehrere erweiterte Funktionen, die im Darknet nicht direkt verfügbar sind. Sie können die Darknet-CLI und die DarkHelp-CLI zusammen verwenden, sie schließen sich nicht gegenseitig aus.
Für die meisten der unten gezeigten Befehle benötigen Sie die .weights-Datei und die entsprechenden .names- und .cfg-Dateien. Sie können Ihr eigenes Netzwerk trainieren (sehr empfehlenswert!) oder Netzwerke herunterladen, die andere trainiert und kostenlos im Internet verfügbar gemacht haben. Beispiele für Datensätze vor dem Training sind:
1. LEGO Gears (Objekte in Bildern finden)
2. Rolodex (Text im Bild finden)
3. MSCOCO (Standard-Zielerkennung der Kategorie 80)
Zu den ausführbaren Befehlen gehören:
Listen Sie einige Befehle und Optionen auf, die ausgeführt werden können:
`Bash
Darknet-Hilfe
`
Version prüfen:
`Bash
Darknet-Version
`
Bildvorhersage verwenden:
V2: Darknet-Detektortest car.data car.cfg car_best.weights image1.jpg
V3: darknet02displayannotatedimages cars.cfg image1.jpg
DarkHelp: DarkHelp Cars.cfg Cars.cfg Cars_Best.weights Bild1.jpg
Ausgabekoordinaten:
V2: Darknet-Detektortest Animals.data Animals.cfg Animalsbest.weights -extoutput Dog.jpg
V3: Darknet01inference_images Tiere Hund.jpg
DarkHelp: DarkHelp --json Animals.cfg Animals.names Animals_best.weights Hund.jpg
Verarbeitungsvideo:
V2: Darknet-Detektor-Demo Animals.data Animals.cfg Animalsbest.weights -extoutput test.mp4
V3: darknet03display_videos Animals.cfg test.mp4
DarkHelp: DarkHelp Animals.cfg Animals.Names Animals_Best.Weights Test.mp4
Lesung per Webcam:
V2: Darknet-Detektor-Demo Animals.data Animals.cfg Animals_best.weights -c 0
V3: darknet08display_webcam Tiere
Ergebnisse als Video speichern:
V2: Darknet-Detektor-Demo Animals.data Animals.cfg Animalsbest.weights test.mp4 -outfilename res.avi
V3: Darknet05processvideosmultithreaded Animals.cfg Animals.Names Animals_Best.Weights Test.mp4
DarkHelp: DarkHelp Animals.cfg Animals.Names Animals_Best.Weights Test.mp4
JSON:
V2: Darknet-Detektor-Demo Animals.data Animals.cfg Animalsbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
V3: darknet06imagestojson Animals image1.jpg
DarkHelp: DarkHelp --json Animals.names Animals.cfg Animals_best.weights image1.jpg
Auf einer bestimmten GPU ausführen:
V2: Darknet-Detektor-Demo Animals.data Animals.cfg Animals_best.weights -i 1 test.mp4
Überprüfen Sie die Genauigkeit des neuronalen Netzwerks:
`Bash
Darknet-Detektorkarte fahren.daten fahren.cfg fahren_best.gewichte ...
`
`
ID-Name AvgPrecision TP FN FP TN Accuracy ErrorRate Precision Recall Specificity FalsePosRate
-- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ---------- ----------
0 Fahrzeug 91,2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821
1 Motorrad 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954
2 Fahrrad 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285
3 Personen 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855
4 viele Fahrzeuge 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610
5 grünes Licht 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102
6 gelbes Licht 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236
7 rotes Licht 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
Überprüfen Sie die Genauigkeit mAP@IoU=75:
`Bash
Darknet-Detektorkarte Animals.data Animals.cfg Animalsbest.weights -iouthresh 0,75
`
Die Neuberechnung von Ankerpunkten erfolgt am besten in DarkMark, da es 100 Mal hintereinander ausgeführt wird und aus allen berechneten Ankerpunkten den besten Ankerpunkt auswählt. Wenn Sie jedoch eine ältere Version im Darknet ausführen möchten:
`Bash
Darknet-Detektor calcanchors Animals.data -numof_clusters 6 -width 320 -height 256
`
Trainieren Sie ein neues Netzwerk:
`Bash
Darknet-Detektor -map -dont_show train Animals.data Animals.cfg
`
(Siehe auch Schulungsabschnitt unten)
Zug
Schnelle Links zu relevanten Abschnitten in den Darknet/YOLO-FAQ:
1. Wie soll ich meine Dateien und Verzeichnisse einrichten?
2. Welches Profil soll ich verwenden?
3. Welchen Befehl sollte ich beim Training meines eigenen Netzwerks verwenden?
Die Verwendung von DarkMark zum Erstellen aller erforderlichen Darknet-Dateien ist die einfachste Möglichkeit zum Kommentieren und Trainieren. Dies ist definitiv die empfohlene Methode zum Trainieren neuer neuronaler Netze.
Wenn Sie die verschiedenen Dateien manuell einrichten möchten, um ein benutzerdefiniertes Netzwerk zu trainieren:
1. Erstellen Sie einen neuen Ordner zum Speichern der Dateien. In diesem Beispiel erstellen Sie ein neuronales Netzwerk, das Tiere erkennt. Erstellen Sie daher das folgende Verzeichnis: ~/nn/animals/.
2. Kopieren Sie eine der Darknet-Konfigurationsdateien, die Sie als Vorlage verwenden möchten. Siehe beispielsweise cfg/yolov4-tiny.cfg. Platzieren Sie es in dem von Ihnen erstellten Ordner. In diesem Beispiel haben wir jetzt ~/nn/animals/animals.cfg.
3. Erstellen Sie eine Textdatei „animals.names“ in demselben Ordner, in dem Sie die Konfigurationsdatei abgelegt haben. In diesem Beispiel haben wir jetzt ~/nn/animals/animals.names.
4. Bearbeiten Sie die Datei Animals.names mit einem Texteditor. Listen Sie die Kategorien auf, die Sie verwenden möchten. Sie müssen genau 1 Eintrag pro Zeile haben, keine Leerzeilen, keine Kommentare. In diesem Beispiel enthält die .names-Datei genau 4 Zeilen:
`
Hund
Katze
Vogel
Pferd
`
5. Erstellen Sie im selben Ordner eine Textdatei „animals.data“. In diesem Beispiel enthält die .data-Datei Folgendes:
`
Klassen=4
train=/home/username/nn/animals/animals_train.txt
valid=/home/username/nn/animals/animals_valid.txt
Namen=/home/Benutzername/nn/animals/animals.names
backup=/home/username/nn/animals
`
6. Erstellen Sie einen Ordner zum Speichern Ihrer Bilder und Anmerkungen. Dies könnte beispielsweise ~/nn/animals/dataset sein. Für jedes Bild ist eine entsprechende TXT-Datei erforderlich, die die Anmerkungen für dieses Bild beschreibt. Das Format von TXT-Kommentardateien ist sehr spezifisch. Sie können diese Dateien nicht manuell erstellen, da jede Anmerkung die genauen Koordinaten der Anmerkung enthalten muss. Sehen Sie sich DarkMark oder eine andere ähnliche Software an, um Ihre Bilder mit Anmerkungen zu versehen. Das YOLO-Annotationsformat wird in den Darknet/YOLO-FAQ beschrieben.
7. Erstellen Sie „train“- und „valid“-Textdateien mit den Namen in der .data-Datei. Diese beiden Textdateien müssen alle Bilder auflisten, die Darknet zum Training bzw. zur Validierung bei der Berechnung von mAP% verwenden muss. Es gibt genau ein Bild pro Zeile. Pfade und Dateinamen können relativ oder absolut sein.
8. Verwenden Sie einen Texteditor, um Ihre .cfg-Datei zu ändern.
* Stellen Sie sicher, dass Batch=64 ist.
* Auf Unterteilungen achten. Abhängig von der Netzwerkgröße und der auf der GPU verfügbaren Speichermenge müssen Sie möglicherweise die Unterteilungen erhöhen. Der beste Wert ist 1, also beginnen Sie damit. Wenn Sie 1 nicht verwenden können, lesen Sie bitte die Darknet/YOLO-FAQ.
Beachten Sie, dass maxbatches=... Zu Beginn ist der optimale Wert eine Klassenanzahl von 2000. In diesem Beispiel haben wir 4 Tiere, also 4 * 2000 = 8000. Das bedeutet, dass wir maxbatches=8000 verwenden werden.
* Beachten Sie Schritte=.... Dies sollte auf 80 % und 90 % der maximalen Batches eingestellt werden. In diesem Beispiel verwenden wir „steps=6400,7200“, da „maxbatches“ auf 8000 festgelegt ist.
* Beachten Sie, dass width=... und height=... Dies sind Netzwerkabmessungen. Die Darknet/YOLO-FAQ erklärt, wie man die optimale Größe berechnet.
* Suchen Sie nach allen Instanzen, die die Zeile „classes=...“ enthalten, und ändern Sie sie mit der Anzahl der Klassen in der .names-Datei. In diesem Beispiel verwenden wir „classes=4“.
Suchen Sie im Abschnitt [convolutional] vor jedem Abschnitt [yolo] nach allen Instanzen, die die Zeile filter=... enthalten. Der zu verwendende Wert ist (Anzahl der Kategorien + 5) 3. Das bedeutet, dass in diesem Beispiel (4 + 5) * 3 = 27 ist. Daher verwenden wir filter=27 für die entsprechenden Zeilen.
9. Beginnen Sie mit dem Training! Führen Sie den folgenden Befehl aus:
`Bash
cd ~/nn/animals/
Darknet-Detektor -map -dont_show train Animals.data Animals.cfg
`
Bitte warten. Die besten Gewichte werden als Animals_best.weights gespeichert. Sie können den Trainingsfortschritt verfolgen, indem Sie die Datei chart.png anzeigen. Weitere Parameter, die Sie möglicherweise beim Training eines neuen Netzwerks verwenden möchten, finden Sie in den Darknet/YOLO-FAQ.
Wenn Sie während des Trainings weitere Details sehen möchten, fügen Sie den Parameter --verbose hinzu. Zum Beispiel:
`Bash
Darknet-Detektor -map -dont_show --verbose train Animals.data Animals.cfg
`
Weitere Tools und Links
Informationen zum Verwalten Ihres Darknet/YOLO-Projekts, zum Kommentieren von Bildern, zum Validieren Ihrer Anmerkungen und zum Generieren der erforderlichen Dateien für das Training mit Darknet finden Sie unter DarkMark.
Eine leistungsstarke alternative CLI zu Darknet, um Bildkacheln und Objektverfolgung in Ihren Videos zu verwenden oder eine leistungsstarke C++-API, die problemlos in kommerziellen Anwendungen verwendet werden kann, finden Sie unter DarkHelp.
Sehen Sie sich die Darknet/YOLO-FAQ an, um zu sehen, ob sie Ihnen bei der Beantwortung Ihrer Frage helfen kann.
Schauen Sie sich die vielen Tutorials und Beispielvideos auf Stéphanes YouTube-Kanal an
Wenn Sie Supportfragen haben oder mit anderen Darknet/YOLO-Benutzern chatten möchten, treten Sie bitte dem Darknet/YOLO Discord-Server bei.
Roadmap
Letzte Aktualisierung: 30.10.2024
Vollendet
1. Ersetzen Sie qsort(), das während des Trainings verwendet wurde, durch std::sort() (es gibt noch einige andere seltsame Methoden).
2. Beseitigen Sie check_mistakes, getchar() und system()
3. Konvertieren Sie Darknet, um einen C++-Compiler zu verwenden (g++ unter Linux, Visual Studio unter Windows).
4. Windows-Build reparieren
5. Korrigieren Sie die Python-Unterstützung
6. Erstellen Sie eine Darknet-Bibliothek
7. Labels in Vorhersagen wieder aktivieren („Alphabet“-Code)
8. Aktivieren Sie den CUDA/GPU-Code erneut
9. Aktivieren Sie CUDNN erneut
10. Aktivieren Sie die CUDNN-Hälfte erneut
11. Codieren Sie die CUDA-Architektur nicht fest
12. Bessere CUDA-Versionsinformationen
13. Aktivieren Sie AVX erneut
14. Löschen Sie die alte Lösung und das Makefile
15. Machen Sie OpenCV nicht optional
16. Entfernen Sie die Abhängigkeit von der alten pthread-Bibliothek
17. STB löschen
18. Schreiben Sie CMakeLists.txt neu, um die neue CUDA-Instrumentierung zu verwenden
19. Entfernen Sie den alten „Alphabet“-Code und löschen Sie über 700 Bilder in Daten/Beschriftungen
20. Bauen Sie außerhalb der Quelle
21. Bessere Ausgabe der Versionsnummer
22. Leistungsoptimierung im Zusammenhang mit Schulungen (laufende Aufgaben)
23. Leistungsoptimierung im Zusammenhang mit Inferenz (laufende Aufgaben)
24. Verwenden Sie wann immer möglich Pass-by-Reference
25. Bereinigen Sie .hpp-Dateien
26. Schreiben Sie darknet.h neu
27. Konvertieren Sie cv::Mat nicht in void*, sondern verwenden Sie es stattdessen als richtiges C++-Objekt
28. Korrigieren Sie die Verwendung interner Bildstrukturen oder machen Sie sie konsistent
29. Build für ARM-basierte Jetson-Geräte korrigiert
*Es ist unwahrscheinlich, dass Original-Jetson-Geräte repariert werden, da sie von NVIDIA nicht mehr unterstützt werden (kein C++17-Compiler).
* Das neue Jetson Orin-Gerät funktioniert
30. Korrigieren Sie die Python-API in V3
* Benötigen Sie eine bessere Python-Unterstützung (gibt es Python-Entwickler, die dabei helfen möchten?)
kurzfristige Ziele
1. Ersetzen Sie printf() durch std::cout (in Arbeit)
2. Überprüfen Sie die Unterstützung alter ZED-Kameras
3. Bessere und konsistentere Befehlszeilenanalyse (in Arbeit)
mittelfristige Ziele
1. Entfernen Sie alle char*-Codes und ersetzen Sie sie durch std::string
2. Warnungen nicht ausblenden und Compiler-Warnungen bereinigen (in Bearbeitung)
3. Bessere Verwendung von cv::Mat anstelle von benutzerdefinierten Bildstrukturen in C (in Arbeit)
4. Ersetzen Sie die alte Listenfunktion durch std::vector oder std::list
5. Unterstützung für 1-Kanal-Graustufenbilder behoben
6. Unterstützung für N-Kanal-Bilder hinzufügen, bei denen N > 3 (z. B. Bilder mit zusätzlicher Tiefe oder Wärmekanäle)
7. Laufende Codebereinigung (laufend)
langfristige Ziele
1. Beheben Sie CUDA/CUDNN-Probleme auf allen GPUs
2. Schreiben Sie den CUDA+cuDNN-Code neu
3. Erwägen Sie die Hinzufügung von Unterstützung für Nicht-NVIDIA-GPUs
4. Gedrehter Begrenzungsrahmen oder eine Art „Winkel“-Unterstützung
5. Schlüsselpunkte/Skelett
6. Heatmap (fortlaufend)
7. Teilen