Darknet Object Detection Framework und YOLO
Darknet ist ein Open-Source-Framework für neuronale Netzwerke, das in C, C++ und CUDA geschrieben ist. YOLO (You Only Look Once) ist ein hochmodernes Echtzeit-Zielerkennungssystem, das im Darknet-Framework läuft.
Lesen Sie, wie Hank.ai der Darknet/YOLO-Community hilft
Ankündigung von Darknet V3 „Jazz“
Schauen Sie sich die Darknet/YOLO-Website an
Bitte lesen Sie die Darknet/YOLO-FAQ
Treten Sie dem Darknet/YOLO Discord-Server bei
Papiere
1. Papier YOLOv7
2. Papierskalierung-YOLOv4
3. Papier YOlov4
4. Papier YOlov3
Allgemeine Informationen
Das Darknet/YOLO-Framework ist immer noch schneller und genauer als andere Frameworks und YOLO-Versionen.
Dieses Framework ist völlig kostenlos und Open Source. Sie können Darknet/YOLO ohne Lizenzierung oder Gebühren in bestehende Projekte und Produkte – auch kommerzielle Produkte – integrieren.
Darknet V3 („Jazz“), veröffentlicht im Oktober 2024, kann LEGO-Datensatzvideos mit NVIDIA RTX 3090-GPUs präzise mit bis zu 1000 FPS ausführen, was bedeutet, dass jedes Videobild von Darknet in 1 Millisekunde oder weniger erfasst /YOLO gelesen, in der Größe geändert und verarbeitet wird .
Wenn Sie Hilfe benötigen oder über Darknet/YOLO diskutieren möchten, treten Sie bitte dem Darknet/YOLO Discord-Server bei: https://discord.gg/zSq8rtW
Die CPU-Version von Darknet/YOLO kann auf einfachen Geräten wie Raspberry Pi, Cloud- und Kollaborationsservern, Desktops, Laptops und High-End-Schulungsgeräten ausgeführt werden. Die GPU-Version von Darknet/YOLO erfordert eine CUDA-kompatible GPU von NVIDIA.
Darknet/YOLO funktioniert bekanntermaßen gut unter Linux, Windows und Mac. Siehe Bauanleitung unten.
Darknet-Version
Die ursprünglichen Darknet-Tools, die Joseph Redmon in den Jahren 2013–2017 geschrieben hatte, hatten keine Versionsnummern. Wir betrachten diese Version als 0.x.
Auch das nächste beliebte Darknet-Repository, das von Alexey Bochkovskiy von 2017 bis 2021 verwaltet wird, hat keine Versionsnummer. Wir glauben, dass es sich bei dieser Version um 1.x handelt.
Das von Hank.ai gesponserte und ab 2023 von Stéphane Charette gepflegte Darknet-Repository ist das erste, das über einen Versionsbefehl verfügt. Von 2023 bis Ende 2024 erfolgt die Rückkehr zur Version 2.x „OAK“.
Ziel ist es, die vorhandene Funktionalität so wenig wie möglich zu beeinträchtigen und sich gleichzeitig mit der Codebasis vertraut zu machen.
1. Schreiben Sie die Build-Schritte neu, damit wir eine einheitliche Möglichkeit haben, mit CMake auf Windows und Linux zu bauen.
2. Konvertieren Sie die Codebasis, um einen C++-Compiler zu verwenden.
3. Verbessertes chart.png während des Trainings.
4. Fehlerbehebungen und leistungsbezogene Optimierungen, hauptsächlich im Zusammenhang mit der Reduzierung der Zeit, die zum Trainieren des Netzwerks erforderlich ist.
Der letzte Zweig der Codebasis ist Version 2.1 im v2-Zweig.
Die nächste Entwicklungsphase beginnt Mitte 2024 und wird im Oktober 2024 veröffentlicht. Der Versionsbefehl gibt jetzt 3.x „JAZZ“ zurück.
Sie können jederzeit den vorherigen v2-Zweig auschecken, wenn Sie den folgenden Befehl ausführen müssen. Bitte teilen Sie uns dies mit, damit wir das Hinzufügen fehlender Befehle untersuchen können.
1. Viele alte und nicht gepflegte Befehle entfernt.
2. Viele Leistungsoptimierungen, einschließlich Trainings- und Inferenzprozessen.
3. Die traditionelle C-API wurde geändert; Anwendungen, die die ursprüngliche Darknet-API verwenden, müssen geringfügige Änderungen vornehmen: https://darknetcv.ai/api/api.html
4. Neue Darknet V3 C- und C++-API: https://darknetcv.ai/api/api.html
5. Neue Anwendungen und Beispielcode in src-examples: https://darknetcv.ai/api/files.html
Vortrainierte MSCOCO-Gewichte
Der Einfachheit halber sind mehrere beliebte Versionen von YOLO auf dem MSCOCO-Datensatz vorab trainiert. Dieser Datensatz hat 80 Kategorien und kann in der Textdatei cfg/coco.names eingesehen werden.
Es stehen mehrere andere einfachere Datensätze und vorab trainierte Gewichte zum Testen von Darknet/YOLO zur Verfügung, beispielsweise LEGO Gears und Rolodex. Weitere Informationen finden Sie in den Darknet/YOLO-FAQ.
Vorab trainierte MSCOCO-Gewichte können von verschiedenen Orten oder aus diesem Repository heruntergeladen werden:
1. YOLOv2, November 2016
-YOLOv2-tiny
-YOlov2-full
2. YOlov3, Mai 2018
- YOLOv3-tiny
-YOlov3-full
3. YOlov4, Mai 2020
- YOLOv4-tiny
-YOlov4-full
4. YOLOv7, August 2022
-YOLOv7-tiny
-YOlov7-voll
Die vortrainierten MSCOCO-Gewichte dienen nur zu Demonstrationszwecken. Die entsprechenden .cfg- und .names-Dateien für MSCOCO befinden sich im cfg-Verzeichnis. Beispielbefehl:
`Bash
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
Beachten Sie, dass man sein eigenes Netzwerk trainieren sollte. MSCOCO wird oft verwendet, um zu bestätigen, dass alles in Ordnung ist.
bauen
Verschiedene Bauweisen aus der Vergangenheit (vor 2023) wurden zu einer einheitlichen Lösung zusammengeführt. Darknet erfordert C++17 oder höher, OpenCV und die Verwendung von CMake zum Generieren der erforderlichen Projektdateien.
Sie müssen keine C++-Kenntnisse haben, um Darknet/YOLO zu erstellen, zu installieren oder auszuführen, genauso wie Sie kein Mechaniker sein müssen, um ein Auto zu fahren.
Google Colab
Die Anweisungen für Google Colab sind dieselben wie für Linux. Es gibt mehrere Jupyter-Notebooks, die zeigen, wie bestimmte Aufgaben ausgeführt werden, beispielsweise das Training eines neuen Netzwerks.
Sehen Sie sich das Notizbuch im Unterverzeichnis colab an oder befolgen Sie die nachstehenden Linux-Anweisungen.
Linux CMake-Methode
Darknet-Build-Tutorial für Linux
Optional: Wenn Sie über eine moderne NVIDIA-GPU verfügen, können Sie zu diesem Zeitpunkt CUDA oder CUDA+cuDNN installieren. Falls installiert, nutzt Darknet Ihre GPU, um die Bild- (und Video-)Verarbeitung zu beschleunigen.
Sie müssen die Datei CMakeCache.txt im Darknet-Build-Verzeichnis löschen, um CMake zu zwingen, alle erforderlichen Dateien erneut zu finden.
Denken Sie daran, Darknet neu aufzubauen.
Darknet kann ohne ausgeführt werden, aber wenn Sie ein benutzerdefiniertes Netzwerk trainieren möchten, benötigen Sie CUDA oder CUDA+cuDNN.
Besuchen Sie https://developer.nvidia.com/cuda-downloads, um CUDA herunterzuladen und zu installieren.
Besuchen Sie https://developer.nvidia.com/rdp/cudnn-download oder https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview zum Herunterladen und installieren Sie cuDNN.
Stellen Sie nach der Installation von CUDA sicher, dass Sie nvcc und nvidia-smi ausführen können. Möglicherweise müssen Sie die PATH-Variable ändern.
Wenn Sie CUDA oder CUDA+cuDNN später installieren oder auf eine neuere Version der NVIDIA-Software aktualisieren, gehen Sie wie folgt vor:
Diese Anweisungen gehen von einem System aus, auf dem Ubuntu 22.04 läuft (aber erfordern es nicht!). Wenn Sie eine andere Distribution verwenden, passen Sie sie nach Bedarf an.
`Bash
sudo apt-get install build-essential git libopencv-dev cmake mkdir ~/srccd ~/src git clone https://github.com/hank-ai/darknetcd darknet mkdir buildcd build cmake -DCMAKEBUILDTYPE=Release .. make -j4 Paket sudo dpkg -i darknet-VERSION.deb
`
Wenn Sie eine ältere Version von CMake verwenden, müssen Sie CMake aktualisieren, bevor Sie den oben genannten cmake-Befehl ausführen. Das Upgrade von CMake unter Ubuntu kann mit dem folgenden Befehl durchgeführt werden:
`Bash
sudo apt-get purge cmake sudo snap install cmake --classic
`
Wenn Sie Bash als Befehls-Shell verwenden, müssen Sie die Shell zu diesem Zeitpunkt neu starten. Wenn Sie Fisch verwenden, sollte dieser sofort den neuen Weg einschlagen.
Fortgeschrittene Benutzer:
Wenn Sie eine RPM-Installationsdatei anstelle einer DEB-Datei erstellen möchten, sehen Sie sich die entsprechenden Zeilen in CM_package.cmake an. Bevor Sie make -j4 package ausführen, müssen Sie diese beiden Zeilen bearbeiten:
`Bash
SET (CPACKGENERATOR „DEB“)# SET (CPACKGENERATOR „RPM“)
`
Für Distributionen wie Centos und OpenSUSE müssen Sie diese beiden Zeilen in CM_package.cmake ändern in:
`Bash
SET (CPACKGENERATOR „DEB“)SET (CPACKGENERATOR „RPM“)
`
Um das Installationspaket nach der Erstellung zu installieren, verwenden Sie den üblichen Paketmanager Ihrer Distribution. Beispielsweise auf einem Debian-basierten System wie Ubuntu:
`Bash
sudo dpkg -i darknet-2.0.1-Linux.deb
`
Durch die Installation des .deb-Pakets werden die folgenden Dateien kopiert:
1. /usr/bin/darknet ist die übliche ausführbare Darknet-Datei. Führen Sie die Darknet-Version über die CLI aus, um zu bestätigen, dass sie korrekt installiert ist.
2. /usr/include/darknet.h ist die Darknet-API für C-, C++- und Python-Entwickler.
3. /usr/include/darknet_version.h enthält Versionsinformationen für Entwickler.
4. /usr/lib/libdarknet.so ist eine Bibliothek für C-, C++- und Python-Entwickler.
5. /opt/darknet/cfg/... ist der Speicherort, an dem alle .cfg-Vorlagen gespeichert werden.
Jetzt sind Sie fertig! Darknet ist in /usr/bin/ eingebaut und installiert. Führen Sie zum Testen den folgenden Befehl aus: Darknet-Version.
Wenn Sie /usr/bin/darknet nicht haben, haben Sie es nicht installiert, sondern nur erstellt! Stellen Sie sicher, dass Sie die .deb- oder .rpm-Datei wie oben beschrieben installieren.
Windows CMake-Methoden
Diese Anweisungen gehen von einer Neuinstallation von Windows 11 22H2 aus.
Öffnen Sie ein normales cmd.exe-Eingabeaufforderungsfenster und führen Sie den folgenden Befehl aus:
`Bash
Winget-Installation Git.Git Winget-Installation Kitware.CMake Winget-Installation nsis.nsis Winget-Installation Microsoft.VisualStudio.2022.Community
`
An dieser Stelle müssen wir die Visual Studio-Installation ändern, um Unterstützung für C++-Anwendungen einzuschließen:
1. Klicken Sie auf das Windows-Startmenü und führen Sie das Visual Studio-Setup aus.
2. Klicken Sie auf Bearbeiten.
3. Wählen Sie Desktop-Entwicklung mit C++.
4. Klicken Sie unten rechts auf „Bearbeiten“ und dann auf „Ja“.
Sobald alles heruntergeladen und installiert ist, klicken Sie erneut auf das Windows-Startmenü und wählen Sie „Entwickler-Eingabeaufforderung für VS 2022“. Verwenden Sie PowerShell nicht, um diese Schritte auszuführen, da sonst Probleme auftreten werden!
Fortgeschrittene Benutzer:
Anstatt die Entwickler-Eingabeaufforderung auszuführen, können Sie eine normale Eingabeaufforderung verwenden oder sich mit ssh am Gerät anmelden und „ProgrammeMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat“ manuell ausführen.
Sobald Sie die Entwickler-Eingabeaufforderung wie oben beschrieben ausgeführt haben (nicht PowerShell!), führen Sie den folgenden Befehl aus, um Microsoft VCPKG zu installieren und es dann zum Erstellen von OpenCV zu verwenden:
`Bash
cd c:mkdir c:srccd c:src git clone https://github.com/microsoft/vcpkgcd vcpkg bootstrap-vcpkg.bat .vcpkg.exe integrieren install .vcpkg.exe integrieren powershell.vcpkg.exe installieren opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Seien Sie bei diesem letzten Schritt geduldig, da die Ausführung lange dauern kann. Es erfordert das Herunterladen und Erstellen einer Menge Dinge.
Fortgeschrittene Benutzer:
Beachten Sie, dass Sie beim Erstellen von OpenCV möglicherweise viele weitere optionale Module hinzufügen möchten. Führen Sie „.vcpkg.exe search opencv“ aus, um die vollständige Liste anzuzeigen.
Optional: Wenn Sie über eine moderne NVIDIA-GPU verfügen, können Sie zu diesem Zeitpunkt CUDA oder CUDA+cuDNN installieren. Falls installiert, nutzt Darknet Ihre GPU, um die Bild- (und Video-)Verarbeitung zu beschleunigen.
Sie müssen die Datei CMakeCache.txt im Darknet-Build-Verzeichnis löschen, um CMake zu zwingen, alle erforderlichen Dateien erneut zu finden.
Denken Sie daran, Darknet neu aufzubauen.
Darknet kann ohne ausgeführt werden, aber wenn Sie ein benutzerdefiniertes Netzwerk trainieren möchten, benötigen Sie CUDA oder CUDA+cuDNN.
Besuchen Sie https://developer.nvidia.com/cuda-downloads, um CUDA herunterzuladen und zu installieren.
Besuchen Sie https://developer.nvidia.com/rdp/cudnn-download oder https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows, um cuDNN herunterzuladen und zu installieren.
Stellen Sie nach der Installation von CUDA sicher, dass Sie nvcc.exe und nvidia-smi.exe ausführen können. Möglicherweise müssen Sie die PATH-Variable ändern.
Entpacken Sie nach dem Herunterladen von cuDNN die Verzeichnisse bin, include und lib und kopieren Sie sie nach C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[version]/. Möglicherweise müssen Sie einige Dateien überschreiben.
Wenn Sie CUDA oder CUDA+cuDNN später installieren oder auf eine neuere Version der NVIDIA-Software aktualisieren, gehen Sie wie folgt vor:
CUDA muss nach Visual Studio installiert werden. Wenn Sie Visual Studio aktualisieren, denken Sie daran, CUDA neu zu installieren.
Nachdem alle vorherigen Schritte erfolgreich abgeschlossen wurden, müssen Sie Darknet klonen und erstellen. In diesem Schritt müssen wir CMake auch mitteilen, wo sich vcpkg befindet, damit es OpenCV und andere Abhängigkeiten finden kann:
`Bash
cd c:src git clone https://github.com/hank-ai/darknet.gitcd darknetmkdir buildcd build cmake -DCMAKEBUILDTYPE=Release -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake .. msbuild. exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
Wenn Sie eine Fehlermeldung über eine fehlende CUDA- oder cuDNN-DLL (z. B. cublas64_12.dll) erhalten, kopieren Sie die CUDA-DLL-Datei manuell in dasselbe Ausgabeverzeichnis wie Darknet.exe. Zum Beispiel:
`Bash
kopieren Sie „C:ProgrammeNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll“ src-cliRelease
`
(Dies ist ein Beispiel! Bitte überprüfen Sie, welche Version Sie verwenden, und führen Sie den entsprechenden Befehl für das aus, was Sie installiert haben.)
Führen Sie nach dem Kopieren der Dateien den letzten msbuild.exe-Befehl erneut aus, um das NSIS-Installationspaket zu generieren:
`Bash
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
Fortgeschrittene Benutzer:
Beachten Sie, dass die Ausgabe des Befehls cmake eine normale Visual Studio-Lösungsdatei, Darknet.sln, ist. Wenn Sie ein Softwareentwickler sind, der zum Erstellen von Projekten häufig die Visual Studio-GUI anstelle von msbuild.exe verwendet, können Sie die Befehlszeile ignorieren und das Darknet-Projekt in Visual Studio laden.
Sie sollten nun über die folgende Datei verfügen, die Sie ausführen können: C:srcDarknetbuildsrc-cliReleasedarknet.exe. Führen Sie zum Testen den folgenden Befehl aus: C:srcDarknetbuildsrc-cliReleasedarknet.exe-Version.
Um Darknet, Bibliotheken, Include-Dateien und erforderliche DLLs ordnungsgemäß zu installieren, führen Sie den im letzten Schritt erstellten NSIS-Installationsassistenten aus. Überprüfen Sie die Datei darknet-VERSION.exe im Build-Verzeichnis. Zum Beispiel:
`Bash
darknet-2.0.31-win64.exe
`
Die Installation des NSIS-Installationspakets führt zu Folgendem:
1. Erstellen Sie ein Verzeichnis mit dem Namen Darknet, zum Beispiel C:ProgrammeDarknet.
2. Installieren Sie die CLI-Anwendung darknet.exe und andere Beispielanwendungen.
3. Installieren Sie die erforderlichen DLL-Dateien von Drittanbietern, beispielsweise die von OpenCV.
4. Installieren Sie die erforderlichen Darknet-Dateien .dll, .lib und .h, um Darknet.dll aus einer anderen Anwendung zu verwenden.
5. Installieren Sie die .cfg-Vorlagendatei.
Jetzt sind Sie fertig! Nachdem der Installationsassistent abgeschlossen ist, wird Darknet in C:ProgrammeDarknet installiert. Führen Sie zum Testen den folgenden Befehl aus: C:ProgrammeDarknetbindarknet.exe-Version.
Wenn Sie C:/Program Files/darknet/bin/darknet.exe nicht haben, haben Sie es nicht installiert, sondern nur erstellt! Stellen Sie sicher, dass Sie jedes Fenster des NSIS-Installationsassistenten wie in den vorherigen Schritten beschrieben abschließen.
Nutzung von Darknet
CLI
Im Folgenden finden Sie keine vollständige Liste aller von Darknet unterstützten Befehle.
Bitte beachten Sie zusätzlich zur Darknet-CLI die DarkHelp-Projekt-CLI, die eine Alternative zur Darknet/YOLO-CLI bietet. DarkHelp CLI verfügt außerdem über mehrere erweiterte Funktionen, die im Darknet nicht direkt verfügbar sind. Sie können die Darknet-CLI und die DarkHelp-CLI zusammen verwenden, sie schließen sich nicht gegenseitig aus.
Für die meisten der unten gezeigten Befehle benötigen Sie eine .weights-Datei mit den entsprechenden .names- und .cfg-Dateien. Sie können entweder Ihr eigenes Netzwerk trainieren (sehr empfehlenswert!) oder ein neuronales Netzwerk aus dem Internet herunterladen, das von anderen trainiert wurde und kostenlos verfügbar ist. Beispiele für Datensätze vor dem Training sind:
1. LEGO Gears (Objekte in Bildern finden)
2. Rolodex (Text im Bild finden)
3. MSCOCO (Standard-Zielerkennung der Kategorie 80)
Zu den auszuführenden Befehlen gehören:
Listen Sie einige Befehle und Optionen auf, die ausgeführt werden können:
`Bash
Darknet-Hilfe
`
Version prüfen:
`Bash
Darknet-Version
`
Verwenden Sie Bilder, um Vorhersagen zu treffen:
V2:
`Bash
Darknet-Detektortest car.data car.cfg car_best.weights image1.jpg
`
V3:
`Bash
darknet02displayannotatedimages cars.cfg image1.jpg
`
DarkHelp:
`Bash
DarkHelp „cars.cfg“ „cars.cfg“ „cars_best.weights image1.jpg“.
`
Ausgabekoordinaten:
V2:
`Bash
Darknet-Detektortest Animals.data Animals.cfg Animalsbest.weights -extoutput Dog.jpg
`
V3:
`Bash
darknet01inference_images Tiere Hund.jpg
`
DarkHelp:
`Bash
DarkHelp --json Animals.cfg Animals.names Animals_best.weights Hund.jpg
`
Video verwenden:
V2:
`Bash
Darknet-Detektor-Demo Animals.data Animals.cfg Animalsbest.weights -extoutput test.mp4
`
V3:
`Bash
darknet03display_videos Animals.cfg test.mp4
`
DarkHelp:
`Bash
DarkHelp Animals.cfg Animals.Names Animals_Best.Weights Test.mp4
`
Lesung per Webcam:
V2:
`Bash
Darknet-Detektor-Demo Animals.data Animals.cfg Animals_best.weights -c 0
`
V3:
`Bash
darknet08display_webcam Tiere
`
Ergebnisse als Video speichern:
V2:
`Bash
Darknet-Detektor-Demo Animals.data Animals.cfg Animalsbest.weights test.mp4 -outfilename res.avi
`
V3:
`Bash
darknet05processvideosmultithreaded Animals.cfg Animals.Names Animals_Best.Weights Test.mp4
`
DarkHelp:
`Bash
DarkHelp Animals.cfg Animals.Names Animals_Best.Weights Test.mp4
`
JSON:
V2:
`Bash
Darknet-Detektor-Demo Animals.data Animals.cfg Animalsbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
`
V3:
`Bash
darknet06imagestojson Tiere image1.jpg
`
DarkHelp:
`Bash
DarkHelp --json Animals.names Animals.cfg Animals_best.weights image1.jpg
`
Auf einer bestimmten GPU ausführen:
V2:
`Bash
Darknet-Detektor-Demo Animals.data Animals.cfg Animals_best.weights -i 1 test.mp4
`
So überprüfen Sie die Genauigkeit des neuronalen Netzwerks:
`Bash
Darknet-Detektorkarte Driving.data Driving.cfg Driving_Best.weights ... Id Name AvgPrecision TP FN FP TN Accuracy ErrorRate Precision Recall Specificity FalsePosRate -- ---- ------------ ---- -- ------ ------ ------ -------- --------- --------- ---- -- ----------- ------------ 0 Fahrzeug 91.2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821 1 Motorrad 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954 2 Fahrrad 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285 3 Personen 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855 4 viele Fahrzeuge 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610 5 grünes Licht 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102 6 gelbes Licht 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236 7 rotes Licht 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
So überprüfen Sie die Genauigkeit von mAP@IoU=75:
`Bash
Darknet-Detektorkarte Animals.data Animals.cfg Animalsbest.weights -iouthresh 0,75
`
Die Neuberechnung von Ankerpunkten erfolgt am besten in DarkMark, da es 100 Mal hintereinander ausgeführt wird und aus allen berechneten Ankerpunkten den besten Ankerpunkt auswählt. Wenn Sie jedoch eine ältere Version im Darknet ausführen möchten, gehen Sie wie folgt vor:
`Bash
Darknet-Detektor calcanchors Animals.data -numof_clusters 6 -width 320 -height 256
`
Trainieren Sie ein neues Netzwerk:
`Bash
Darknet Detector -map -dont_show train Animals.data Animals.cfg (siehe auch den Trainingsabschnitt unten)
`
Zug
Schnelle Links zu relevanten Abschnitten der Darknet/YOLO-FAQ:
1. Wie soll ich meine Dateien und Verzeichnisse einrichten?
2. Welches Profil soll ich verwenden?
3. Welchen Befehl sollten Sie beim Training Ihres eigenen Netzwerks verwenden?
Die Verwendung von DarkMark zum Erstellen aller erforderlichen Darknet-Dateien ist die einfachste Möglichkeit zum Kommentieren und Trainieren. Dies ist definitiv die empfohlene Methode zum Trainieren neuer neuronaler Netze.
Wenn Sie die verschiedenen Dateien zum Trainieren eines benutzerdefinierten Netzwerks manuell einrichten möchten, gehen Sie wie folgt vor:
1. Erstellen Sie einen neuen Ordner zum Speichern dieser Dateien. In diesem Beispiel wird ein neuronales Netzwerk zur Erkennung von Tieren erstellt, daher wird das folgende Verzeichnis erstellt: ~/nn/animals/.
2. Kopieren Sie eine der Darknet-Konfigurationsdateien, die Sie als Vorlage verwenden möchten. Siehe beispielsweise cfg/yolov4-tiny.cfg. Platzieren Sie es in dem von Ihnen erstellten Ordner. Für dieses Beispiel haben wir jetzt ~/nn/animals/animals.cfg.
3. Erstellen Sie eine Textdatei „animals.names“ in demselben Ordner, in dem Sie die Konfigurationsdatei abgelegt haben. Für dieses Beispiel haben wir jetzt ~/nn/animals/animals.names.
4. Bearbeiten Sie die Datei Animals.names mit Ihrem Texteditor. Listen Sie die Kategorien auf, die Sie verwenden möchten. Sie benötigen genau einen Eintrag pro Zeile, keine Leerzeilen und keine Kommentare. In diesem Beispiel enthält die .names-Datei genau 4 Zeilen:
`
Hund
Katze
Vogel
Pferd
`
5. Erstellen Sie im selben Ordner eine Textdatei „animals.data“. In diesem Beispiel enthält die .data-Datei Folgendes:
`
Klassen = 4
train = /home/username/nn/animals/animals_train.txt
valid = /home/username/nn/animals/animals_valid.txt
Namen = /home/Benutzername/nn/animals/animals.names
backup = /home/username/nn/animals
`
6. Erstellen Sie einen Ordner zum Speichern Ihrer Bilder und Anmerkungen. Dies könnte beispielsweise ~/nn/animals/dataset sein. Für jedes Bild ist eine entsprechende TXT-Datei erforderlich, die die Anmerkungen für dieses Bild beschreibt. Das Format von TXT-Kommentardateien ist sehr spezifisch. Sie können diese Dateien nicht manuell erstellen, da jede Anmerkung die genauen Koordinaten der Anmerkung enthalten muss. Sehen Sie sich DarkMark oder eine andere ähnliche Software an, um Ihre Bilder mit Anmerkungen zu versehen. Das YOLO-Annotationsformat wird in den Darknet/YOLO-FAQ beschrieben.
7. Erstellen Sie „train“- und „valid“-Textdateien mit den Namen in der .data-Datei. Diese beiden Textdateien müssen alle Bilder auflisten, die Darknet für das Training bzw. die Validierung von mAP% verwenden muss. Es gibt genau ein Bild pro Zeile. Pfade und Dateinamen können relativ oder absolut sein.
8. Verwenden Sie einen Texteditor, um Ihre .cfg-Datei zu ändern.
- Stellen Sie sicher, dass Batch=64 ist.
- Auf Unterteilungen achten. Abhängig von der Netzwerkgröße und der auf der GPU verfügbaren Speichermenge müssen Sie möglicherweise die Unterteilungen erhöhen. Der optimale Wert ist 1, also beginnen Sie damit. Wenn 1 bei Ihnen nicht funktioniert, lesen Sie die Darknet/YOLO-FAQ.
- Beachten Sie maxbatches=.... Zu Beginn ist ein guter Wert 2000 für die Anzahl der Kategorien. Für dieses Beispiel haben wir 4 Tiere, also 4 2000 = 8000. Das bedeutet, dass wir maxbatches=8000 verwenden werden.
- Beachten Sie „steps=...“. Dies sollte auf 80 % und 90 % der maxbatches eingestellt werden. Für dieses Beispiel verwenden wir „steps=6400,7200“, da „maxbatches“ auf 8000 festgelegt ist.
- Beachten Sie, dass width=... und height=... Netzwerkabmessungen sind. Die Darknet/YOLO-FAQ erklärt, wie man die optimale Größe berechnet.
– Suchen Sie in jedem [yolo]-Abschnitt vor dem [convolutional]-Abschnitt nach allen Instanzen von filter=...-Zeilen. Der zu verwendende Wert ist (Anzahl der Kategorien + 5) 3. Dies bedeutet, dass für dieses Beispiel (4 + 5) 3 = 27. Daher verwenden wir filter=27 in den entsprechenden Zeilen.
9. Beginnen Sie mit dem Training! Führen Sie den folgenden Befehl aus:
`Bash
cd ~/nn/animals/
Darknet-Detektor -map -dont_show train Animals.data Animals.cfg
`
Sei geduldig. Die besten Gewichte werden als Animals_best.weights gespeichert. Sie können den Trainingsfortschritt verfolgen, indem Sie die Datei chart.png anzeigen. Weitere Parameter, die Sie möglicherweise beim Training eines neuen Netzwerks verwenden möchten, finden Sie in den Darknet/YOLO-FAQ.
– Wenn Sie während des Trainings weitere Details sehen möchten, fügen Sie den Parameter --verbose hinzu. Zum Beispiel:
`Bash
Darknet-Detektor -map -dont_show --verbose train Animals.data Animals.cfg
`
Weitere Tools und Links
Informationen zum Verwalten Ihres Darknet/YOLO-Projekts, zum Kommentieren von Bildern, zum Validieren Ihrer Anmerkungen und zum Generieren der für das Training mit Darknet erforderlichen Dateien finden Sie unter DarkMark.
Eine leistungsstarke Darknet-Alternative-CLI zum Zusammenfügen von Bildern, Objektverfolgung in Videos oder eine leistungsstarke C++-API, die problemlos in kommerziellen Anwendungen verwendet werden kann, finden Sie unter DarkHelp.
Sehen Sie sich die Darknet/YOLO-FAQ an, um zu sehen, ob sie Ihnen bei der Beantwortung Ihrer Frage helfen kann.
Schauen Sie sich die vielen Tutorials und Beispielvideos auf Stéphanes YouTube-Kanal an
Wenn Sie Supportfragen haben oder mit anderen Darknet/YOLO-Benutzern chatten möchten, treten Sie bitte dem Darknet/YOLO Discord-Server bei.
Roadmap
Letzte Aktualisierung: 30.10.2024:
Vollendet
1. Ersetzen Sie qsort() während des Trainings durch std::sort() (ein anderer obskurer Code ist noch vorhanden).
2. Löschen Sie check_mistakes, getchar() und system()
3. Konvertieren Sie Darknet, um einen C++-Compiler zu verwenden (g++ unter Linux, Visual Studio unter Windows).
4. Windows-Build reparieren
5. Korrigieren Sie die Python-Unterstützung
6. Erstellen Sie eine Darknet-Bibliothek
7. Etiketten für Vorhersagen wieder aktivieren („Alphabet“-Code)
8. Aktivieren Sie den CUDA/GPU-Code erneut
9. Aktivieren Sie CUDNN erneut
10. Aktivieren Sie die CUDNN-Hälfte erneut
11. Codieren Sie die CUDA-Architektur nicht fest
12. Bessere CUDA-Versionsinformationen
13. Aktivieren Sie AVX erneut
14. Löschen Sie die alte Lösung und das Makefile
15. Machen Sie OpenCV nicht optional
16. Entfernen Sie die Abhängigkeit von der alten pthread-Bibliothek
17. STB löschen
18. Schreiben Sie CMakeLists.txt neu, um die neue CUDA-Instrumentierung zu verwenden
19. Entfernen Sie den alten „Alphabet“-Code und löschen Sie über 700 Bilder in Daten/Beschriftungen
20. Über den Quellcode hinaus bauen
21. Bessere Ausgabe der Versionsnummer
22. Leistungsoptimierung im Zusammenhang mit Schulungen (laufende Aufgaben)
23. Leistungsoptimierung im Zusammenhang mit Inferenz (laufende Aufgaben)
24. Verwenden Sie nach Möglichkeit Referenzen nach Wert
25. Bereinigen Sie .hpp-Dateien
26. Schreiben Sie darknet.h neu
27. Konvertieren Sie cv::Mat nicht in void*, sondern verwenden Sie es stattdessen als korrektes C++-Objekt
28. Korrigieren oder behalten Sie die konsistente Verwendung interner Bildstrukturen bei
29. Build für ARM-basierte Jetson-Geräte korrigiert
- Es ist unwahrscheinlich, dass Original-Jetson-Geräte repariert werden, da sie von NVIDIA nicht mehr unterstützt werden (kein C++17-Compiler).
- Neues Jetson Orin-Gerät läuft
30. Korrigieren Sie die Python-API in V3
31. Bessere Python-Unterstützung erforderlich (Möchten Python-Entwickler Hilfe?)
kurzfristige Ziele
1. Ersetzen Sie printf() durch std::cout (in Arbeit)
2. Untersuchen Sie die Unterstützung alter ZED-Kameras
3. Bessere und konsistentere Befehlszeilenanalyse (in Arbeit)
mittelfristige Ziele
1. Entfernen Sie alle char*-Codes und ersetzen Sie sie durch std::string
2. Warnungen nicht ausblenden und Compiler-Warnungen bereinigen (in Bearbeitung)
3. Bessere Verwendung von cv::Mat anstelle von benutzerdefinierten Bildstrukturen in C (in Arbeit)
4. Ersetzen Sie die alte Listenfunktionalität durch std::vector oder std::list
5. Unterstützung für 1-Kanal-Graustufenbilder behoben
6. Unterstützung für N-Kanal-Bilder hinzufügen, bei denen N > 3 (z. B. Bilder mit zusätzlicher Tiefe oder Hot-Kanäle)
7. Laufende Codebereinigung (laufend)
langfristige Ziele
1. Beheben Sie CUDA/CUDNN-Probleme auf allen GPUs
2. Schreiben Sie den CUDA+cuDNN-Code neu
3. Untersuchen Sie, Unterstützung für Nicht-NVIDIA-GPUs hinzuzufügen
4. Gedrehter Begrenzungsrahmen oder eine Art „Winkel“-Unterstützung
5. Schlüsselpunkte/Skelett
6. Heatmap (fortlaufend)
7. Teilen