Marco de detección de objetos Darknet y YOLO
El editor de Downcodes le brindará una comprensión profunda de Darknet, un marco de red neuronal de código abierto escrito en C, C++ y CUDA, y el sistema avanzado de detección de objetivos en tiempo real YOLO (You Only Look Once) que se ejecuta en el marco Darknet. .
El marco Darknet/YOLO es más rápido y preciso que otros marcos y versiones de YOLO. Este marco es completamente gratuito y de código abierto. Puede integrar Darknet/YOLO en proyectos y productos existentes, incluidos proyectos comerciales, sin licencias ni tarifas.
Darknet V3 ("Jazz"), lanzado en octubre de 2024, puede ejecutar con precisión videos de conjuntos de datos LEGO a hasta 1000 FPS cuando se usa una GPU NVIDIA RTX 3090, lo que significa que cada cuadro de video toma 1 milisegundo o menos. Leído, redimensionado y procesado internamente por Darknet/ YOLO.
Si necesita ayuda o quiere hablar sobre Darknet/YOLO, únase al servidor Darknet/YOLO Discord: https://discord.gg/zSq8rtW
La versión CPU de Darknet/YOLO puede ejecutarse en dispositivos simples como Raspberry Pi, servidores de colaboración y en la nube, computadoras de escritorio, portátiles y equipos de capacitación de alta gama. La versión GPU de Darknet/YOLO requiere la GPU compatible con CUDA de NVIDIA.
Se sabe que Darknet/YOLO se ejecuta en Linux, Windows y Mac. Consulte las instrucciones de construcción a continuación.
Las herramientas Darknet originales escritas por Joseph Redmon entre 2013 y 2017 no tenían números de versión. Creemos que esta es la versión 0.x.
La siguiente biblioteca popular de Darknet mantenida por Alexey Bochkovskiy entre 2017 y 2021 tampoco tenía número de versión. Creemos que esta es la versión 1.x.
A partir de 2023, la biblioteca Darknet patrocinada por Hank.ai y mantenida por Stéphane Charette es la primera biblioteca que tiene un comando de versión. Desde 2023 hasta finales de 2024 vuelve a la versión 2.x “OAK”.
El objetivo es familiarizarse con el código base y al mismo tiempo minimizar la interrupción de la funcionalidad existente.
Vuelva a escribir los pasos de compilación para que tengamos una forma unificada de compilar usando CMake en Windows y Linux.
Convierta el código base para utilizar un compilador de C++.
Chart.png durante el entrenamiento mejorado.
Corrección de errores y optimizaciones relacionadas con el rendimiento, principalmente relacionadas con la reducción del tiempo necesario para entrenar la red.
La última rama de este código base es la versión 2.1 en la rama v2.
La siguiente fase de desarrollo comienza a mediados de 2024 y se lanzará en octubre de 2024. El comando de versión ahora devuelve 3.x "JAZZ".
Si necesita ejecutar uno de estos comandos, siempre puede consultar la rama v2 anterior. Háganos saber para que podamos investigar cómo volver a agregar los comandos que faltan.
Se eliminaron muchos comandos antiguos y no mantenidos.
Durante el entrenamiento y la inferencia, se realizaron muchas optimizaciones del rendimiento.
Los cambios en las aplicaciones API C heredadas que utilizan la API Darknet original requieren modificaciones menores: https://darknetcv.ai/api/api.html
Nueva API Darknet V3 C y C++: https://darknetcv.ai/api/api.html
Nuevas aplicaciones y código de muestra en src-examples: https://darknetcv.ai/api/files.html
Para mayor comodidad, varias versiones populares de YOLO están previamente entrenadas en el conjunto de datos MSCOCO. Este conjunto de datos tiene 80 categorías y se puede ver en el archivo de texto cfg/coco.names.
Hay varios otros conjuntos de datos más simples y pesos previamente entrenados disponibles para probar Darknet/YOLO, como LEGO Gears y Rolodex. Consulte las preguntas frecuentes de Darknet/YOLO para obtener más detalles.
Los pesos previamente entrenados de MSCOCO se pueden descargar desde varias ubicaciones diferentes y también se pueden descargar desde este repositorio:
YOLOv2, noviembre de 2016
*YOLOv2-pequeño
*YOLOv2-completo
YOLOv3, mayo de 2018
* YOLOv3-pequeño
*YOLOv3-completo
YOLOv4, mayo de 2020
* YOLOv4-pequeño
*YOLOv4-completo
YOLOv7, agosto de 2022
* YOLOv7-pequeño
*YOLOv7-completo
Las pesas previamente entrenadas de MSCOCO tienen fines de demostración únicamente. Los archivos .cfg y .names correspondientes a MSCOCO se encuentran en el directorio cfg. Comando de ejemplo:
`
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.nombres yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.nombres yolov4-tiny.cfg yolov4-tiny.pesos video1.avi
`
Tenga en cuenta que uno debe entrenar su propia red. MSCOCO se suele utilizar para confirmar que todo funciona correctamente.
Varios métodos de compilación proporcionados en el pasado (antes de 2023) se han fusionado en una solución unificada. Darknet requiere C++ 17 o superior, OpenCV y utiliza CMake para generar los archivos de proyecto necesarios.
No es necesario saber C++ para compilar, instalar o ejecutar Darknet/YOLO, del mismo modo que no es necesario ser mecánico para conducir un automóvil.
Las instrucciones para Google Colab son las mismas que para Linux. Se proporcionan varios cuadernos de Jupyter que muestran cómo realizar determinadas tareas, como entrenar una nueva red.
Consulte el cuaderno en el subdirectorio colab o siga las instrucciones de Linux a continuación.
Tutorial de compilación de Darknet en Linux
Opcional: si tiene una GPU NVIDIA moderna, puede instalar CUDA o CUDA+cuDNN en este momento. Si está instalado, Darknet utilizará su GPU para acelerar el procesamiento de imágenes (y videos).
Debe eliminar el archivo CMakeCache.txt del directorio de compilación de Darknet para obligar a CMake a volver a encontrar todos los archivos necesarios.
Recuerda reconstruir Darknet.
Darknet puede ejecutarse sin él, pero si desea entrenar una red personalizada, necesita CUDA o CUDA+cuDNN.
Visite https://developer.nvidia.com/cuda-downloads para descargar e instalar CUDA.
Visite https://developer.nvidia.com/rdp/cudnn-download o https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview para descargar e Instale cuDNN.
Después de instalar CUDA, asegúrese de que nvcc y nvidia-smi puedan ejecutarse. Es posible que deba modificar la variable PATH.
Si instala CUDA o CUDA+cuDNN más adelante, o actualiza a una versión más reciente del software NVIDIA:
Estas instrucciones asumen (¡pero no requieren!) un sistema que ejecuta Ubuntu 22.04. Si está utilizando otra distribución, ajuste según sea necesario.
`
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
clon de git https://github.com/hank-ai/darknetcd red oscura
mkdir buildcd construir
cmake -DCMAKEBUILDTYPE=Lanzar ..
hacer el paquete -j4
sudo dpkg -i darknet-VERSIÓN.deb
`
Si está utilizando una versión anterior de CMake, deberá actualizar CMake antes de ejecutar el comando cmake anterior. CMake se puede actualizar en Ubuntu usando el siguiente comando:
`
sudo apt-get purge cmakesudo snap install cmake --classic
`
Si está utilizando bash como su shell de comandos, deberá reiniciar su shell en este punto. Si usa pescado, debe tomar el nuevo camino inmediatamente.
Usuarios avanzados:
Si desea crear un archivo de instalación RPM en lugar de un archivo DEB, consulte las líneas relevantes en CM_package.cmake. Antes de ejecutar el paquete make -j4 necesitas editar estas dos líneas:
`
ESTABLECER (CPACKGENERATOR "DEB")# ESTABLECER (CPACKGENERATOR "RPM")
`
Para distribuciones como Centos y OpenSUSE, debe cambiar estas dos líneas en CM_package.cmake a:
`
CONFIGURAR (CPACKGENERATOR "DEB") CONFIGURAR (CPACKGENERATOR "RPM")
`
Una vez creado el paquete de instalación, puede utilizar el administrador de paquetes común de la distribución para instalarlo. Por ejemplo, en un sistema basado en Debian como Ubuntu:
`
sudo dpkg -i darknet-2.0.1-Linux.deb
`
La instalación del paquete .deb copiará los siguientes archivos:
/usr/bin/darknet es un archivo ejecutable Darknet de uso común. Ejecute la versión de darknet desde la CLI para confirmar que esté instalada correctamente.
/usr/include/darknet.h es la API Darknet para desarrolladores de C, C++ y Python.
/usr/include/darknet_version.h contiene la información de la versión del desarrollador.
/usr/lib/libdarknet.so es una biblioteca para que los desarrolladores de C, C++ y Python se vinculen.
/opt/darknet/cfg/... es donde se almacenan todas las plantillas .cfg.
¡Ya terminaste! Darknet está construido e instalado en /usr/bin/. Ejecute el siguiente comando para probar: versión darknet.
Si no tienes /usr/bin/darknet, significa que no lo instalaste, ¡simplemente lo compilaste! Asegúrese de instalar el archivo .deb o .rpm como se describe arriba.
Estas instrucciones asumen una instalación limpia de Windows 11 22H2.
Abra una ventana de símbolo del sistema cmd.exe normal y ejecute el siguiente comando:
`
instalación de alas Git.Git
Instalación de Winget Kitware.CMake
instalación de alas nsis.nsis
Winget instala Microsoft.VisualStudio.2022.Community
`
En este punto, necesitamos modificar la instalación de Visual Studio para incluir soporte para aplicaciones C++:
1. Haga clic en el menú "Inicio de Windows" y ejecute "Visual Studio Installer".
2. Haga clic en Editar.
3. Elija desarrollo de escritorio usando C++.
4. Haga clic en Editar en la esquina inferior derecha, luego haga clic en Sí.
Después de descargar e instalar todo, haga clic nuevamente en el menú "Inicio de Windows" y seleccione el símbolo del sistema del desarrollador para VS 2022. ¡No utilice PowerShell para estos pasos, tendrá problemas!
Usuarios avanzados:
En lugar de ejecutar el símbolo del sistema del desarrollador, también puede usar un símbolo del sistema normal o ssh en el dispositivo y ejecutar manualmente "Archivos de programaMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat".
Después de ejecutar el símbolo del sistema del desarrollador anterior (¡no PowerShell!), ejecute el siguiente comando para instalar Microsoft VCPKG, que luego se usará para compilar OpenCV:
`
Centros para el Control y la Prevención de Enfermedades:
mkdir c:srccd c:src
clon de git https://github.com/microsoft/vcpkgcd vcpkg
bootstrap-vcpkg.bat .vcpkg.exe integrar
instalar .vcpkg.exe integrar powershell.vcpkg.exe instalar opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Tenga paciencia durante este último paso, ya que puede tardar mucho en ejecutarse. Requiere descargar y crear muchas cosas.
Usuarios avanzados:
Tenga en cuenta que hay muchos otros módulos opcionales que puede agregar al crear OpenCV. Ejecute .vcpkg.exe y busque opencv para ver la lista completa.
Opcional: si tiene una GPU NVIDIA moderna, puede instalar CUDA o CUDA+cuDNN en este momento. Si está instalado, Darknet utilizará su GPU para acelerar el procesamiento de imágenes (y videos).
Debe eliminar el archivo CMakeCache.txt del directorio de compilación de Darknet para obligar a CMake a volver a encontrar todos los archivos necesarios.
Recuerda reconstruir Darknet.
Darknet puede ejecutarse sin él, pero si desea entrenar una red personalizada, necesita CUDA o CUDA+cuDNN.
Visite https://developer.nvidia.com/cuda-downloads para descargar e instalar CUDA.
Visite https://developer.nvidia.com/rdp/cudnn-download o https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows para descargar e instalar cuDNN.
Después de instalar CUDA, asegúrese de poder ejecutar nvcc.exe y nvidia-smi.exe. Es posible que deba modificar la variable PATH.
Después de descargar cuDNN, descomprímalo y copie los directorios bin, include y lib en C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[versión]/. Es posible que necesites sobrescribir algunos archivos.
Si instala CUDA o CUDA+cuDNN más adelante, o actualiza a una versión más reciente del software NVIDIA:
CUDA debe instalarse después de Visual Studio. Si actualiza Visual Studio, recuerde reinstalar CUDA.
Una vez que todos los pasos anteriores se hayan completado con éxito, deberá clonar Darknet y compilarlo. En este paso también necesitamos decirle a CMake dónde se encuentra vcpkg para que pueda encontrar OpenCV y otras dependencias:
`
cdc:src
clon de git https://github.com/hank-ai/darknet.gitcd darknet
mkdir buildcd construir
cmake -DCMAKEBUILDTYPE=Versión -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Versión PACKAGE.vcxproj
`
Si recibe un error acerca de que falta alguna DLL CUDA o cuDNN (como cublas64_12.dll), copie manualmente el archivo CUDA .dll en el mismo directorio de salida que Darknet.exe. Por ejemplo:
`
copie "C:Archivos de programaNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(¡Este es un ejemplo! Verifique qué versión está ejecutando y ejecute el comando apropiado para lo que ha instalado).
Después de copiar los archivos, vuelva a ejecutar el último comando msbuild.exe para generar el paquete de instalación de NSIS:
`
msbuild.exe /property:Platform=x64;Configuration=Versión PACKAGE.vcxproj
`
Usuarios avanzados:
Tenga en cuenta que la salida del comando cmake es un archivo de solución normal de Visual Studio, Darknet.sln. Si es un desarrollador de software que utiliza con frecuencia la GUI de Visual Studio en lugar de msbuild.exe para crear proyectos, puede ignorar la línea de comando y cargar el proyecto Darknet en Visual Studio.
Ahora debería tener el siguiente archivo que puede ejecutar: C:srcDarknetbuildsrc-cliReleasedarknet.exe. Ejecute el siguiente comando para probar: C:srcDarknetbuildsrc-cliReleasedarknet.exe versión.
Para instalar correctamente Darknet, bibliotecas, archivos de inclusión y DLL necesarios, ejecute el asistente de instalación de NSIS integrado en el último paso. Mire el archivo darknet-VERSION.exe en el directorio de compilación. Por ejemplo:
`
darknet-2.0.31-win64.exe
`
La instalación del paquete de instalación de NSIS:
Cree un directorio llamado Darknet, por ejemplo C:Program FilesDarknet.
Instale la aplicación CLI, darknet.exe y otras aplicaciones de muestra.
Instale los archivos .dll de terceros necesarios, como los de OpenCV.
Instale los archivos Darknet .dll, .lib y .h necesarios para usar darknet.dll desde otra aplicación.
Instale el archivo de plantilla .cfg.
¡Ya terminaste! Una vez completado el asistente de instalación, Darknet se instalará en C:Program FilesDarknet. Ejecute el siguiente comando para probar: C: Archivos de programa Versión Darknetbindarknet.exe.
Si no tiene C:/Program Files/darknet/bin/darknet.exe, significa que no lo instaló, ¡simplemente lo creó! Asegúrese de completar cada panel del Asistente de instalación de NSIS en el paso anterior.
La siguiente no es una lista completa de todos los comandos admitidos por Darknet.
Además de la CLI de Darknet, también tenga en cuenta la CLI del proyecto DarkHelp, que proporciona una CLI diferente a la de Darknet/YOLO. DarkHelp CLI también tiene varias funciones avanzadas que no están disponibles directamente en Darknet. Puede utilizar tanto la CLI de Darknet como la CLI de DarkHelp; no son mutuamente excluyentes.
Para la mayoría de los comandos que se muestran a continuación, necesitará el archivo .weights y los archivos .names y .cfg correspondientes. Puede entrenar la red usted mismo (¡muy recomendable!) o descargar una red que otros hayan entrenado y que esté disponible gratuitamente en Internet. Ejemplos de conjuntos de datos previos al entrenamiento incluyen:
LEGO Gears (encuentra objetos en imágenes)
Rolodex (buscar texto en la imagen)
MSCOCO (detección de objetivos estándar de categoría 80)
Los comandos que se pueden ejecutar incluyen:
Enumere algunos comandos y opciones que se pueden ejecutar:
`
ayuda de la red oscura
`
Verificar versión:
`
versión de la red oscura
`
Utilice imágenes para hacer predicciones:
`
V2: prueba del detector de red oscura cars.data cars.cfg cars_best.weights image1.jpg
V3: darknet02displayannotatedimages cars.cfg image1.jpg
DarkHelp: DarkHelp cars.cfg cars.cfg cars_best.weights imagen1.jpg
`
Coordenadas de salida:
`
V2: prueba del detector de red oscura animales.datos animales.cfg animalesbest.weights -extoutput dog.jpg
V3: darknet01inference_images animales perro.jpg
DarkHelp: DarkHelp --json animales.cfg animales.nombres animales_mejores.pesos perro.jpg
`
Usar vídeo:
`
V2: demostración del detector de red oscura animales.datos animales.cfg animalesbest.weights -extoutput test.mp4
V3: darknet03display_videos animales.cfg prueba.mp4
DarkHelp: DarkHelp animales.cfg animales.nombres animales_mejores.pesos prueba.mp4
`
Leyendo desde la cámara web:
`
V2: demostración del detector de red oscura animales.data animales.cfg animales_best.weights -c 0
V3: darknet08display_webcam animales
`
Guardar resultados en vídeo:
`
V2: demostración del detector de red oscura animales.datos animales.cfg animalesbest.pesos prueba.mp4 -outfilename res.avi
V3: darknet05processvideosmultithreaded animales.cfg animales.nombres animales_mejores.pesos prueba.mp4
DarkHelp: DarkHelp animales.cfg animales.nombres animales_mejores.pesos prueba.mp4
`
JSON:
`
V2: demostración del detector de red oscura animales.datos animales.cfg animalesbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
V3: darknet06imagestojson animales image1.jpg
DarkHelp: DarkHelp --json animales.nombres animales.cfg animales_mejor.pesos imagen1.jpg
`
Ejecutar en GPU específica:
`
V2: demostración del detector de red oscura animales.data animales.cfg animales_best.weights -i 1 test.mp4
`
Verifique la precisión de la red neuronal:
`
Mapa del detector de darknet conducción.datos conducción.cfg conducción_mejor.pesos...
Id. Nombre AvgPrecision TP FN FP TN Precisión ErrorRate Precisión Recuperación Especificidad FalsePosRate
-- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ---------- ----------
0 vehículo 91,2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821
1 motocicleta 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954
2 bicicletas 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285
3 personas 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855
4 muchos vehículos 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610
5 luz verde 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102
6 luz amarilla 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236
7 luz roja 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
Verifique la precisión de mAP@IoU=75:
`
Mapa del detector de darknet animales.datos animales.cfg animalesbest.weights -iouthresh 0,75
`
La mejor manera de volver a calcular los puntos de anclaje es en DarkMark, ya que se ejecuta 100 veces seguidas y selecciona el mejor punto de anclaje de todos los puntos de anclaje calculados. Sin embargo, si desea ejecutar una versión anterior en Darknet, use el siguiente comando:
`
detector de red oscura calcanchors animales.data -numof_clusters 6 -ancho 320 -alto 256
`
Entrene una nueva red:
`
detector de red oscura -map -dont_show train animales.data animales.cfg (consulte también la sección de capacitación a continuación)
`
Enlaces rápidos a secciones relevantes de las preguntas frecuentes de Darknet/YOLO:
¿Cómo debo configurar mis archivos y directorios?
¿Qué perfil debo utilizar?
¿Qué comando debo usar al entrenar mi propia red?
La forma más sencilla de anotar y entrenar con DarkMark es crear todos los archivos Darknet necesarios. Esta es definitivamente la forma recomendada de entrenar nuevas redes neuronales.
Si desea configurar manualmente los distintos archivos para entrenar una red personalizada:
1. Cree una nueva carpeta para almacenar estos archivos. Para este ejemplo, creará una red neuronal que detecta animales, por lo que se creará el siguiente directorio: ~/nn/animals/.
2. Copie uno de los archivos de configuración de Darknet que desee utilizar como plantilla. Por ejemplo, consulte cfg/yolov4-tiny.cfg. Colóquelo en la carpeta que creó. Para este ejemplo, ahora tenemos ~/nn/animals/animals.cfg.
3. En la misma carpeta donde colocó el archivo de configuración, cree un archivo de texto animales.nombres. Para este ejemplo, ahora tenemos ~/nn/animals/animals.names.
4. Utilice un editor de texto para editar el archivo animales.nombres. Enumere las categorías que desea utilizar. Necesita exactamente una entrada por línea, sin líneas en blanco ni comentarios. Para este ejemplo, el archivo .names contendrá exactamente 4 líneas:
`
perro
gato
pájaro
caballo
`
5. Cree un archivo de texto animales.data en la misma carpeta. Para este ejemplo, el archivo .data contendrá:
`
clases = 4
tren = /home/nombre de usuario/nn/animals/animals_train.txt
válido = /home/nombre de usuario/nn/animals/animals_valid.txt
nombres = /home/nombredeusuario/nn/animals/animals.nombres
copia de seguridad = /home/nombre de usuario/nn/animals
`
6. Cree una carpeta para almacenar sus imágenes y anotaciones. Por ejemplo, esto podría ser ~/nn/animals/dataset. Cada imagen requiere un archivo .txt correspondiente que describe las anotaciones de esa imagen. El formato de los archivos de comentarios .txt es muy específico. No puede crear estos archivos manualmente porque cada anotación debe contener las coordenadas exactas de la anotación. Consulte DarkMark u otro software similar para anotar sus imágenes. El formato de anotación de YOLO se describe en las preguntas frecuentes de Darknet/YOLO.
7. Cree archivos de texto "entrenables" y "válidos" nombrados en el archivo .data. Estos dos archivos de texto deben enumerar por separado todas las imágenes que Darknet debe usar para entrenamiento y validación para poder calcular el% de mAP. Hay exactamente una imagen por fila. Las rutas y los nombres de archivos pueden ser relativos o absolutos.
8. Utilice un editor de texto para modificar su archivo .cfg.
* Asegúrese de que el lote sea = 64.
*Presta atención a las subdivisiones. Dependiendo del tamaño de la red y la cantidad de memoria disponible en la GPU, es posible que necesites aumentar las subdivisiones. El valor óptimo es 1, así que comience con 1. Si no puede utilizar 1, consulte las preguntas frecuentes de Darknet/YOLO.
Tenga en cuenta que el valor óptimo para maxbatches=.... para empezar es 2000 veces el número de clases. Para este ejemplo tenemos 4 animales, entonces 4 2000 = 8000. Esto significa que usaremos maxbatches=8000.
* Nota pasos=.... Esto debe establecerse en 80% y 90% de los lotes máximos. Para este ejemplo usaremos pasos=6400,7200 ya que maxbatches está configurado en 8000.
* Tenga en cuenta que ancho=... y alto=.... Estas son dimensiones de red. Las preguntas frecuentes de Darknet/YOLO explican cómo calcular el tamaño óptimo a utilizar.
* Busque la línea clases=... en la sección [convolucional] y modifíquela antes de cada sección [yolo] para incluir el número de clases del archivo .names. Para este ejemplo usaremos clases=4.
Busque la línea filters=... en la sección [convolucional] antes de cada sección [yolo]. El valor a utilizar es (número de categorías + 5) 3. Esto significa que para este ejemplo, (4 + 5) * 3 = 27. Por lo tanto, usamos filtros = 27 en las líneas correspondientes.
9. ¡Empieza a entrenar! Ejecute el siguiente comando:
`
cd ~/nn/animales/
detector de red oscura -mapa -dont_show entrenar animales.datos animales.cfg
`
Ser paciente. Los mejores pesos se guardarán como animales_best.weights. Y puedes observar el progreso del entrenamiento viendo el archivo chart.png. Consulte las preguntas frecuentes de Darknet/YOLO para conocer parámetros adicionales que quizás desee utilizar al entrenar una nueva red.
Si desea ver más detalles durante el entrenamiento, agregue el parámetro --verbose. Por ejemplo:
`
detector de red oscura -map -dont_show --verbose train animales.data animales.cfg
`
Para administrar su proyecto Darknet/YOLO, anotar imágenes, validar sus anotaciones y generar los archivos necesarios para entrenar con Darknet, consulte DarkMark.
Para obtener una potente CLI alternativa a Darknet, utilice el mosaico de imágenes, realice un seguimiento de objetos en sus vídeos o utilice una potente API de C++ que se pueda utilizar fácilmente en aplicaciones comerciales, consulte DarkHelp.
Consulte las preguntas frecuentes de Darknet/YOLO para ver si pueden ayudar a responder su pregunta.
Vea muchos tutoriales y vídeos de ejemplo en el canal de YouTube de Stéphane.
Si tiene preguntas de soporte o desea chatear con otros usuarios de Darknet/YOLO, únase al servidor Darknet/YOLO Discord.
Última actualización: 2024-10-30
Se reemplazó qsort() usado durante el entrenamiento con std::sort() (todavía existen algunos otros menos conocidos)
Deshazte de check_mistakes, getchar() y system()
Convierta Darknet para usar un compilador de C++ (g++ en Linux, Visual Studio en Windows)
Reparar la compilación de Windows
Reparar el soporte de Python
Construir biblioteca darknet
Volver a habilitar las etiquetas previstas (código "alfabético")
Volver a habilitar el código CUDA/GPU
Volver a habilitar CUDNN
Vuelva a habilitar la mitad CUDNN
No codifique la arquitectura CUDA
Mejor información de la versión CUDA
Vuelva a habilitar AVX
Eliminar la solución anterior y Makefile
Hacer que OpenCV no sea opcional
Eliminar la dependencia de la antigua biblioteca pthread
Eliminar STB
Vuelva a escribir CMakeLists.txt para utilizar la nueva detección CUDA
Se eliminó el antiguo código "alfabeto" y se eliminaron más de 700 imágenes en datos/etiquetas.
Construir fuente externa
Tener una mejor salida del número de versión
Optimizaciones del rendimiento relacionadas con la formación (tareas continuas)
Optimizaciones de rendimiento relacionadas con la inferencia (tareas en curso)
Utilice referencias por valor siempre que sea posible.
Limpiar archivos .hpp
Reescribir darknet.h
No envíe cv::Mat a void, en su lugar utilícelo como un objeto C++ adecuado
Reparar o mantener las estructuras de imágenes internas utilizadas de manera consistente
Corrección de compilación para dispositivos Jetson basados en ARM
* Dado que NVIDIA ya no admite dispositivos Jetson originales, es poco probable que se solucionen (no hay compilador C++17)
* Nuevo dispositivo Jetson Orin ahora funcionando
Reparar la API de Python en V3
* Necesita un mejor soporte para Python (¿algún desarrollador de Python dispuesto a ayudar?)
Reemplace printf() con std::cout (trabajo en progreso)
Buscando el soporte de la cámara Zed antigua
Análisis de línea de comando mejor y más consistente (trabajo en progreso)
Elimine todos los códigos de caracteres y reemplácelos con std::string
No oculte advertencias y limpie las advertencias del compilador (trabajo en progreso)
Es mejor usar cv::Mat en lugar de estructuras de imágenes personalizadas en C (trabajo en progreso)
Reemplace las funciones de lista antiguas con std::vector o std::list
Se corrigió el soporte para imágenes en escala de grises de 1 canal.
Agregue soporte para imágenes de N canales donde N > 3 (por ejemplo, imágenes con profundidad adicional o canales térmicos)
Limpieza de código en curso (en progreso)
Solucionar problemas de CUDA/CUDNN para todas las GPU
Reescribe el código CUDA+cuDNN
Considere agregar soporte para GPU que no sean NVIDIA
Cuadro delimitador girado o algún tipo de soporte de "ángulo"
puntos clave/esqueleto
Mapa de calor (trabajo en progreso)
segmentación