Marco de detección de objetos Darknet y YOLO
Logotipos de !darknet y hank.ai
Darknet es un marco de red neuronal de código abierto escrito en C, C++ y CUDA. YOLO (Solo miras una vez) es un sistema de detección de objetos en tiempo real de última generación que se ejecuta dentro del marco Darknet.
Lea cómo Hank.ai está ayudando a la comunidad Darknet/YOLO: https://darknetcv.ai/
Anuncio de Darknet V3 "Jazz": https://darknetcv.ai/
Visite el sitio web Darknet/YOLO: https://github.com/hank-ai/darknet
Revise las preguntas frecuentes de Darknet/YOLO: https://darknetcv.ai/faq
Únase al servidor Darknet/YOLO Discord: https://discord.gg/zSq8rtW
Papeles
1. Documento YOLOv7: https://arxiv.org/abs/2207.02670
2. Papel escalado-YOLOv4: https://arxiv.org/abs/2102.05226
3. Documento YOLOv4: https://arxiv.org/abs/2004.10934
4. Documento YOLOv3: https://pjreddie.com/media/files/papers/YOLOv3.pdf
Información general
El marco Darknet/YOLO sigue siendo más rápido y preciso que otros marcos y versiones de YOLO.
Este marco es completamente gratuito y de código abierto. Puede incorporar Darknet/YOLO en proyectos y productos existentes (incluidos los comerciales) sin necesidad de licencia ni pago de una tarifa.
Darknet V3 ("Jazz") lanzado en octubre de 2024 puede ejecutar con precisión los videos del conjunto de datos LEGO a hasta 1000 FPS cuando se usa una GPU NVIDIA RTX 3090, lo que significa que Darknet/YOLO lee, redimensiona y procesa cada cuadro de video en 1 milisegundo o menos.
Únase al servidor Darknet/YOLO Discord si necesita ayuda o desea hablar sobre Darknet/YOLO: https://discord.gg/zSq8rtW
La versión CPU de Darknet/YOLO puede ejecutarse en dispositivos simples como Raspberry Pi, servidores en la nube y colab, computadoras de escritorio, portátiles y equipos de entrenamiento de alta gama. La versión GPU de Darknet/YOLO requiere una GPU compatible con CUDA de NVIDIA.
Se sabe que Darknet/YOLO funciona en Linux, Windows y Mac. Consulte las instrucciones de construcción a continuación.
Versión de la red oscura
La herramienta Darknet original escrita por Joseph Redmon entre 2013 y 2017 no tenía un número de versión. Consideramos esta versión 0.x.
El siguiente repositorio popular de Darknet mantenido por Alexey Bochkovskiy entre 2017 y 2021 tampoco tenía un número de versión. Consideramos esta versión 1.x.
El repositorio Darknet patrocinado por Hank.ai y mantenido por Stéphane Charette a partir de 2023 fue el primero con un comando de versión. Desde 2023 hasta finales de 2024, devolvió la versión 2.x "OAK".
El objetivo era intentar romper la menor cantidad de funcionalidad existente mientras se familiarizaba con el código base. Los cambios clave incluyeron:
1. Reescribir los pasos de compilación para un proceso de compilación de CMake unificado tanto en Windows como en Linux.
2. Convertir el código base para usar el compilador C++.
3. Mejorar la visualización del chart.png durante el entrenamiento.
4. Implementar correcciones de errores y optimizaciones de rendimiento, principalmente enfocadas en reducir el tiempo de capacitación.
La última rama de este código base es la versión 2.1 en la rama v2.
La siguiente fase de desarrollo comenzó a mediados de 2024 y se lanzó en octubre de 2024. El comando de versión ahora devuelve 3.x "JAZZ".
Siempre puedes consultar la rama v2 anterior si necesitas ejecutar uno de estos comandos. Háganos saber para que podamos investigar cómo volver a agregar los comandos que faltan.
Los cambios clave en Darknet V3 "JAZZ" incluyen:
1. Eliminación de muchos comandos antiguos y no mantenidos.
2. Implementar numerosas optimizaciones de rendimiento tanto para el entrenamiento como para la inferencia.
3. Modificar la API C heredada; las aplicaciones que utilizan la API Darknet original requerirán cambios menores: https://darknetcv.ai/api/api.html
4. Presentamos una nueva API Darknet V3 C y C++: https://darknetcv.ai/api/api.html
5. Agregar nuevas aplicaciones y código de muestra en src-examples: https://darknetcv.ai/api/files.html
Pesas preentrenadas MSCOCO
Se entrenaron previamente varias versiones populares de YOLO para mayor comodidad en el conjunto de datos MSCOCO. Este conjunto de datos tiene 80 clases, que se pueden ver en el archivo de texto cfg/coco.names.
Hay varios otros conjuntos de datos más simples y pesos previamente entrenados disponibles para probar Darknet/YOLO, como LEGO Gears y Rolodex. Consulte las preguntas frecuentes de Darknet/YOLO para obtener más detalles.
Los pesos previamente entrenados de MSCOCO se pueden descargar desde varias ubicaciones diferentes y también están disponibles para descargar desde este repositorio:
1. YOLOv2 (noviembre de 2016)
* YOLOv2-pequeño
* YOLOv2-completo
2. YOLOv3 (mayo de 2018)
* YOLOv3-pequeño
* YOLOv3-completo
3. YOLOv4 (mayo de 2020)
* YOLOv4-pequeño
* YOLOv4-completo
4. YOLOv7 (agosto de 2022)
* YOLOv7-pequeño
* YOLOv7-completo
Las pesas previamente entrenadas de MSCOCO se proporcionan únicamente con fines de demostración. Los archivos .cfg y .names correspondientes a MSCOCO se encuentran en el directorio cfg. Comandos de ejemplo:
`
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.nombres yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.nombres yolov4-tiny.cfg yolov4-tiny.pesos video1.avi
`
Tenga en cuenta que se espera que las personas capaciten sus propias redes. MSCOCO normalmente se utiliza para confirmar que todo funciona correctamente.
Edificio
Los diversos métodos de compilación disponibles en el pasado (anteriores a 2023) se han fusionado en una única solución unificada. Darknet requiere C++ 17 o posterior, OpenCV, y usa CMake para generar los archivos de proyecto necesarios.
No necesita saber C++ para construir, instalar ni ejecutar Darknet/YOLO, de la misma manera que no necesita ser mecánico para conducir un automóvil.
Tenga cuidado si sigue tutoriales antiguos con pasos de compilación más complicados o pasos de compilación que no coinciden con lo que se encuentra en este archivo Léame. Los nuevos pasos de construcción que se describen a continuación comenzaron en agosto de 2023.
Se anima a los desarrolladores de software a visitar https://darknetcv.ai/ para obtener información sobre los aspectos internos del marco de detección de objetos Darknet/YOLO.
colaboración de google
Las instrucciones de Google Colab son las mismas que las de Linux. Hay varios cuadernos de Jupyter disponibles que muestran cómo realizar determinadas tareas, como entrenar una nueva red.
Consulte los cuadernos en el subdirectorio colab y/o siga las instrucciones de Linux a continuación.
Método CMake de Linux
Tutorial de compilación de Darknet para Linux
Opcional: si tiene una GPU NVIDIA moderna, puede instalar CUDA o CUDA+cuDNN en este punto. Si está instalado, Darknet utilizará su GPU para acelerar el procesamiento de imágenes (y videos).
Debe eliminar el archivo CMakeCache.txt de su directorio de compilación Darknet para obligar a CMake a volver a encontrar todos los archivos necesarios. Recuerde reconstruir Darknet.
Darknet puede ejecutarse sin él, pero si desea entrenar una red personalizada, entonces se requiere CUDA o CUDA+cuDNN.
1. Instale CUDA: visite https://developer.nvidia.com/cuda-downloads para descargar e instalar CUDA.
2. Instale cuDNN: visite https://developer.nvidia.com/rdp/cudnn-download o https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager- descripción general de la instalación para descargar e instalar cuDNN.
Una vez que instale CUDA, asegúrese de poder ejecutar nvcc y nvidia-smi. Es posible que tengas que modificar tu variable PATH.
Si instala CUDA o CUDA+cuDNN más adelante, o actualiza a una versión más reciente del software NVIDIA:
Estas instrucciones asumen (¡pero no requieren!) un sistema que ejecuta Ubuntu 22.04. Adáptese según sea necesario si está utilizando una distribución diferente.
`golpear
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
clon de git https://github.com/hank-ai/darknet
cd red oscura
compilación mkdir
compilación de cd
cmake -DCMAKEBUILDTYPE=Lanzar ..
hacer el paquete -j4
sudo dpkg -i darknet-VERSIÓN.deb
`
Si está utilizando una versión anterior de CMake, deberá actualizar CMake antes de poder ejecutar el comando cmake anterior. La actualización de CMake en Ubuntu se puede realizar con los siguientes comandos:
`golpear
sudo apt-get purga cmake
sudo snap instalar cmake --classic
`
Si usa bash como su shell de comandos, querrá reiniciar su shell en este punto. Si utiliza pescado, debe tomar inmediatamente el nuevo camino.
Usuarios avanzados:
Si desea crear un archivo de instalación RPM en lugar de un archivo DEB, consulte las líneas relevantes en CM_package.cmake. Antes de ejecutar el paquete make -j4 necesitarás editar estas dos líneas:
`cmake
ESTABLECER (CPACKGENERATOR "DEB")# ESTABLECER (CPACKGENERATOR "RPM")
`
Para distribuciones como Centos y OpenSUSE, deberás cambiar esas dos líneas en CM_package.cmake para que sean:
`cmake
ESTABLECER (CPACK_GENERATOR "DEB")
ESTABLECER (CPACK_GENERATOR "RPM")
`
Para instalar el paquete de instalación una vez que haya terminado de compilarse, utilice el administrador de paquetes habitual para su distribución. Por ejemplo, en sistemas basados en Debian como Ubuntu:
`golpear
sudo dpkg -i darknet-2.0.1-Linux.deb
`
La instalación del paquete .deb copiará los siguientes archivos:
1. /usr/bin/darknet es el ejecutable habitual de Darknet. Ejecute la versión de darknet desde la CLI para confirmar que esté instalada correctamente.
2. /usr/include/darknet.h es la API Darknet para desarrolladores de C, C++ y Python.
3. /usr/include/darknet_version.h contiene información de versión para desarrolladores.
4. /usr/lib/libdarknet.so es la biblioteca con la que se vinculan los desarrolladores de C, C++ y Python.
5. /opt/darknet/cfg/... es donde se almacenan todas las plantillas .cfg.
¡Ya has terminado! Darknet ha sido construido e instalado en /usr/bin/. Ejecute esto para probar: versión darknet.
Si no tienes /usr/bin/darknet entonces esto significa que no lo instalaste, ¡solo lo compilaste! Asegúrese de instalar el archivo .deb o .rpm como se describe arriba.
Método CMake de Windows
Estas instrucciones asumen una nueva instalación de Windows 11 22H2.
1. Requisitos previos de instalación: abra una ventana normal del símbolo del sistema cmd.exe y ejecute los siguientes comandos:
`golpear
instalación de alas Git.Git
Instalación de Winget Kitware.CMake
instalación de alas nsis.nsis
Winget instala Microsoft.VisualStudio.2022.Community
`
2. Configurar Visual Studio: Necesitamos modificar la instalación de Visual Studio para incluir soporte para aplicaciones C++:
* Haga clic en el menú "Inicio de Windows" y ejecute "Visual Studio Installer".
* Haga clic en "Modificar".
* Seleccione "Desarrollo de escritorio con C++".
* Haga clic en "Modificar" en la esquina inferior derecha y luego haga clic en "Sí".
3. Abra el símbolo del sistema del desarrollador: una vez que todo esté descargado e instalado, haga clic nuevamente en el menú "Inicio de Windows" y seleccione "Símbolo del sistema del desarrollador para VS 2022". ¡No utilice PowerShell para estos pasos, tendrá problemas!
Usuarios avanzados:
En lugar de ejecutar el símbolo del sistema del desarrollador, puede usar un símbolo del sistema normal o ssh en el dispositivo y ejecutar manualmente "Archivos de programa Microsoft Visual Studio2022 CommunityCommon7ToolsVsDevCmd.bat".
4. Instale VCPKG: una vez que tenga el símbolo del sistema del desarrollador ejecutándose como se describe anteriormente (¡no PowerShell!), ejecute los siguientes comandos para instalar Microsoft VCPKG, que luego se usará para compilar OpenCV:
`golpear
Centros para el Control y la Prevención de Enfermedades:
mkdirc:src
cdc:src
clon de git https://github.com/microsoft/vcpkg
cd vcpkg
arranque-vcpkg.bat
.vcpkg.exe instalación integrada
.vcpkg.exe integra powershell
.vcpkg.exe instalar opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Tenga paciencia en este último paso, ya que puede tardar mucho en ejecutarse. Necesita descargar y construir muchas cosas.
Usuarios avanzados:
Tenga en cuenta que hay muchos otros módulos opcionales que quizás desee agregar al crear OpenCV. Ejecute .vcpkg.exe y busque opencv para ver la lista completa.
Opcional: si tiene una GPU NVIDIA moderna, puede instalar CUDA o CUDA+cuDNN en este punto. Si está instalado, Darknet utilizará su GPU para acelerar el procesamiento de imágenes (y videos).
Debe eliminar el archivo CMakeCache.txt de su directorio de compilación Darknet para obligar a CMake a volver a encontrar todos los archivos necesarios. Recuerde reconstruir Darknet.
Darknet puede ejecutarse sin él, pero si desea entrenar una red personalizada, entonces se requiere CUDA o CUDA+cuDNN.
1. Instale CUDA: visite https://developer.nvidia.com/cuda-downloads para descargar e instalar CUDA.
2. Instale cuDNN: visite https://developer.nvidia.com/rdp/cudnn-download o https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows para descargar y Instale cuDNN.
Una vez que instale CUDA, asegúrese de poder ejecutar nvcc.exe y nvidia-smi.exe. Es posible que tengas que modificar tu variable PATH.
Una vez que descargue cuDNN, descomprima y copie los directorios bin, include y lib en C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[versión]/. Es posible que necesites sobrescribir algunos archivos.
Si instala CUDA o CUDA+cuDNN más adelante, o actualiza a una versión más reciente del software NVIDIA:
CUDA debe instalarse después de Visual Studio. Si actualiza Visual Studio, recuerde reinstalar CUDA.
5. Clonar y construir Darknet: una vez que todos los pasos anteriores hayan finalizado con éxito, debe clonar Darknet y compilarlo. Durante este paso, también debemos indicarle a CMake dónde se encuentra vcpkg para que pueda encontrar OpenCV y otras dependencias:
`golpear
cdc:src
clon de git https://github.com/hank-ai/darknet.git
cd red oscura
compilación mkdir
compilación de cd
cmake -DCMAKEBUILDTYPE=Versión -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Versión PACKAGE.vcxproj
`
Si recibe un error sobre algunas DLL CUDA o cuDNN que faltan, como cublas64_12.dll, copie manualmente los archivos CUDA .dll en el mismo directorio de salida que Darknet.exe. Por ejemplo:
`golpear
copie "C:Archivos de programaNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(¡Ese es un ejemplo! Verifique qué versión está ejecutando y ejecute el comando apropiado para lo que ha instalado).
Una vez que se hayan copiado los archivos, vuelva a ejecutar el último comando msbuild.exe para generar el paquete de instalación de NSIS:
`golpear
msbuild.exe /property:Platform=x64;Configuration=Versión PACKAGE.vcxproj
`
Usuarios avanzados:
Tenga en cuenta que la salida del comando cmake es un archivo de solución normal de Visual Studio, Darknet.sln. Si es un desarrollador de software que utiliza habitualmente la GUI de Visual Studio en lugar de msbuild.exe para crear proyectos, puede ignorar la línea de comandos y cargar el proyecto Darknet en Visual Studio.
Ahora debería tener este archivo que puede ejecutar: C:srcDarknetbuildsrc-cliReleasedarknet.exe. Ejecute esto para probar: C:srcDarknetbuildsrc-cliReleasedarknet.exe versión.
Para instalar correctamente Darknet, las bibliotecas, los archivos de inclusión y las DLL necesarias, ejecute el asistente de instalación de NSIS que se creó en el último paso. Vea el archivo darknet-VERSION.exe en el directorio de compilación. Por ejemplo:
`golpear
darknet-2.0.31-win64.exe
`
La instalación del paquete de instalación de NSIS:
1. Cree un directorio llamado Darknet, como C:Program FilesDarknet.
2. Instale la aplicación CLI, darknet.exe y otras aplicaciones de muestra.
3. Instale los archivos .dll de terceros necesarios, como los de OpenCV.
4. Instale los archivos Darknet .dll, .lib y .h necesarios para usar darknet.dll desde otra aplicación.
5. Instale los archivos .cfg de plantilla.
¡Ya has terminado! Una vez que el asistente de instalación haya finalizado, Darknet se habrá instalado en C:Program FilesDarknet. Ejecute esto para probar: C: Archivos de programa Darknetbindarknet.exe versión.
Si no tiene C:/Program Files/darknet/bin/darknet.exe, entonces esto significa que no lo instaló, ¡solo lo creó! Asegúrese de revisar cada panel del asistente de instalación de NSIS en el paso anterior.
Usando la red oscura
CLI
La siguiente no es la lista completa de todos los comandos admitidos por Darknet.
Además de la CLI de Darknet, también tenga en cuenta la CLI del proyecto DarkHelp, que proporciona una CLI alternativa a Darknet/YOLO. La CLI de DarkHelp también tiene varias funciones avanzadas que no están disponibles directamente en Darknet. Puede utilizar tanto la CLI de Darknet como la CLI de DarkHelp juntas; no se excluyen mutuamente.
Para la mayoría de los comandos que se muestran a continuación, necesitará el archivo .weights con los archivos .names y .cfg correspondientes. Puede entrenar su propia red (¡muy recomendable!) o descargar una red neuronal que alguien ya haya entrenado y puesto a disposición de forma gratuita en Internet. Ejemplos de conjuntos de datos previamente entrenados incluyen:
1. LEGO Gears (encontrar objetos en una imagen)
2. Rolodex (buscar texto en una imagen)
3. MSCOCO (detección de objetos estándar de clase 80)
Los comandos para ejecutar incluyen:
1. Enumere algunos comandos y opciones posibles para ejecutar:
`golpear
ayuda de la red oscura
`
2. Verifique la versión:
`golpear
versión de la red oscura
`
3. Predice usando una imagen:
* V2:
`golpear
Prueba del detector darknet cars.data cars.cfg cars_best.weights image1.jpg
`
*V3:
`golpear
darknet02displayimagenes anotadas cars.cfg image1.jpg
`
* Ayuda oscura:
`golpear
DarkHelp cars.cfg cars.cfg cars_best.weights imagen1.jpg
`
4. Coordenadas de salida:
* V2:
`golpear
prueba del detector darknet animales.datos animales.cfg animalesmejores.pesos -extoutput perro.jpg
`
*V3:
`golpear
darknet01inference_images animales perro.jpg
`
* Ayuda oscura:
`golpear
DarkHelp --json animales.cfg animales.nombres animales_mejores.pesos perro.jpg
`
5. Trabajar con vídeos:
* V2:
`golpear
Demostración del detector darknet animales.datos animales.cfg animalesmejores.pesos -extoutput test.mp4
`
*V3:
`golpear
darknet03display_videos animales.cfg prueba.mp4
`
* Ayuda oscura:
`golpear
DarkHelp animales.cfg animales.nombres animales_mejores.pesos prueba.mp4
`
6. Lectura desde una cámara web:
* V2:
`golpear
Demostración del detector darknet animales.datos animales.cfg animales_best.weights -c 0
`
*V3:
`golpear
darknet08display_webcam animales
`
7. Guarde los resultados en un vídeo:
* V2:
`golpear
demostración del detector darknet animales.datos animales.cfg animalesbest.pesos prueba.mp4 -outfilename res.avi
`
*V3:
`golpear
darknet05procesovideosmultiproceso animales.cfg animales.nombres animales_mejores.pesos prueba.mp4
`
* Ayuda oscura:
`golpear
DarkHelp animales.cfg animales.nombres animales_mejores.pesos prueba.mp4
`
8. JSON:
* V2:
`golpear
Demostración del detector darknet animales.datos animales.cfg animalesbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
`
*V3:
`golpear
darknet06imagestojson animales image1.jpg
`
* Ayuda oscura:
`golpear
DarkHelp --json animales.nombres animales.cfg animales_mejor.pesos imagen1.jpg
`
9. Ejecutando en una GPU específica:
* V2:
`golpear
Demostración del detector darknet animales.datos animales.cfg animales_mejores.pesos -i 1 prueba.mp4
`
10. Para comprobar la precisión de la red neuronal:
`golpear
Mapa del detector de darknet conducción.datos conducción.cfg conducción_mejor.pesos...
Id. Nombre AvgPrecision TP FN FP TN Precisión ErrorRate Precisión Recuperación Especificidad FalsePosRate
-- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ----------- ------------
0 vehículo 91,2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821
1 motocicleta 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954
2 bicicletas 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285
3 personas 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855
4 muchos vehículos 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610
5 luz verde 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102
6 luz amarilla 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236
7 luz roja 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
11. Para comprobar la precisión mAP@IoU=75:
`golpear
Mapa del detector de darknet animales.datos animales.cfg animalesbest.weights -iouthresh 0,75
`
12. Recalcular anclajes: Es mejor volver a calcular los anclajes en DarkMark, ya que se ejecutará 100 veces consecutivas y seleccionará los mejores anclajes de todos los que se calcularon. Pero si quieres ejecutar la versión antigua en Darknet:
`golpear
detector de red oscura calcanchors animales.data -numof_clusters 6 -ancho 320 -alto 256
`
13. Entrene una nueva red:
`golpear
detector de red oscura -map -dont_show train animales.data animales.cfg (consulte también la sección de capacitación a continuación)
`
Capacitación
Enlaces rápidos a secciones relevantes de las preguntas frecuentes de Darknet/YOLO:
1. ¿Cómo debo configurar mis archivos y directorios?
2. ¿Qué archivo de configuración debo utilizar?
3. ¿Qué comando debo usar al entrenar mi propia red?
La forma más sencilla de anotar y entrenar es mediante el uso de DarkMark para crear todos los archivos Darknet necesarios. Esta es definitivamente la forma recomendada de entrenar una nueva red neuronal.
Si prefiere configurar manualmente los distintos archivos para entrenar una red personalizada:
1. Cree una nueva carpeta: cree una nueva carpeta donde se almacenarán los archivos. Para este ejemplo, se creará una red neuronal para detectar animales, por lo que se crea el siguiente directorio: ~/nn/animals/.
2. Copie un archivo de configuración: copie uno de los archivos de configuración de Darknet que desee utilizar como plantilla. Por ejemplo, consulte cfg/yolov4-tiny.cfg. Colóquelo en la carpeta que creó. Para este ejemplo, ahora tenemos ~/nn/animals/animals.cfg.
3. Cree un archivo de nombres de animales: cree un archivo de texto de nombres de animales en la misma carpeta donde colocó el archivo de configuración. Para este ejemplo, ahora tenemos ~/nn/animals/animals.names.
4. Edite el archivo animales.names: Edite el archivo animales.names con su editor de texto. Enumere las clases que desea utilizar. Debe tener exactamente 1 entrada por línea, sin líneas en blanco ni comentarios. Para este ejemplo, el archivo .names contendrá exactamente 4 líneas:
`
perro
gato
pájaro
caballo
`
5. Cree un archivo de datos de animales: cree un archivo de texto de datos de animales en la misma carpeta. Para este ejemplo, el archivo .data contendrá:
`
clases = 4
tren = /home/nombre de usuario/nn/animals/animals_train.txt
válido = /home/nombre de usuario/nn/animals/animals_valid.txt
nombres = /home/nombredeusuario/nn/animals/animals.nombres
copia de seguridad = /home/nombre de usuario/nn/animals
`
6. Cree una carpeta de conjunto de datos: cree una carpeta donde almacenará sus imágenes y anotaciones. Por ejemplo, esto podría ser ~/nn/animals/dataset. Cada imagen necesitará un archivo .txt correspondiente que describa las anotaciones de esa imagen. El formato de los archivos de anotaciones .txt es muy específico. No puede crear estos archivos a mano ya que cada anotación debe contener las coordenadas exactas de la anotación. Consulte DarkMark u otro software similar para anotar sus imágenes. El formato de anotación de YOLO se describe en las preguntas frecuentes de Darknet/YOLO.
7. Cree archivos de entrenamiento y válidos: cree los archivos de texto "entrenamiento" y "válidos" nombrados en el archivo .data. Estos dos archivos de texto deben enumerar individualmente todas las imágenes que Darknet debe usar para entrenar y validar al calcular el% de mAP. Exactamente una imagen por línea. La ruta y los nombres de los archivos pueden ser relativos o absolutos.
8. Modifique su archivo .cfg: Modifique su archivo .cfg con un editor de texto.
* Asegúrese de que el lote = 64.
*Tenga en cuenta las subdivisiones. Dependiendo de las dimensiones de la red y la cantidad de memoria disponible en su GPU, es posible que necesite aumentar las subdivisiones. El mejor valor para usar es 1, así que comience con eso. Consulte las preguntas frecuentes de Darknet/YOLO si alguna no funciona para usted.
Nota maxbatches=..... Un buen valor para usar al comenzar es 2000 x el número de clases. Para este ejemplo, tenemos 4 animales, por lo que 4 2000 = 8000. Lo que significa que usaremos maxbatches=8000.
* Nota pasos=..... Esto debe establecerse en 80% y 90% de los lotes máximos. Para este ejemplo, usaríamos pasos=6400,7200 ya que maxbatches se configuró en 8000.
* Nota ancho=... y alto=..... Estas son las dimensiones de la red. Las preguntas frecuentes de Darknet/YOLO explican cómo calcular el mejor tamaño a utilizar.
* Busque todas las instancias de la línea clases=... y modifíquela con el número de clases en su archivo .names. Para este ejemplo, usaríamos clases=4.
Busque todas las instancias de la línea filters=... en la sección [convolucional] antes de cada sección [yolo]. El valor a usar es (número de clases + 5) 3. Es decir, para este ejemplo, (4 + 5) * 3 = 27. Entonces usaríamos filtros = 27 en las líneas apropiadas.
9. Inicie el entrenamiento: ejecute los siguientes comandos:
`golpear
cd ~/nn/animales/
detector de red oscura -mapa -dont_show entrenar animales.datos animales.cfg
`
Ser paciente. Los mejores pesos se guardarán como animales_best.weights. Y el progreso del entrenamiento se puede observar viendo el archivo chart.png. Consulte las preguntas frecuentes de Darknet/YOLO para conocer parámetros adicionales que quizás desee utilizar al entrenar una nueva red.
Si desea ver más detalles durante el entrenamiento, agregue el parámetro --verbose. Por ejemplo:
`golpear
detector de red oscura -map -dont_show --detallado tren animales.datos animales.cfg
`
Otras herramientas y enlaces
Para administrar sus proyectos Darknet/YOLO, anotar imágenes, verificar sus anotaciones y generar los archivos necesarios para entrenar con Darknet, consulte DarkMark: https://github.com/hank-ai/darkmark
Para obtener una CLI alternativa sólida a Darknet, para usar mosaicos de imágenes, para el seguimiento de objetos en sus videos o para una API C++ sólida que se puede usar fácilmente en aplicaciones comerciales, consulte DarkHelp: https://github.com/hank-ai/ ayuda oscura
Vea si las preguntas frecuentes de Darknet/YOLO pueden ayudar a responder sus preguntas: https://darknetcv.ai/faq
Vea los numerosos tutoriales y vídeos de ejemplo en el canal de YouTube de Stéphane: https://www.youtube.com/channel/UC79J2v8b3hL7Z238mQ6dJ8w
Si tiene una pregunta de soporte o desea chatear con otros usuarios de Darknet/YOLO, únase al servidor de discordia de Darknet/YOLO: https://discord.gg/zSq8rtW
Hoja de ruta
Última actualización 2024-10-30:
Terminado
1. Cambie qsort() por std::sort() cuando se use durante el entrenamiento (quedan algunos otros oscuros)
2. Deshágase de check_mistakes, getchar() y system()
3. Convierta Darknet para usar el compilador C++ (g++ en Linux, VisualStudio en Windows)
4. Reparar la compilación de Windows
5. Reparar el soporte de Python
6. Cree una biblioteca en la red oscura
7. Vuelva a habilitar las etiquetas en las predicciones (código "alfabético")
8. Vuelva a habilitar el código CUDA/GPU
9. Vuelva a habilitar CUDNN
10. Vuelva a habilitar la mitad CUDNN
11. No codifique la arquitectura CUDA
12. Mejor información de la versión CUDA
13. Vuelva a habilitar AVX
14. Eliminar soluciones antiguas y Makefile
15.Hacer que OpenCV no sea opcional
16. Eliminar la dependencia de la antigua biblioteca pthread.
17. Quitar STB
18. Vuelva a escribir CMakeLists.txt para usar la nueva detección CUDA.
19. Elimine el antiguo código "alfabeto" y elimine las más de 700 imágenes en datos/etiquetas
20. Construir a partir de