Estrutura de detecção de objetos Darknet e YOLO
Logotipos !darknet e hank.ai
Darknet é uma estrutura de rede neural de código aberto escrita em C, C++ e CUDA.
YOLO (You Only Look Once) é um sistema de detecção de objetos em tempo real de última geração que roda dentro da estrutura Darknet.
Leia como Hank.ai ajuda a comunidade Darknet/YOLO
Anunciando Darknet V3 "Jazz"
Confira o site Darknet/YOLO
Por favor, leia as perguntas frequentes da Darknet/YOLO
Junte-se ao servidor Darknet/YOLO Discord
Artigos
1. Artigo YOLOv7
2. Papel em escala-YOLOv4
3. Artigo YOLOv4
4. Artigo YOLOv3
Informações gerais
A estrutura Darknet/YOLO é mais rápida e precisa do que outras estruturas e versões YOLO.
A estrutura é totalmente gratuita e de código aberto. Você pode integrar Darknet/YOLO em projetos e produtos existentes, incluindo produtos comerciais, sem licenciamento ou taxas.
Darknet V3 ("Jazz"), lançado em outubro de 2024, pode executar com precisão vídeo de conjunto de dados LEGO em até 1000 FPS ao usar uma GPU NVIDIA RTX 3090, o que significa que cada quadro de vídeo pode ser processado em 1 milissegundo ou lido, redimensionado e processado por Darknet /YOLO em menos tempo.
Se você precisar de ajuda ou quiser discutir Darknet/YOLO, entre no servidor Darknet/YOLO Discord: https://discord.gg/zSq8rtW
A versão CPU do Darknet/YOLO pode ser executada em dispositivos simples, como Raspberry Pi, servidores em nuvem e colab, desktops, laptops e plataformas de treinamento de última geração. A versão GPU do Darknet/YOLO requer GPU compatível com CUDA da NVIDIA.
Darknet/YOLO é conhecido por rodar em Linux, Windows e Mac. Veja as instruções de construção abaixo.
Versão Darknet
As ferramentas Darknet originais, escritas por Joseph Redmon em 2013-2017, não tinham números de versão. Consideramos esta versão 0.x.
O próximo repositório Darknet popular mantido por Alexey Bochkovskiy entre 2017-2021 também não possui um número de versão. Consideramos esta versão 1.x.
O repositório Darknet, patrocinado por Hank.ai e mantido por Stéphane Charette desde 2023, é o primeiro a ter um comando de versão. De 2023 até o final de 2024, retorna para a versão 2.x “OAK”.
O objetivo é quebrar o mínimo possível a funcionalidade existente enquanto se familiariza com a base de código.
Reescreva as etapas de construção para que tenhamos uma maneira unificada de construir no Windows e Linux usando CMake.
Converta a base de código para usar um compilador C++.
Chart.png aprimorado durante o treinamento.
Correções de bugs e otimizações relacionadas ao desempenho, principalmente relacionadas à redução do tempo necessário para treinar a rede.
A última ramificação desta base de código é a versão 2.1 na ramificação v2.
A próxima fase de desenvolvimento começa em meados de 2024 e será lançada em outubro de 2024. O comando version agora retorna 3.x "JAZZ".
Muitos comandos antigos e não mantidos foram removidos.
Muitas otimizações de desempenho, tanto na hora do treinamento quanto na hora da inferência.
A API C tradicional foi modificada; os aplicativos que usam a API Darknet original requerem pequenas modificações: https://darknetcv.ai/api/api.html
Nova API Darknet V3 C e C++: https://darknetcv.ai/api/api.html
Novos aplicativos e código de exemplo em src-examples: https://darknetcv.ai/api/files.html
Se precisar executar um desses comandos, você pode verificar a ramificação v2 anterior. Informe-nos para que possamos investigar a adição de comandos ausentes.
Pesos pré-treinados MSCOCO
Por conveniência, várias versões populares do YOLO são pré-treinadas no conjunto de dados MSCOCO. Este conjunto de dados contém 80 categorias e pode ser visto no arquivo de texto cfg/coco.names.
Existem vários outros conjuntos de dados mais simples e pesos pré-treinados disponíveis para testar Darknet/YOLO, como LEGO Gears e Rolodex. Para obter mais informações, consulte as perguntas frequentes da Darknet/YOLO.
Os pesos pré-treinados do MSCOCO podem ser baixados de vários locais diferentes ou deste repositório:
1. YOLOv2, novembro de 2016
* YOLOv2-tiny
*YOLOv2-completo
2. YOLOv3, maio de 2018
* YOLOv3-tiny
*YOLOv3-completo
3. YOLOv4, maio de 2020
* YOLOv4-tiny
*YOLOv4-completo
4. YOLOv7, agosto de 2022
* YOLOv7-tiny
*YOLOv7-completo
Os pesos pré-treinados da MSCOCO são apenas para fins de demonstração. Os arquivos .cfg e .names correspondentes para MSCOCO estão localizados no diretório cfg. Comando de exemplo:
`bash
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
Observe que deve-se treinar sua própria rede. MSCOCO é frequentemente usado para confirmar se está tudo bem.
construir
Os vários métodos de construção disponíveis no passado (antes de 2023) foram fundidos numa solução unificada. Darknet requer C++17 ou superior, OpenCV e uso de CMake para gerar os arquivos de projeto necessários.
Você não precisa saber C++ para construir, instalar ou executar Darknet/YOLO, assim como não precisa ser mecânico para dirigir um carro.
Esteja ciente se você estiver seguindo um tutorial mais antigo que possui etapas de construção mais complexas ou se as etapas de construção não corresponderem às deste leia-me. A partir de agosto de 2023, as novas etapas de construção são descritas abaixo.
Os desenvolvedores de software são incentivados a visitar https://darknetcv.ai/ para obter mais informações sobre os componentes internos da estrutura de detecção de objetos Darknet/YOLO.
Google Colab
As instruções do Google Colab são iguais às instruções do Linux. Existem vários notebooks Jupyter mostrando como realizar determinadas tarefas, como treinar novas redes.
Consulte o notebook no subdiretório colab ou siga as instruções do Linux abaixo.
Método Linux CMake
Tutorial de construção Darknet para Linux
Opcional: se você tiver uma GPU NVIDIA moderna, poderá instalar CUDA ou CUDA+cuDNN neste momento. Se instalado, o Darknet usará sua GPU para acelerar o processamento de imagens (e vídeos).
Você deve excluir o arquivo CMakeCache.txt do diretório de construção Darknet para forçar o CMake a reencontrar todos os arquivos necessários.
Lembre-se de reconstruir o Darknet.
Darknet pode funcionar sem ele, mas se você quiser treinar uma rede personalizada, você precisa de CUDA ou CUDA+cuDNN.
Visite https://developer.nvidia.com/cuda-downloads para baixar e instalar o CUDA.
Visite https://developer.nvidia.com/rdp/cudnn-download ou https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview para fazer download e instale o cuDNN.
Depois de instalar o CUDA, certifique-se de executar o nvcc e o nvidia-smi. Pode ser necessário modificar a variável PATH.
Se você instalar CUDA ou CUDA+cuDNN posteriormente ou se atualizar para uma versão mais recente do software NVIDIA:
Estas instruções assumem (mas não exigem!) um sistema rodando Ubuntu 22.04. Se estiver usando outra distribuição, ajuste conforme necessário.
`bash
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
clone do git https://github.com/hank-ai/darknet
cd rede escura
compilação mkdir
compilação de CD
cmake -DCMAKEBUILDTYPE=Liberar ..
faça o pacote -j4
sudo dpkg -i darknet-VERSION.deb
`
Se estiver usando uma versão mais antiga do CMake, você precisará atualizar o CMake antes de executar o comando cmake acima. A atualização do CMake no Ubuntu pode ser feita usando o seguinte comando:
`bash
sudo apt-get purge cmake
sudo snap install cmake --classic
`
Se você estiver usando o bash como shell de comando, será necessário reiniciá-lo neste momento. Se você usar peixe, ele deverá seguir o novo caminho imediatamente.
Usuários avançados:
Se você deseja construir um arquivo de instalação RPM em vez de um arquivo DEB, consulte as linhas relevantes em CM_package.cmake. Antes de executar make -j4 package você precisa editar estas duas linhas:
`cmake
SET (CPACKGENERATOR "DEB")#SET (CPACKGENERATOR "RPM")
`
Para distribuições como Centos e OpenSUSE, você precisa mudar essas duas linhas em CM_package.cmake para:
`cmake
DEFINIR (CPACK_GENERATOR "DEB")
DEFINIR (CPACK_GENERATOR "RPM")
`
Para instalar um pacote, use o gerenciador de pacotes usual da sua distribuição. Por exemplo, em um sistema baseado em Debian como o Ubuntu:
`bash
sudo dpkg -i darknet-2.0.1-Linux.deb
`
A instalação do pacote .deb copiará os seguintes arquivos:
/usr/bin/darknet é o executável Darknet usual. Execute a versão darknet da CLI para confirmar se ela está instalada corretamente.
/usr/include/darknet.h é a API Darknet, usada por desenvolvedores C, C++ e Python.
/usr/include/darknet_version.h contém informações de versão para desenvolvedores.
/usr/lib/libdarknet.so é uma biblioteca para vincular desenvolvedores C, C++ e Python.
/opt/darknet/cfg/... é onde todos os modelos .cfg são armazenados.
Você terminou agora! Darknet é construído e instalado em /usr/bin/. Execute o seguinte comando para testar: versão darknet.
Se você não tem /usr/bin/darknet, você não o instalou, apenas o construiu! Certifique-se de instalar o arquivo .deb ou .rpm conforme descrito acima.
Métodos CMake do Windows
Estas instruções pressupõem uma nova instalação do Windows 11 22H2.
Abra uma janela normal do prompt de comando cmd.exe e execute o seguinte comando:
`bash
winget instalar Git.Git
winget instalar Kitware.CMake
winget instalar nsis.nsis
instalar winget Microsoft.VisualStudio.2022.Community
`
Neste ponto, precisamos modificar a instalação do Visual Studio para incluir suporte para aplicativos C++:
Clique no menu Iniciar do Windows e execute o Visual Studio Installer
Clique em "Editar"
Selecione "Desenvolvimento de desktop usando C++"
Clique em "Editar" no canto inferior direito e clique em "Sim"
Depois que tudo for baixado e instalado, clique no menu Iniciar do Windows novamente e selecione Prompt de comando do desenvolvedor para Visual Studio 2022. Não use o PowerShell para essas etapas, você terá problemas!
Usuários avançados:
Em vez de executar um prompt de comando do desenvolvedor, você pode fazer login no dispositivo usando um prompt de comando normal ou ssh e executar manualmente "Arquivos de programasMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat".
Depois de executar o prompt de comando do desenvolvedor conforme acima (não o PowerShell!), Execute o seguinte comando para instalar o Microsoft VCPKG, que será usado para construir o OpenCV:
`bash
CDC:
mkdir c:srccd c:src
clone do git https://github.com/microsoft/vcpkg
CD vcpkg
bootstrap-vcpkg.bat
.vcpkg.exe integrar instalação
.vcpkg.exe integrar powershell.vcpkg.exe instalar opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
Por favor, seja paciente com esta última etapa, pois pode levar muito tempo para ser executada. Requer muito download e construção.
Usuários avançados:
Observe que existem muitos outros módulos opcionais que você pode querer adicionar ao construir o OpenCV. Execute .vcpkg.exe e pesquise opencv para ver a lista completa.
Opcional: se você tiver uma GPU NVIDIA moderna, poderá instalar CUDA ou CUDA+cuDNN neste momento. Se instalado, o Darknet usará sua GPU para acelerar o processamento de imagens (e vídeos).
Você deve excluir o arquivo CMakeCache.txt do diretório de construção Darknet para forçar o CMake a reencontrar todos os arquivos necessários.
Lembre-se de reconstruir o Darknet.
Darknet pode funcionar sem ele, mas se você quiser treinar uma rede personalizada, você precisa de CUDA ou CUDA+cuDNN.
Visite https://developer.nvidia.com/cuda-downloads para baixar e instalar o CUDA.
Visite https://developer.nvidia.com/rdp/cudnn-download ou https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows para baixar e instalar o cuDNN.
Depois de instalar o CUDA, certifique-se de executar nvcc.exe e nvidia-smi.exe. Pode ser necessário modificar a variável PATH.
Depois de baixar o cuDNN, descompacte e copie os diretórios bin, include e lib para C:/Arquivos de Programas/NVIDIA GPU Computing Toolkit/CUDA/[versão]/. Pode ser necessário substituir alguns arquivos.
Se você instalar CUDA ou CUDA+cuDNN posteriormente ou se atualizar para uma versão mais recente do software NVIDIA:
CUDA deve ser instalado após o Visual Studio. Se você atualizar o Visual Studio, lembre-se de reinstalar o CUDA.
Depois que todas as etapas anteriores forem concluídas com sucesso, você precisará clonar o Darknet e construí-lo. Nesta etapa também precisamos informar ao CMake onde o vcpkg está localizado para que ele possa encontrar o OpenCV e outras dependências:
`bash
cd c:src
clone do git https://github.com/hank-ai/darknet.git
cd rede escura
compilação mkdir
compilação de CD
cmake -DCMAKEBUILDTYPE=Liberar -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Liberar PACKAGE.vcxproj
`
Se você receber um erro sobre alguma DLL CUDA ou cuDNN ausente (por exemplo, cublas64_12.dll), copie manualmente o arquivo CUDA .dll para o mesmo diretório de saída que Darknet.exe. Por exemplo:
`bash
copie "C:Arquivos de programasNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(Este é um exemplo! Verifique qual versão você está executando e execute o comando apropriado para a versão que você instalou.)
Após copiar os arquivos, execute novamente o último comando msbuild.exe para gerar o pacote de instalação do NSIS:
`bash
msbuild.exe /property:Platform=x64;Configuration=Liberar PACKAGE.vcxproj
`
Usuários avançados:
Observe que a saída do comando cmake é o arquivo de solução normal do Visual Studio Darknet.sln. Se você for um desenvolvedor de software que usa regularmente a GUI do Visual Studio em vez de msbuild.exe para criar projetos, poderá ignorar a linha de comando e carregar o projeto Darknet no Visual Studio.
Agora você deve ter este arquivo pronto para ser executado: C: srcDarknetbuildsrc-cliReleasedarknet.exe. Execute o seguinte comando para testar: Versão C:srcDarknetbuildsrc-cliReleasedarknet.exe.
Para instalar corretamente o Darknet, bibliotecas, incluir arquivos e DLLs necessárias, execute o assistente de instalação NSIS criado na última etapa. Veja o arquivo darknet-VERSION.exe no diretório de construção. Por exemplo:
`bash
darknet-2.0.31-win64.exe
`
A instalação do pacote de instalação NSIS irá:
Crie um diretório chamado Darknet, por exemplo C:Program FilesDarknet.
Instale o aplicativo CLI darknet.exe e outros aplicativos de amostra.
Instale os arquivos .dll de terceiros necessários, como os do OpenCV.
Instale os arquivos Darknet .dll, .lib e .h necessários para usar darknet.dll de outros aplicativos.
Instale o arquivo .cfg do modelo.
Você terminou agora! Após a conclusão do assistente de instalação, Darknet será instalado em C:Program FilesDarknet. Execute o seguinte comando para testar: Versão C:Program FilesDarknetbindarknet.exe.
Se você não possui C:/Program Files/darknet/bin/darknet.exe, você não o instalou, apenas o construiu! Certifique-se de concluir cada painel do Assistente de Instalação NSIS nas etapas anteriores.
Usando Darknet
CLI
A seguir não está uma lista completa de todos os comandos suportados pelo Darknet.
Além da CLI Darknet, observe também a CLI do projeto DarkHelp, que fornece uma CLI alternativa para Darknet/YOLO. DarkHelp CLI também possui vários recursos avançados não disponíveis diretamente no Darknet. Você pode usar o Darknet CLI e o DarkHelp CLI juntos, eles não são mutuamente exclusivos.
Para a maioria dos comandos mostrados abaixo, você precisará do arquivo .weights e de seus arquivos .names e .cfg correspondentes. Você pode treinar sua própria rede (altamente recomendado!) ou baixar redes que outros treinaram e disponibilizaram gratuitamente na Internet. Exemplos de conjuntos de dados de pré-treinamento incluem:
1. LEGO Gears (encontre objetos nas imagens)
2. Rolodex (encontre texto na imagem)
3. MSCOCO (detecção de alvo padrão de 80 categorias)
Os comandos executáveis incluem:
Liste alguns comandos e opções que podem ser executados:
`bash
ajuda darknet
`
Verifique a versão:
`bash
versão darknet
`
Use previsão de imagem:
V2: teste de detector darknet cars.data cars.cfg cars_best.weights image1.jpg
V3: darknet02displayannotatedimages cars.cfg image1.jpg
DarkHelp: DarkHelp cars.cfg cars.cfg cars_best.weights image1.jpg
Coordenadas de saída:
V2: teste de detector darknet Animals.data Animals.cfg Animalsbest.weights -extoutput dog.jpg
V3: darknet01inference_images animais cachorro.jpg
DarkHelp: DarkHelp --json animais.cfg animais.nomes animais_best.pesos cachorro.jpg
Processando vídeo:
V2: demonstração do detector darknet animais.dados animais.cfg animaisbest.weights -extoutput test.mp4
V3: darknet03display_videos animais.cfg teste.mp4
DarkHelp: DarkHelp animais.cfg animais.nomes animais_best.pesos teste.mp4
Lendo da webcam:
V2: demonstração do detector darknet Animals.data Animals.cfg Animals_best.weights -c 0
V3: animais darknet08display_webcam
Salve os resultados no vídeo:
V2: demonstração do detector darknet animais.dados animais.cfg animaismelhores.pesos teste.mp4 -outfilename res.avi
V3: darknet05processvideosanimais multithreaded.cfg animais.nomes animais_best.teste de pesos.mp4
DarkHelp: DarkHelp animais.cfg animais.nomes animais_best.pesos teste.mp4
JSON:
V2: demonstração do detector darknet animais.dados animais.cfg animaisbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
V3: darknet06imagestojson animais image1.jpg
DarkHelp: DarkHelp --json animais.nomes animais.cfg animais_best.pesos image1.jpg
Execute em uma GPU específica:
V2: demonstração do detector darknet Animals.data Animals.cfg Animals_best.weights -i 1 test.mp4
Verifique a precisão da rede neural:
`bash
mapa do detector darknet driving.data driving.cfg driving_best.weights ...
`
`
Id Nome AvgPrecision TP FN FP TN Precisão ErrorRate Precisão Recall Especificidade FalsePosRate
------ ------------ ------ ------ ------ ------ -------- --------- --------- ------ ---------- ----------
0 veículo 91,2495 32648 3903 5826 65129 0,9095 0,0905 0,8486 0,8932 0,9179 0,0821
1 motocicleta 80,4499 2936 513 569 5393 0,8850 0,1150 0,8377 0,8513 0,9046 0,0954
2 bicicletas 89,0912 570 124 104 3548 0,9475 0,0525 0,8457 0,8213 0,9715 0,0285
3 pessoas 76,7937 7072 1727 2574 27523 0,8894 0,1106 0,7332 0,8037 0,9145 0,0855
4 muitos veículos 64,3089 1068 509 733 11288 0,9087 0,0913 0,5930 0,6772 0,9390 0,0610
5 luz verde 86,8118 1969 239 510 4116 0,8904 0,1096 0,7943 0,8918 0,8898 0,1102
6 luz amarela 82,0390 126 38 30 1239 0,9525 0,0475 0,8077 0,7683 0,9764 0,0236
7 luz vermelha 94,1033 3449 217 451 4643 0,9237 0,0763 0,8844 0,9408 0,9115 0,0885
`
Verifique a precisão mAP@IoU=75:
`bash
mapa detector darknet animais.dados animais.cfg animaisbest.weights -iouthresh 0,75
`
O recálculo dos pontos de ancoragem é melhor feito no DarkMark, pois ele será executado 100 vezes seguidas e selecionará o melhor ponto de ancoragem de todos os pontos de ancoragem calculados. No entanto, se você deseja executar uma versão mais antiga no Darknet:
`bash
detector darknet calcanchors animais.data -numof_clusters 6 -largura 320 -altura 256
`
Treine uma nova rede:
`bash
detector darknet -map -dont_show trem animais.data animais.cfg
`
(Veja também a seção de treinamento abaixo)
trem
Links rápidos para seções relevantes nas perguntas frequentes do Darknet/YOLO:
1. Como devo configurar meus arquivos e diretórios?
2. Qual perfil devo usar?
3. Qual comando devo usar ao treinar minha própria rede?
Usar o DarkMark para criar todos os arquivos Darknet necessários é a maneira mais fácil de anotar e treinar. Esta é definitivamente a forma recomendada para treinar novas redes neurais.
Se desejar configurar manualmente os vários arquivos para treinar uma rede personalizada:
1. Crie uma nova pasta para armazenar os arquivos. Neste exemplo, você criará uma rede neural que detecta animais, então crie o seguinte diretório: ~/nn/animals/.
2. Copie um dos arquivos de configuração Darknet que deseja usar como modelo. Por exemplo, consulte cfg/yolov4-tiny.cfg. Coloque-o na pasta que você criou. Neste exemplo, agora temos ~/nn/animals/animals.cfg.
3. Crie um arquivo de texto Animals.names na mesma pasta onde você colocou o arquivo de configuração. Neste exemplo, agora temos ~/nn/animals/animals.names.
4. Use um editor de texto para editar o arquivo pets.names. Liste as categorias que deseja usar. Você precisa ter exatamente 1 entrada por linha, sem linhas em branco, sem comentários. Neste exemplo, o arquivo .names conterá exatamente 4 linhas:
`
cachorro
gato
pássaro
cavalo
`
5. Crie um arquivo de texto Animals.data na mesma pasta. Neste exemplo, o arquivo .data conterá:
`
aulas=4
trem=/home/nomedeusuário/nn/animals/animals_train.txt
válido=/home/nomedeusuário/nn/animals/animals_valid.txt
nomes=/home/nomedeusuário/nn/animais/animais.nomes
backup=/home/nomedeusuário/nn/animais
`
6. Crie uma pasta para armazenar suas imagens e anotações. Por exemplo, poderia ser ~/nn/animals/dataset. Cada imagem requer um arquivo .txt correspondente que descreve as anotações dessa imagem. O formato dos arquivos de comentários .txt é muito específico. Você não pode criar esses arquivos manualmente porque cada anotação precisa conter as coordenadas precisas da anotação. Consulte DarkMark ou outro software semelhante para fazer anotações em suas imagens. O formato de anotação YOLO é descrito nas Perguntas frequentes do Darknet/YOLO.
7. Crie arquivos de texto "treinados" e "válidos" nomeados no arquivo .data. Esses dois arquivos de texto precisam listar todas as imagens que Darknet deve usar para treinamento e validação, respectivamente, para validação no cálculo do mAP%. Há exatamente uma imagem por linha. Caminhos e nomes de arquivos podem ser relativos ou absolutos.
8. Use um editor de texto para modificar seu arquivo .cfg.
* Certifique-se de lote=64.
* Preste atenção às subdivisões. Dependendo do tamanho da rede e da quantidade de memória disponível na GPU, pode ser necessário aumentar as subdivisões. O melhor valor a ser usado é 1, então comece com ele. Se você não conseguir usar 1, consulte as Perguntas frequentes do Darknet/YOLO.
Observe que maxbatches=.... Ao começar, o valor ideal a ser usado é um número de classes de 2.000. Neste exemplo temos 4 animais, então 4 * 2.000 = 8.000. Isso significa que usaremos maxbatches=8000.
* Nota passos=.... Isso deve ser definido como 80% e 90% de maxbatches. Neste exemplo, usaremos steps=6400,7200 já que maxbatches está definido como 8000.
* Observe que width=... e height=.... Estas são dimensões de rede. O FAQ Darknet/YOLO explica como calcular o tamanho ideal a ser usado.
* Procure todas as instâncias que contenham a linha classes=... e modifique-as com o número de classes no arquivo .names. Neste exemplo usaremos classes=4.
Na seção [convolutional] antes de cada seção [yolo], procure todas as instâncias que contenham a linha filter=... . O valor a ser usado é (número de categorias + 5) 3. Isso significa que neste exemplo, (4 + 5) * 3 = 27. Portanto, usaremos filter=27 para as linhas apropriadas.
9. Comece a treinar! Execute o seguinte comando:
`bash
cd ~/nn/animais/
detector darknet -map -dont_show trem animais.data animais.cfg
`
Por favor, aguarde. Os melhores pesos serão salvos como Animals_best.weights. Você pode observar o progresso do treinamento visualizando o arquivo chart.png. Consulte o FAQ Darknet/YOLO para parâmetros adicionais que você pode querer usar ao treinar uma nova rede.
Se quiser ver mais detalhes durante o treinamento, adicione o parâmetro --verbose. Por exemplo:
`bash
detector darknet -map -dont_show --verbose trem animais.data animais.cfg
`
Outras ferramentas e links
Para gerenciar seu projeto Darknet/YOLO, anotar imagens, validar suas anotações e gerar os arquivos necessários para treinamento com Darknet, consulte DarkMark.
Para uma CLI alternativa poderosa ao Darknet, para usar imagens lado a lado, rastreamento de objetos em seus vídeos ou para uma API C++ poderosa que pode ser facilmente usada em aplicativos comerciais, consulte DarkHelp.
Confira as perguntas frequentes do Darknet/YOLO para ver se ele pode ajudar a responder sua pergunta.
Confira os diversos tutoriais e vídeos de exemplo no canal de Stéphane no YouTube
Se você tiver alguma dúvida de suporte ou quiser conversar com outros usuários Darknet/YOLO, entre no servidor Darknet/YOLO Discord.
roteiro
Última atualização: 30/10/2024
Concluído
1. Substitua qsort() usado durante o treinamento por std::sort() (alguns outros estranhos ainda existem)
2. Livre-se de check_mistakes, getchar() e system()
3. Converta Darknet para usar um compilador C++ (g++ no Linux, VisualStudio no Windows)
4. Corrija a compilação do Windows
5. Corrigir suporte a Python
6. Construa uma biblioteca darknet
7. Reative os rótulos nas previsões (código "alfabeto")
8. Reative o código CUDA/GPU
9. Reative o CUDNN
10. Reative a metade CUDNN
11. Não codifique a arquitetura CUDA
12. Melhores informações sobre a versão CUDA
13. Reative o AVX
14. Exclua a solução antiga e o Makefile
15. Torne o OpenCV não opcional
16. Remova a dependência da antiga biblioteca pthread
17. Excluir STB
18. Reescreva CMakeLists.txt para usar a nova instrumentação CUDA
19. Remova o antigo código “alfabeto” e exclua mais de 700 imagens em dados/rótulos
20. Construa fora da fonte
21. Tenha melhor saída de número de versão
22. Otimização de desempenho relacionada ao treinamento (tarefas em andamento)
23. Otimização de desempenho relacionada à inferência (tarefas em andamento)
24. Use passagem por referência sempre que possível
25. Limpe os arquivos .hpp
26. Reescreva darknet.h
27. Não converta cv::Mat em void*, em vez disso use-o como um objeto C++ adequado
28. Corrija ou torne consistente o uso de estruturas de imagem internas
29. Corrigir compilação para dispositivos Jetson baseados em ARM
*É improvável que os dispositivos Jetson originais sejam consertados, pois não são mais suportados pela NVIDIA (sem compilador C++17)
* Novo dispositivo Jetson Orin está funcionando
30. Corrigir API Python em V3
* Precisa de melhor suporte para Python (existe algum desenvolvedor de Python que queira ajudar com isso?)
metas de curto prazo
1. Substitua printf() por std::cout (trabalho em andamento)
2. Verifique o suporte para câmeras Zed antigas
3. Análise de linha de comando melhor e mais consistente (trabalho em andamento)
metas de médio prazo
1. Remova todos os códigos char* e substitua por std::string
2. Não oculte avisos e limpe os avisos do compilador (em andamento)
3. Melhor uso de cv::Mat em vez de estruturas de imagem personalizadas em C (trabalho em andamento)
4. Substitua a função de lista antiga por std::vector ou std::list
5. Corrigido suporte para imagens em tons de cinza de 1 canal
6. Adicione suporte para imagens de canal N onde N > 3 (por exemplo, imagens com profundidade adicional ou canais térmicos)
7. Limpeza contínua de código (em andamento)
objetivos de longo prazo
1. Corrija problemas de CUDA/CUDNN em todas as GPUs
2. Reescreva o código CUDA+cuDNN
3. Considere adicionar suporte para GPUs não NVIDIA
4. Caixa delimitadora girada ou algum tipo de suporte de "ângulo"
5. Pontos-chave/esqueleto
6. Mapa de calor (em andamento)
7. Divisão