Darknet Object Detection Framework and YOLO
!darknet and hank.ai logos
Darknet 是一个用 C、C++ 和 CUDA 编写的开源神经网络框架。
YOLO(You Only Look Once)是一种最先进的实时目标检测系统,它在 Darknet 框架中运行。
阅读 Hank.ai 如何帮助 Darknet/YOLO 社区
宣布 Darknet V3 "Jazz"
查看 Darknet/YOLO 网站
请阅读 Darknet/YOLO 常见问题解答
加入 Darknet/YOLO Discord 服务器
Papers
1. Paper YOLOv7
2. Paper Scaled-YOLOv4
3. Paper YOLOv4
4. Paper YOLOv3
General Information
Darknet/YOLO 框架比其他框架和 YOLO 版本更快、更准确。
该框架完全免费且开源。您可以将 Darknet/YOLO 集成到现有项目和产品中,包括商业产品,无需许可或付费。
Darknet V3("Jazz")于 2024 年 10 月发布,在使用 NVIDIA RTX 3090 GPU 时,可以准确地以高达 1000 FPS 的速度运行 LEGO 数据集视频,这意味着每个视频帧都可以在 1 毫秒或更短的时间内被 Darknet/YOLO 读取、调整大小和处理。
如果您需要帮助或想讨论 Darknet/YOLO,请加入 Darknet/YOLO Discord 服务器: https://discord.gg/zSq8rtW
Darknet/YOLO 的 CPU 版本可以在 Raspberry Pi、云 & colab 服务器、台式机、笔记本电脑和高端训练平台等简单设备上运行。Darknet/YOLO 的 GPU 版本需要 NVIDIA 的 CUDA 兼容 GPU。
Darknet/YOLO 已知可以在 Linux、Windows 和 Mac 上运行。请参阅下面的构建说明。
Darknet 版本
由 Joseph Redmon 在 2013-2017 年编写的原始 Darknet 工具没有版本号。我们将此版本视为 0.x。
由 Alexey Bochkovskiy 在 2017-2021 年间维护的下一个流行的 Darknet 仓库也没有版本号。我们将此版本视为 1.x。
由 Hank.ai 赞助,由 Stéphane Charette 从 2023 年开始维护的 Darknet 仓库是第一个具有版本命令的仓库。从 2023 年到 2024 年底,它返回版本 2.x "OAK"。
目标是在熟悉代码库的同时尽可能少地破坏现有的功能。
重新编写构建步骤,以便我们有 1 种统一的方式使用 CMake 在 Windows 和 Linux 上构建。
将代码库转换为使用 C++ 编译器。
增强了训练时的 chart.png。
错误修复和性能相关的优化,主要与减少训练网络所需的时间有关。
此代码库的最后一个分支是 v2 分支中的版本 2.1。
下一阶段的开发始于 2024 年年中,并在 2024 年 10 月发布。版本命令现在返回 3.x "JAZZ"。
删除了许多旧的和未维护的命令。
许多性能优化,包括训练时和推理时的优化。
传统的 C API 已修改;使用原始 Darknet API 的应用程序需要进行少量修改:https://darknetcv.ai/api/api.html
新的 Darknet V3 C 和 C++ API:https://darknetcv.ai/api/api.html
src-examples 中的新应用程序和示例代码:https://darknetcv.ai/api/files.html
如果您需要运行这些命令中的一个,您可以随时检出以前的 v2 分支。请告诉我们,以便我们可以调查添加回任何丢失的命令。
MSCOCO 预训练权重
为了方便起见,YOLO 的几个流行版本在 MSCOCO 数据集上进行了预训练。此数据集包含 80 个类别,可以在文本文件 cfg/coco.names 中看到。
还有其他几个更简单的可用数据集和预训练权重,用于测试 Darknet/YOLO,例如 LEGO Gears 和 Rolodex。有关详细信息,请参阅 Darknet/YOLO 常见问题解答。
MSCOCO 预训练权重可以从多个不同的位置下载,也可以从这个仓库下载:
1. YOLOv2,2016 年 11 月
* YOLOv2-tiny
* YOLOv2-full
2. YOLOv3,2018 年 5 月
* YOLOv3-tiny
* YOLOv3-full
3. YOLOv4,2020 年 5 月
* YOLOv4-tiny
* YOLOv4-full
4. YOLOv7,2022 年 8 月
* YOLOv7-tiny
* YOLOv7-full
MSCOCO 预训练权重仅供演示使用。MSCOCO 的相应 .cfg 和 .names 文件位于 cfg 目录中。示例命令:
`bash
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights
darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg
DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
请注意,人们应该训练自己的网络。MSCOCO 通常用于确认一切正常。
构建
过去(2023 年之前)可用的各种构建方法已合并到一个统一的解决方案中。Darknet 需要 C++17 或更高版本、OpenCV,并使用 CMake 生成必要的项目文件。
您无需了解 C++ 即可构建、安装或运行 Darknet/YOLO,就像您无需成为机械师即可驾驶汽车一样。
如果您正在遵循具有更复杂构建步骤的旧教程,或者构建步骤与本自述文件中不匹配的步骤,请注意。从 2023 年 8 月开始,新的构建步骤如以下所述。
鼓励软件开发人员访问 https://darknetcv.ai/ 以获取有关 Darknet/YOLO 目标检测框架内部的更多信息。
Google Colab
Google Colab 说明与 Linux 说明相同。有几个 Jupyter 笔记本显示了如何执行某些任务,例如训练新的网络。
请参阅 colab 子目录中的笔记本,或者遵循以下 Linux 说明。
Linux CMake 方法
Darknet 针对 Linux 的构建教程
可选:如果您拥有现代 NVIDIA GPU,则可以在此时安装 CUDA 或 CUDA+cuDNN。如果安装,Darknet 将使用您的 GPU 来加速图像(和视频)处理。
您必须从 Darknet 构建目录中删除 CMakeCache.txt 文件以强制 CMake 重新查找所有必要的文件。
请记住重新构建 Darknet。
Darknet 可以没有它运行,但如果您想训练自定义网络,则需要 CUDA 或 CUDA+cuDNN。
访问 https://developer.nvidia.com/cuda-downloads 下载并安装 CUDA。
访问 https://developer.nvidia.com/rdp/cudnn-download 或 https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview 下载并安装 cuDNN。
安装 CUDA 后,确保您可以运行 nvcc 和 nvidia-smi。您可能需要修改 PATH 变量。
如果您在稍后时间安装 CUDA 或 CUDA+cuDNN,或者您升级到 NVIDIA 软件的更新版本:
这些说明假设(但不要求!)运行 Ubuntu 22.04 的系统。如果使用其他发行版,请根据需要进行调整。
`bash
sudo apt-get install build-essential git libopencv-dev cmake
mkdir ~/srccd ~/src
git clone https://github.com/hank-ai/darknet
cd darknet
mkdir build
cd build
cmake -DCMAKEBUILDTYPE=Release ..
make -j4 package
sudo dpkg -i darknet-VERSION.deb
`
如果您使用的是旧版本的 CMake,则需要在运行上面的 cmake 命令之前升级 CMake。在 Ubuntu 上升级 CMake 可以使用以下命令完成:
`bash
sudo apt-get purge cmake
sudo snap install cmake --classic
`
如果您使用 bash 作为您的命令 shell,您将需要在此时重新启动您的 shell。如果您使用 fish,它应该立即拾取新的路径。
高级用户:
如果您想构建 RPM 安装文件而不是 DEB 文件,请参阅 CM_package.cmake 中的相关行。在运行 make -j4 package 之前,您需要编辑这两行:
`cmake
SET (CPACKGENERATOR "DEB")# SET (CPACKGENERATOR "RPM")
`
对于 Centos 和 OpenSUSE 等发行版,您需要将 CM_package.cmake 中的这两行切换为:
`cmake
SET (CPACK_GENERATOR "DEB")
SET (CPACK_GENERATOR "RPM")
`
要安装安装包,请使用您发行版的常用包管理器。例如,在基于 Debian 的系统(如 Ubuntu)上:
`bash
sudo dpkg -i darknet-2.0.1-Linux.deb
`
安装 .deb 包将复制以下文件:
/usr/bin/darknet 是通常的 Darknet 可执行文件。从 CLI 运行 darknet version 以确认它已正确安装。
/usr/include/darknet.h 是 Darknet API,供 C、C++ 和 Python 开发人员使用。
/usr/include/darknet_version.h 包含供开发人员使用的版本信息。
/usr/lib/libdarknet.so 是用于链接 C、C++ 和 Python 开发人员的库。
/opt/darknet/cfg/... 是所有 .cfg 模板存储的位置。
您现在完成了!Darknet 已构建并安装到 /usr/bin/ 中。运行以下命令进行测试:darknet version。
如果您没有 /usr/bin/darknet,则表示您没有安装它,您只是构建了它!请确保像上面描述的那样安装 .deb 或 .rpm 文件。
Windows CMake 方法
这些说明假设全新安装了 Windows 11 22H2。
打开一个正常的 cmd.exe 命令提示符窗口,并运行以下命令:
`bash
winget install Git.Git
winget install Kitware.CMake
winget install nsis.nsis
winget install Microsoft.VisualStudio.2022.Community
`
此时,我们需要修改 Visual Studio 安装以包含对 C++ 应用程序的支持:
点击“Windows 开始”菜单,并运行“Visual Studio Installer”
点击“修改”
选择“使用 C++ 的桌面开发”
点击右下角的“修改”,然后点击“是”
下载并安装完所有内容后,再次点击“Windows 开始”菜单,并选择“Visual Studio 2022 的开发者命令提示符”。不要使用 PowerShell 进行这些步骤,您会遇到问题!
高级用户:
您无需运行开发者命令提示符,而是可以使用正常的命令提示符或 ssh 登录到设备,并手动运行“Program FilesMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat”。
一旦您如上所述运行了开发者命令提示符(不是 PowerShell!),请运行以下命令以安装 Microsoft VCPKG,它将用于构建 OpenCV:
`bash
cd c:
mkdir c:srccd c:src
git clone https://github.com/microsoft/vcpkg
cd vcpkg
bootstrap-vcpkg.bat
.vcpkg.exe integrate install
.vcpkg.exe integrate powershell.vcpkg.exe install opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
请耐心等待最后一步,因为它可能需要很长时间才能运行。它需要下载和构建很多东西。
高级用户:
请注意,在构建 OpenCV 时,您可能希望添加许多其他可选模块。运行 .vcpkg.exe search opencv 以查看完整列表。
可选:如果您拥有现代 NVIDIA GPU,则可以在此时安装 CUDA 或 CUDA+cuDNN。如果安装,Darknet 将使用您的 GPU 来加速图像(和视频)处理。
您必须从 Darknet 构建目录中删除 CMakeCache.txt 文件以强制 CMake 重新查找所有必要的文件。
请记住重新构建 Darknet。
Darknet 可以没有它运行,但如果您想训练自定义网络,则需要 CUDA 或 CUDA+cuDNN。
访问 https://developer.nvidia.com/cuda-downloads 下载并安装 CUDA。
访问 https://developer.nvidia.com/rdp/cudnn-download 或 https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows 下载并安装 cuDNN。
安装 CUDA 后,确保您可以运行 nvcc.exe 和 nvidia-smi.exe。您可能需要修改 PATH 变量。
下载 cuDNN 后,解压缩并将 bin、include 和 lib 目录复制到 C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[版本]/ 中。您可能需要覆盖一些文件。
如果您在稍后时间安装 CUDA 或 CUDA+cuDNN,或者您升级到 NVIDIA 软件的更新版本:
CUDA 必须在 Visual Studio 之后安装。如果您升级 Visual Studio,请记住重新安装 CUDA。
一旦所有前面的步骤都成功完成,您需要克隆 Darknet 并构建它。在此步骤中,我们还需要告诉 CMake vcpkg 的位置,以便它可以找到 OpenCV 和其他依赖项:
`bash
cd c:src
git clone https://github.com/hank-ai/darknet.git
cd darknet
mkdir build
cd build
cmake -DCMAKEBUILDTYPE=Release -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake ..
msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
如果您收到关于某些丢失的 CUDA 或 cuDNN DLL(例如 cublas64_12.dll)的错误,则手动将 CUDA .dll 文件复制到与 Darknet.exe 相同的输出目录中。例如:
`bash
copy "C:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(这是一个例子!请检查您运行的版本,并运行适合您安装的版本的命令。)
复制完文件后,重新运行最后一个 msbuild.exe 命令以生成 NSIS 安装包:
`bash
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
高级用户:
请注意,cmake 命令的输出是正常的 Visual Studio 解决方案文件 Darknet.sln。如果您是定期使用 Visual Studio GUI 而不是 msbuild.exe 来构建项目的软件开发人员,则可以忽略命令行并在 Visual Studio 中加载 Darknet 项目。
您现在应该拥有可以运行的这个文件:C:srcDarknetbuildsrc-cliReleasedarknet.exe。运行以下命令进行测试:C:srcDarknetbuildsrc-cliReleasedarknet.exe version。
要正确安装 Darknet、库、包含文件和必要的 DLL,请运行在最后一步中构建的 NSIS 安装向导。请参阅构建目录中的文件 darknet-VERSION.exe。例如:
`bash
darknet-2.0.31-win64.exe
`
安装 NSIS 安装包将:
创建一个名为 Darknet 的目录,例如 C:Program FilesDarknet。
安装 CLI 应用程序 darknet.exe 和其他示例应用程序。
安装所需的第三方 .dll 文件,例如来自 OpenCV 的文件。
安装必要的 Darknet .dll、.lib 和 .h 文件,以便从其他应用程序使用 darknet.dll。
安装模板 .cfg 文件。
您现在完成了!安装向导完成后,Darknet 将安装到 C:Program FilesDarknet 中。运行以下命令进行测试:C:Program FilesDarknetbindarknet.exe version。
如果您没有 C:/Program Files/darknet/bin/darknet.exe,则表示您没有安装它,您只是构建了它!请确保在前面的步骤中完成 NSIS 安装向导的每个面板。
使用 Darknet
CLI
以下不是 Darknet 支持的所有命令的完整列表。
除了 Darknet CLI 之外,还要注意 DarkHelp 项目 CLI,它为 Darknet/YOLO 提供了替代的 CLI。DarkHelp CLI 还具有 Darknet 中不可直接使用的多个高级功能。您可以将 Darknet CLI 和 DarkHelp CLI 结合使用,它们并不相互排斥。
对于下面显示的大多数命令,您将需要 .weights 文件及其对应的 .names 和 .cfg 文件。您可以训练自己的网络(强烈推荐!)或下载其他人已经训练并免费提供给互联网的网络。预训练数据集的示例包括:
1. LEGO Gears(在图像中查找物体)
2. Rolodex(在图像中查找文本)
3. MSCOCO(标准 80 类目标检测)
可运行的命令包括:
列出一些可能运行的命令和选项:
`bash
darknet help
`
检查版本:
`bash
darknet version
`
使用图像预测:
V2: darknet detector test cars.data cars.cfg cars_best.weights image1.jpg
V3: darknet02displayannotatedimages cars.cfg image1.jpg
DarkHelp: DarkHelp cars.cfg cars.cfg cars_best.weights image1.jpg
输出坐标:
V2: darknet detector test animals.data animals.cfg animalsbest.weights -extoutput dog.jpg
V3: darknet01inference_images animals dog.jpg
DarkHelp: DarkHelp --json animals.cfg animals.names animals_best.weights dog.jpg
处理视频:
V2: darknet detector demo animals.data animals.cfg animalsbest.weights -extoutput test.mp4
V3: darknet03display_videos animals.cfg test.mp4
DarkHelp: DarkHelp animals.cfg animals.names animals_best.weights test.mp4
从网络摄像头读取:
V2: darknet detector demo animals.data animals.cfg animals_best.weights -c 0
V3: darknet08display_webcam animals
将结果保存到视频:
V2: darknet detector demo animals.data animals.cfg animalsbest.weights test.mp4 -outfilename res.avi
V3: darknet05processvideosmultithreaded animals.cfg animals.names animals_best.weights test.mp4
DarkHelp: DarkHelp animals.cfg animals.names animals_best.weights test.mp4
JSON:
V2: darknet detector demo animals.data animals.cfg animalsbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
V3: darknet06imagestojson animals image1.jpg
DarkHelp: DarkHelp --json animals.names animals.cfg animals_best.weights image1.jpg
在特定 GPU 上运行:
V2: darknet detector demo animals.data animals.cfg animals_best.weights -i 1 test.mp4
检查神经网络的准确性:
`bash
darknet detector map driving.data driving.cfg driving_best.weights ...
`
`
Id Name AvgPrecision TP FN FP TN Accuracy ErrorRate Precision Recall Specificity FalsePosRate
-- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ----------- ------------
0 vehicle 91.2495 32648 3903 5826 65129 0.9095 0.0905 0.8486 0.8932 0.9179 0.0821
1 motorcycle 80.4499 2936 513 569 5393 0.8850 0.1150 0.8377 0.8513 0.9046 0.0954
2 bicycle 89.0912 570 124 104 3548 0.9475 0.0525 0.8457 0.8213 0.9715 0.0285
3 person 76.7937 7072 1727 2574 27523 0.8894 0.1106 0.7332 0.8037 0.9145 0.0855
4 many vehicles 64.3089 1068 509 733 11288 0.9087 0.0913 0.5930 0.6772 0.9390 0.0610
5 green light 86.8118 1969 239 510 4116 0.8904 0.1096 0.7943 0.8918 0.8898 0.1102
6 yellow light 82.0390 126 38 30 1239 0.9525 0.0475 0.8077 0.7683 0.9764 0.0236
7 red light 94.1033 3449 217 451 4643 0.9237 0.0763 0.8844 0.9408 0.9115 0.0885
`
检查准确率 mAP@IoU=75:
`bash
darknet detector map animals.data animals.cfg animalsbest.weights -iouthresh 0.75
`
重新计算锚点最好在 DarkMark 中完成,因为它将连续运行 100 次并从所有计算的锚点中选择最佳锚点。但是,如果您想在 Darknet 中运行旧版本:
`bash
darknet detector calcanchors animals.data -numof_clusters 6 -width 320 -height 256
`
训练新的网络:
`bash
darknet detector -map -dont_show train animals.data animals.cfg
`
(另请参阅下面的训练部分)
训练
Darknet/YOLO 常见问题解答中相关部分的快速链接:
1. 我应该如何设置我的文件和目录?
2. 我应该使用哪个配置文件?
3. 训练自己的网络时我应该使用哪个命令?
使用 DarkMark 创建所有必要的 Darknet 文件,是最简单的注释和训练方法。这绝对是训练新的神经网络的推荐方法。
如果您希望手动设置各种文件以训练自定义网络:
1. 创建一个新的文件夹来存储文件。在此示例中,将创建一个检测动物的神经网络,因此创建以下目录:~/nn/animals/。
2. 复制您想用作模板的 Darknet 配置文件之一。例如,请参阅 cfg/yolov4-tiny.cfg。将其放置在您创建的文件夹中。在此示例中,我们现在有 ~/nn/animals/animals.cfg。
3. 在您放置配置文件的同一文件夹中创建一个 animals.names 文本文件。在此示例中,我们现在有 ~/nn/animals/animals.names。
4. 使用文本编辑器编辑 animals.names 文件。列出您要使用的类别。您需要在每行中精确地包含 1 个条目,没有空行,没有注释。在此示例中,.names 文件将精确地包含 4 行:
`
dog
cat
bird
horse
`
5. 在同一个文件夹中创建一个 animals.data 文本文件。在此示例中,.data 文件将包含:
`
classes=4
train=/home/username/nn/animals/animals_train.txt
valid=/home/username/nn/animals/animals_valid.txt
names=/home/username/nn/animals/animals.names
backup=/home/username/nn/animals
`
6. 创建一个文件夹来存储您的图像和注释。例如,这可以是 ~/nn/animals/dataset。每个图像都需要一个对应的 .txt 文件来描述该图像的注释。.txt 注释文件的格式非常具体。您不能手动创建这些文件,因为每个注释都需要包含注释的精确坐标。请参阅 DarkMark 或其他类似软件来注释您的图像。YOLO 注释格式在 Darknet/YOLO 常见问题解答中描述。
7. 创建 .data 文件中命名的“train”和“valid”文本文件。这两个文本文件需要分别列出所有 Darknet 必须用于训练和验证的图像,以便在计算 mAP% 时进行验证。每行恰好有一个图像。路径和文件名可以是相对的或绝对的。
8. 使用文本编辑器修改您的 .cfg 文件。
* 确保 batch=64。
* 注意 subdivisions。根据网络尺寸和 GPU 上可用的内存量,您可能需要增加 subdivisions。最佳使用值为 1,因此从该值开始。如果您无法使用 1,请参阅 Darknet/YOLO 常见问题解答。
注意 maxbatches=.... 当开始时,最佳使用值为类别的数量 2000。在此示例中,我们有 4 种动物,因此 4 * 2000 = 8000。这意味着我们将使用 maxbatches=8000。
* 注意 steps=.... 这应该设置为 maxbatches 的 80% 和 90%。在此示例中,我们将使用 steps=6400,7200,因为 maxbatches 设置为 8000。
* 注意 width=... 和 height=.... 这些是网络尺寸。Darknet/YOLO 常见问题解答解释了如何计算最佳使用尺寸。
* 搜索所有包含行 classes=... 的实例并使用 .names 文件中的类别数量进行修改。在此示例中,我们将使用 classes=4。
在每个 [yolo] 部分之前的 [convolutional] 部分中,搜索所有包含行 filters=... 的实例。要使用的值为 (类别数量 + 5) 3。这意味着在此示例中,(4 + 5) * 3 = 27。因此,我们将对适当的行使用 filters=27。
9. 开始训练!运行以下命令:
`bash
cd ~/nn/animals/
darknet detector -map -dont_show train animals.data animals.cfg
`
请耐心等待。最佳权重将保存为 animals_best.weights。可以通过查看 chart.png 文件来观察训练的进度。请参阅 Darknet/YOLO 常见问题解答,了解您可能想在训练新网络时使用的其他参数。
如果您想在训练期间查看更多详细信息,请添加 --verbose 参数。例如:
`bash
darknet detector -map -dont_show --verbose train animals.data animals.cfg
`
其他工具和链接
要管理您的 Darknet/YOLO 项目、注释图像、验证您的注释以及生成使用 Darknet 进行训练的必要文件,请参阅 DarkMark。
对于 Darknet 的强大替代 CLI,要使用图像平铺、在您的视频中进行目标跟踪或用于强大的 C++ API,该 API 可以轻松地在商业应用程序中使用,请参阅 DarkHelp。
查看 Darknet/YOLO 常见问题解答是否可以帮助解答您的问题。
查看 Stéphane 的 YouTube 频道上的许多教程和示例视频
如果您有任何支持问题或想与其他 Darknet/YOLO 用户聊天,请加入 Darknet/YOLO Discord 服务器。
路线图
最后更新时间:2024-10-30
已完成
1. 将训练期间使用的 qsort() 替换为 std::sort()(一些其他的奇怪的仍然存在)
2. 摆脱 check_mistakes、getchar() 和 system()
3. 将 Darknet 转换为使用 C++ 编译器(Linux 上的 g++,Windows 上的 VisualStudio)
4. 修复 Windows 构建
5. 修复 Python 支持
6. 构建 darknet 库
7. 重新启用预测中的标签("alphabet" 代码)
8. 重新启用 CUDA/GPU 代码
9. 重新启用 CUDNN
10. 重新启用 CUDNN half
11. 不要硬编码 CUDA 架构
12. 更好的 CUDA 版本信息
13. 重新启用 AVX
14. 删除旧的解决方案和 Makefile
15. 使 OpenCV 成为非可选的
16. 删除对旧的 pthread 库的依赖
17. 删除 STB
18. 重新编写 CMakeLists.txt 以使用新的 CUDA 检测
19. 删除旧的“alphabet”代码,并删除 data/labels 中的 700 多张图像
20. 构建源外
21. 有更好的版本号输出
22. 与训练相关的性能优化(正在进行的任务)
23. 与推理相关的性能优化(正在进行的任务)
24. 尽可能地使用引用传递
25. 清理 .hpp 文件
26. 重新编写 darknet.h
27. 不要将 cv::Mat 转换为 void*,而是将其用作适当的 C++ 对象
28. 修复或使内部图像结构的用法保持一致
29. 修复针对基于 ARM 的 Jetson 设备的构建
* 原始的 Jetson 设备不太可能得到修复,因为它们不再受 NVIDIA 支持(没有 C++17 编译器)
* 新的 Jetson Orin 设备正在工作
30. 修复 V3 中的 Python API
* 需要更好的 Python 支持(是否有任何 Python 开发人员想帮助解决这个问题?)
短期目标
1. 将 printf() 替换为 std::cout(正在进行)
2. 查看旧的 zed 摄像头支持
3. 更好、更一致的命令行解析(正在进行)
中期目标
1. 删除所有 char* 代码并用 std::string 替换
2. 不要隐藏警告并清理编译器警告(正在进行)
3. 更好地使用 cv::Mat 而不是 C 中的自定义图像结构(正在进行)
4. 用 std::vector 或 std::list 替换旧的列表功能
5. 修复对 1 通道灰度图像的支持
6. 添加对 N 通道图像的支持,其中 N > 3(例如,具有附加深度或热通道的图像)
7. 正在进行的代码清理(正在进行)
长期目标
1. 修复所有 GPU 上的 CUDA/CUDNN 问题
2. 重新编写 CUDA+cuDNN 代码
3. 考虑添加对非 NVIDIA GPU 的支持
4. 旋转的边界框,或某种“角度”支持
5. 关键点/骨架
6. 热图(正在进行)
7. 分割