Darknet Object Detection Framework and YOLO
Darknet 是一个由 C、C++ 和 CUDA 编写的开源神经网络框架。YOLO(You Only Look Once)是一个最先进的实时目标检测系统,它运行在 Darknet 框架中。
阅读 Hank.ai 如何帮助 Darknet/YOLO 社区
宣布 Darknet V3 "Jazz"
查看 Darknet/YOLO 网站
请阅读 Darknet/YOLO 常见问题解答
加入 Darknet/YOLO Discord 服务器
Papers
1. Paper YOLOv7
2. Paper Scaled-YOLOv4
3. Paper YOLOv4
4. Paper YOLOv3
General Information
Darknet/YOLO 框架仍然比其他框架和 YOLO 版本更快、更准确。
这个框架完全免费且开源。您可以将 Darknet/YOLO 集成到现有项目和产品中 - 包括商业产品 - 无需许可或支付费用。
2024 年 10 月发布的 Darknet V3(“Jazz”)可以使用 NVIDIA RTX 3090 GPU 以高达 1000 FPS 的速度准确运行 LEGO 数据集视频,这意味着每个视频帧在 1 毫秒或更短的时间内被 Darknet/YOLO 读取、调整大小和处理。
如果您需要帮助或想讨论 Darknet/YOLO,请加入 Darknet/YOLO Discord 服务器:https://discord.gg/zSq8rtW
Darknet/YOLO 的 CPU 版本可以在 Raspberry Pi、云和协作服务器、台式机、笔记本电脑和高端训练设备等简单设备上运行。Darknet/YOLO 的 GPU 版本需要来自 NVIDIA 的 CUDA 兼容 GPU。
Darknet/YOLO 已知在 Linux、Windows 和 Mac 上运行良好。请参阅下面的构建说明。
Darknet 版本
Joseph Redmon 在 2013-2017 年编写的原始 Darknet 工具没有版本号。我们认为这个版本是 0.x。
Alexey Bochkovskiy 在 2017-2021 年间维护的下一个流行的 Darknet 仓库也没有版本号。我们认为这个版本是 1.x。
由 Hank.ai 赞助并由 Stéphane Charette 从 2023 年开始维护的 Darknet 仓库是第一个具有版本命令的仓库。从 2023 年到 2024 年底,它返回版本 2.x “OAK”。
目标是尝试尽可能少地破坏现有功能,同时熟悉代码库。
1. 重写构建步骤,以便我们有一个统一的方式使用 CMake 在 Windows 和 Linux 上构建。
2. 将代码库转换为使用 C++ 编译器。
3. 增强了训练时的 chart.png。
4. 错误修复和与性能相关的优化,主要与减少训练网络所需的时间有关。
该代码库的最后一个分支是 v2 分支中的版本 2.1。
下一阶段的开发始于 2024 年年中,并于 2024 年 10 月发布。版本命令现在返回 3.x “JAZZ”。
如果您需要运行以下命令,可以随时签出以前的 v2 分支。请告知我们,以便我们可以调查添加任何缺失的命令。
1. 删除了许多旧的和未维护的命令。
2. 许多性能优化,包括训练和推理过程。
3. 传统的 C API 已修改;使用原始 Darknet API 的应用程序将需要进行少量修改:https://darknetcv.ai/api/api.html
4. 新的 Darknet V3 C 和 C++ API:https://darknetcv.ai/api/api.html
5. src-examples 中的新应用程序和示例代码:https://darknetcv.ai/api/files.html
MSCOCO 预训练权重
为了方便起见,YOLO 的几个流行版本在 MSCOCO 数据集上进行了预训练。此数据集有 80 个类别,可以在文本文件 cfg/coco.names 中看到。
还有其他几个更简单的数据集和预训练权重可用于测试 Darknet/YOLO,例如 LEGO Gears 和 Rolodex。有关详细信息,请参阅 Darknet/YOLO 常见问题解答。
MSCOCO 预训练权重可以从多个不同位置下载,也可以从此仓库下载:
1. YOLOv2,2016 年 11 月
- YOLOv2-tiny
- YOLOv2-full
2. YOLOv3,2018 年 5 月
- YOLOv3-tiny
- YOLOv3-full
3. YOLOv4,2020 年 5 月
- YOLOv4-tiny
- YOLOv4-full
4. YOLOv7,2022 年 8 月
- YOLOv7-tiny
- YOLOv7-full
MSCOCO 预训练权重仅用于演示目的。MSCOCO 的相应 .cfg 和 .names 文件位于 cfg 目录中。示例命令:
`bash
wget --no-clobber https://github.com/hank-ai/darknet/releases/download/v2.0/yolov4-tiny.weights darknet02displayannotatedimages coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg darknet03display_videos coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights image1.jpg DarkHelp coco.names yolov4-tiny.cfg yolov4-tiny.weights video1.avi
`
请注意,人们应该训练自己的网络。MSCOCO 通常用于确认一切正常。
构建
过去(2023 年之前)的各种构建方法已合并到一个统一的解决方案中。Darknet 需要 C++17 或更高版本、OpenCV 以及使用 CMake 生成必要的项目文件。
您不需要了解 C++ 就可以构建、安装或运行 Darknet/YOLO,就像您不需要是机械师就可以驾驶汽车一样。
Google Colab
Google Colab 说明与 Linux 说明相同。有几个 Jupyter 笔记本显示了如何执行某些任务,例如训练新网络。
请参阅 colab 子目录中的笔记本,或遵循下面的 Linux 说明。
Linux CMake 方法
Darknet 构建教程 for Linux
可选:如果您拥有现代 NVIDIA GPU,您可以在此时安装 CUDA 或 CUDA+cuDNN。如果安装了,Darknet 将使用您的 GPU 来加速图像(和视频)处理。
您必须删除 Darknet 构建目录中的 CMakeCache.txt 文件,以强制 CMake 重新查找所有必要的文件。
请记住重新构建 Darknet。
Darknet 可以在没有它的情况下运行,但如果您想训练自定义网络,则需要 CUDA 或 CUDA+cuDNN。
访问 https://developer.nvidia.com/cuda-downloads 下载并安装 CUDA。
访问 https://developer.nvidia.com/rdp/cudnn-download 或 https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#cudnn-package-manager-installation-overview 下载并安装 cuDNN。
安装 CUDA 后,确保可以运行 nvcc 和 nvidia-smi。您可能需要修改 PATH 变量。
如果您在稍后安装 CUDA 或 CUDA+cuDNN,或者您升级到 NVIDIA 软件的更新版本,请执行以下操作:
这些说明假设(但不要求!)运行 Ubuntu 22.04 的系统。如果使用其他发行版,请根据需要进行调整。
`bash
sudo apt-get install build-essential git libopencv-dev cmake mkdir ~/srccd ~/src git clone https://github.com/hank-ai/darknetcd darknet mkdir buildcd build cmake -DCMAKEBUILDTYPE=Release .. make -j4 package sudo dpkg -i darknet-VERSION.deb
`
如果您使用的是旧版本的 CMake,则需要在运行上面的 cmake 命令之前升级 CMake。在 Ubuntu 上升级 CMake 可以使用以下命令完成:
`bash
sudo apt-get purge cmake sudo snap install cmake --classic
`
如果使用 bash 作为您的命令 shell,您需要在此时重新启动 shell。如果使用 fish,它应该立即拾取新的路径。
高级用户:
如果您想构建 RPM 安装文件而不是 DEB 文件,请参阅 CM_package.cmake 中的相关行。在运行 make -j4 package 之前,您需要编辑这两行:
`bash
SET (CPACKGENERATOR "DEB")# SET (CPACKGENERATOR "RPM")
`
对于 Centos 和 OpenSUSE 等发行版,您需要将 CM_package.cmake 中这两行更改为:
`bash
SET (CPACKGENERATOR "DEB")SET (CPACKGENERATOR "RPM")
`
要安装安装包,一旦它构建完成,请使用您发行版的常用包管理器。例如,在基于 Debian 的系统(如 Ubuntu)上:
`bash
sudo dpkg -i darknet-2.0.1-Linux.deb
`
安装 .deb 包将复制以下文件:
1. /usr/bin/darknet 是通常的 Darknet 可执行文件。从 CLI 运行 darknet version 以确认它已正确安装。
2. /usr/include/darknet.h 是针对 C、C++ 和 Python 开发人员的 Darknet API。
3. /usr/include/darknet_version.h 包含供开发人员使用的版本信息。
4. /usr/lib/libdarknet.so 是针对 C、C++ 和 Python 开发人员的库。
5. /opt/darknet/cfg/... 是所有 .cfg 模板存储的位置。
您现在完成了!Darknet 已构建并安装到 /usr/bin/ 中。运行以下命令进行测试:darknet version。
如果您没有 /usr/bin/darknet,则表示您没有安装它,您只是构建了它!确保按照上面的说明安装 .deb 或 .rpm 文件。
Windows CMake 方法
这些说明假设 Windows 11 22H2 的全新安装。
打开一个正常的 cmd.exe 命令提示符窗口并运行以下命令:
`bash
winget install Git.Git winget install Kitware.CMake winget install nsis.nsis winget install Microsoft.VisualStudio.2022.Community
`
此时,我们需要修改 Visual Studio 安装以包括对 C++ 应用程序的支持:
1. 点击“Windows 开始”菜单并运行“Visual Studio 安装程序”。
2. 点击修改。
3. 选择使用 C++ 的桌面开发。
4. 点击右下角的“修改”,然后点击“是”。
一旦所有内容都下载并安装完毕,再次点击“Windows 开始”菜单并选择用于 VS 2022 的开发人员命令提示符。不要使用 PowerShell 执行这些步骤,您会遇到问题!
高级用户:
您可以使用正常的命令提示符,而不是运行开发人员命令提示符,或者使用 ssh 登录到设备并手动运行“Program FilesMicrosoft Visual Studio2022CommunityCommon7ToolsVsDevCmd.bat”。
一旦您按照上面描述的方式运行了开发人员命令提示符(不是 PowerShell!),运行以下命令来安装 Microsoft VCPKG,然后使用它来构建 OpenCV:
`bash
cd c:mkdir c:srccd c:src git clone https://github.com/microsoft/vcpkgcd vcpkg bootstrap-vcpkg.bat .vcpkg.exe integrate install .vcpkg.exe integrate powershell.vcpkg.exe install opencv[contrib,dnn,freetype,jpeg,openmp,png,webp,world]:x64-windows
`
最后一步要耐心,因为它可能需要很长时间才能运行。它需要下载和构建许多东西。
高级用户:
请注意,在构建 OpenCV 时,您可能希望添加许多其他可选模块。运行 .vcpkg.exe search opencv 以查看完整列表。
可选:如果您拥有现代 NVIDIA GPU,您可以在此时安装 CUDA 或 CUDA+cuDNN。如果安装了,Darknet 将使用您的 GPU 来加速图像(和视频)处理。
您必须删除 Darknet 构建目录中的 CMakeCache.txt 文件,以强制 CMake 重新查找所有必要的文件。
请记住重新构建 Darknet。
Darknet 可以在没有它的情况下运行,但如果您想训练自定义网络,则需要 CUDA 或 CUDA+cuDNN。
访问 https://developer.nvidia.com/cuda-downloads 下载并安装 CUDA。
访问 https://developer.nvidia.com/rdp/cudnn-download 或 https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#download-windows 下载并安装 cuDNN。
安装 CUDA 后,确保可以运行 nvcc.exe 和 nvidia-smi.exe。您可能需要修改 PATH 变量。
下载 cuDNN 后,解压缩并将 bin、include 和 lib 目录复制到 C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/[版本]/. 您可能需要覆盖一些文件。
如果您在稍后安装 CUDA 或 CUDA+cuDNN,或者您升级到 NVIDIA 软件的更新版本,请执行以下操作:
CUDA 必须在 Visual Studio 之后安装。如果您升级 Visual Studio,请记住重新安装 CUDA。
一旦所有前面的步骤都成功完成,您需要克隆 Darknet 并构建它。在此步骤中,我们还需要告诉 CMake vcpkg 的位置,以便它可以找到 OpenCV 和其他依赖项:
`bash
cd c:src git clone https://github.com/hank-ai/darknet.gitcd darknetmkdir buildcd build cmake -DCMAKEBUILDTYPE=Release -DCMAKETOOLCHAINFILE=C:/src/vcpkg/scripts/buildsystems/vcpkg.cmake .. msbuild.exe /property:Platform=x64;Configuration=Release /target:Build -maxCpuCount -verbosity:normal -detailedSummary darknet.sln msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
如果您收到有关某些缺失的 CUDA 或 cuDNN DLL(如 cublas64_12.dll)的错误,请手动将 CUDA .dll 文件复制到与 Darknet.exe 相同的输出目录中。例如:
`bash
copy "C:Program FilesNVIDIA GPU Computing ToolkitCUDAv12.2bin*.dll" src-cliRelease
`
(这是一个示例!请检查以确保您运行的是哪个版本,并运行适合您所安装内容的命令。)
复制文件后,重新运行最后一个 msbuild.exe 命令以生成 NSIS 安装包:
`bash
msbuild.exe /property:Platform=x64;Configuration=Release PACKAGE.vcxproj
`
高级用户:
请注意,cmake 命令的输出是一个正常的 Visual Studio 解决方案文件,Darknet.sln。如果您是经常使用 Visual Studio GUI 而不是 msbuild.exe 来构建项目的软件开发人员,您可以忽略命令行并在 Visual Studio 中加载 Darknet 项目。
您现在应该拥有以下可以运行的文件:C:srcDarknetbuildsrc-cliReleasedarknet.exe。运行以下命令进行测试:C:srcDarknetbuildsrc-cliReleasedarknet.exe version。
要正确安装 Darknet、库、包含文件和必要的 DLL,请运行在最后一步构建的 NSIS 安装向导。查看 build 目录中的文件 darknet-VERSION.exe。例如:
`bash
darknet-2.0.31-win64.exe
`
安装 NSIS 安装包将:
1. 创建一个名为 Darknet 的目录,例如 C:Program FilesDarknet。
2. 安装 CLI 应用程序、darknet.exe 和其他示例应用程序。
3. 安装所需的第三方 .dll 文件,例如来自 OpenCV 的文件。
4. 安装必要的 Darknet .dll、.lib 和 .h 文件,以便从另一个应用程序使用 darknet.dll。
5. 安装模板 .cfg 文件。
您现在完成了!安装向导完成后,Darknet 将安装到 C:Program FilesDarknet 中。运行以下命令进行测试:C:Program FilesDarknetbindarknet.exe version。
如果您没有 C:/Program Files/darknet/bin/darknet.exe,则表示您没有安装它,您只是构建了它!确保按照前面步骤中的说明完成 NSIS 安装向导的每个面板。
使用 Darknet
CLI
以下不是 Darknet 支持的所有命令的完整列表。
除了 Darknet CLI 之外,请注意 DarkHelp 项目 CLI,它提供了一个替代 Darknet/YOLO 的 CLI。DarkHelp CLI 还具有几个在 Darknet 中不可直接获得的高级功能。您可以将 Darknet CLI 和 DarkHelp CLI 结合使用,它们并不相互排斥。
对于下面显示的大多数命令,您需要具有相应 .names 和 .cfg 文件的 .weights 文件。您可以 either 训练自己的网络(强烈推荐!)或者从互联网上下载他人已经训练并免费提供的 neural network。预训练数据集的示例包括:
1. LEGO Gears(在图像中查找物体)
2. Rolodex(在图像中查找文本)
3. MSCOCO(标准 80 类目标检测)
要运行的命令包括:
列出一些可能运行的命令和选项:
`bash
darknet help
`
检查版本:
`bash
darknet version
`
使用图像进行预测:
V2:
`bash
darknet detector test cars.data cars.cfg cars_best.weights image1.jpg
`
V3:
`bash
darknet02displayannotatedimages cars.cfg image1.jpg
`
DarkHelp:
`bash
DarkHelp cars.cfg cars.cfg cars_best.weights image1.jpg
`
输出坐标:
V2:
`bash
darknet detector test animals.data animals.cfg animalsbest.weights -extoutput dog.jpg
`
V3:
`bash
darknet01inference_images animals dog.jpg
`
DarkHelp:
`bash
DarkHelp --json animals.cfg animals.names animals_best.weights dog.jpg
`
使用视频:
V2:
`bash
darknet detector demo animals.data animals.cfg animalsbest.weights -extoutput test.mp4
`
V3:
`bash
darknet03display_videos animals.cfg test.mp4
`
DarkHelp:
`bash
DarkHelp animals.cfg animals.names animals_best.weights test.mp4
`
从网络摄像头读取:
V2:
`bash
darknet detector demo animals.data animals.cfg animals_best.weights -c 0
`
V3:
`bash
darknet08display_webcam animals
`
将结果保存到视频中:
V2:
`bash
darknet detector demo animals.data animals.cfg animalsbest.weights test.mp4 -outfilename res.avi
`
V3:
`bash
darknet05processvideosmultithreaded animals.cfg animals.names animals_best.weights test.mp4
`
DarkHelp:
`bash
DarkHelp animals.cfg animals.names animals_best.weights test.mp4
`
JSON:
V2:
`bash
darknet detector demo animals.data animals.cfg animalsbest.weights test50.mp4 -jsonport 8070 -mjpegport 8090 -extoutput
`
V3:
`bash
darknet06imagestojson animals image1.jpg
`
DarkHelp:
`bash
DarkHelp --json animals.names animals.cfg animals_best.weights image1.jpg
`
在特定 GPU 上运行:
V2:
`bash
darknet detector demo animals.data animals.cfg animals_best.weights -i 1 test.mp4
`
要检查神经网络的准确性:
`bash
darknet detector map driving.data driving.cfg driving_best.weights ... Id Name AvgPrecision TP FN FP TN Accuracy ErrorRate Precision Recall Specificity FalsePosRate -- ---- ------------ ------ ------ ------ ------ -------- --------- --------- ------ ----------- ------------ 0 vehicle 91.2495 32648 3903 5826 65129 0.9095 0.0905 0.8486 0.8932 0.9179 0.0821 1 motorcycle 80.4499 2936 513 569 5393 0.8850 0.1150 0.8377 0.8513 0.9046 0.0954 2 bicycle 89.0912 570 124 104 3548 0.9475 0.0525 0.8457 0.8213 0.9715 0.0285 3 person 76.7937 7072 1727 2574 27523 0.8894 0.1106 0.7332 0.8037 0.9145 0.0855 4 many vehicles 64.3089 1068 509 733 11288 0.9087 0.0913 0.5930 0.6772 0.9390 0.0610 5 green light 86.8118 1969 239 510 4116 0.8904 0.1096 0.7943 0.8918 0.8898 0.1102 6 yellow light 82.0390 126 38 30 1239 0.9525 0.0475 0.8077 0.7683 0.9764 0.0236 7 red light 94.1033 3449 217 451 4643 0.9237 0.0763 0.8844 0.9408 0.9115 0.0885
`
要检查 mAP@IoU=75 的准确性:
`bash
darknet detector map animals.data animals.cfg animalsbest.weights -iouthresh 0.75
`
重新计算锚点最好在 DarkMark 中完成,因为它将连续运行 100 次并从所有计算的锚点中选择最佳锚点。但如果您想在 Darknet 中运行旧版本,请执行以下操作:
`bash
darknet detector calcanchors animals.data -numof_clusters 6 -width 320 -height 256
`
训练新网络:
`bash
darknet detector -map -dont_show train animals.data animals.cfg (also see the training section below)
`
训练
到 Darknet/YOLO 常见问题解答的相关部分的快速链接:
1. 我应该如何设置我的文件和目录?
2. 我应该使用哪个配置文件?
3. 训练自己的网络时应该使用哪个命令?
使用 DarkMark 创建所有必要的 Darknet 文件是注释和训练最简单的方法。这绝对是训练新神经网络的推荐方法。
如果您想手动设置各种文件以训练自定义网络,请执行以下操作:
1. 创建一个新文件夹来存储这些文件。对于这个例子,将创建一个神经网络来检测动物,因此将创建以下目录:~/nn/animals/.
2. 复制您想用作模板的 Darknet 配置文件之一。例如,请参阅 cfg/yolov4-tiny.cfg。将它放在您创建的文件夹中。对于这个例子,我们现在有 ~/nn/animals/animals.cfg。
3. 在您放置配置文件的同一个文件夹中创建一个 animals.names 文本文件。对于这个例子,我们现在有 ~/nn/animals/animals.names。
4. 使用您的文本编辑器编辑 animals.names 文件。列出您想要使用的类别。您需要为每行正好有一个条目,没有空行,也没有注释。对于这个例子,.names 文件将包含正好 4 行:
`
dog
cat
bird
horse
`
5. 在同一个文件夹中创建一个 animals.data 文本文件。对于这个例子,.data 文件将包含:
`
classes = 4
train = /home/username/nn/animals/animals_train.txt
valid = /home/username/nn/animals/animals_valid.txt
names = /home/username/nn/animals/animals.names
backup = /home/username/nn/animals
`
6. 创建一个文件夹来存储您的图像和注释。例如,这可以是 ~/nn/animals/dataset。每个图像都需要一个相应的 .txt 文件来描述该图像的注释。.txt 注释文件的格式非常具体。您不能手动创建这些文件,因为每个注释都需要包含注释的确切坐标。请参阅 DarkMark 或其他类似软件来注释您的图像。YOLO 注释格式在 Darknet/YOLO 常见问题解答中有所描述。
7. 创建 .data 文件中命名的“train”和“valid”文本文件。这两个文本文件需要分别列出 Darknet 必须用来训练和验证的 mAP% 时使用的所有图像。每行正好一张图像。路径和文件名可以是相对的或绝对的。
8. 使用文本编辑器修改您的 .cfg 文件。
- 确保 batch=64。
- 注意 subdivisions。根据网络尺寸和 GPU 上可用的内存量,您可能需要增加 subdivisions。最佳值是 1,因此从它开始。如果 1 对您不起作用,请参阅 Darknet/YOLO 常见问题解答。
- 注意 maxbatches=.... 当开始时,一个好的值是类别的数量 2000。对于这个例子,我们有 4 个动物,因此 4 2000 = 8000。这意味着我们将使用 maxbatches=8000。
- 注意 steps=.... 这应该设置为 maxbatches 的 80% 和 90%。对于这个例子,我们将使用 steps=6400,7200,因为 maxbatches 被设置为 8000。
- 注意 width=... 和 height=.... 这些是网络尺寸。Darknet/YOLO 常见问题解答解释了如何计算要使用的最佳尺寸。
- 在 [convolutional] 部分之前的每个 [yolo] 部分中,搜索所有 filters=... 行的实例。要使用的值是(类别数量 + 5) 3。这意味着对于这个例子,(4 + 5) 3 = 27。因此,我们在适当的行上使用 filters=27。
9. 开始训练!运行以下命令:
`bash
cd ~/nn/animals/
darknet detector -map -dont_show train animals.data animals.cfg
`
耐心点。最佳权重将保存为 animals_best.weights。可以通过查看 chart.png 文件来观察训练进度。有关您可能希望在训练新网络时使用的其他参数,请参阅 Darknet/YOLO 常见问题解答。
- 如果您想在训练期间看到更多详细信息,请添加 --verbose 参数。例如:
`bash
darknet detector -map -dont_show --verbose train animals.data animals.cfg
`
其他工具和链接
要管理您的 Darknet/YOLO 项目、注释图像、验证您的注释以及生成使用 Darknet 训练所需的文件,请参阅 DarkMark。
要获得一个强大的 Darknet 替代 CLI,使用图像拼接、视频中的目标跟踪或一个强大的 C++ API,该 API 可以轻松地用于商业应用程序,请参阅 DarkHelp。
查看 Darknet/YOLO 常见问题解答,看看它是否可以帮助回答您的问题。
查看 Stéphane 的 YouTube 频道上的许多教程和示例视频
如果您有支持问题或想与其他 Darknet/YOLO 用户聊天,请加入 Darknet/YOLO Discord 服务器。
路线图
最后更新时间:2024-10-30:
已完成
1. 在训练期间将 qsort() 替换为 std::sort()(一些其他晦涩的代码仍然存在)
2. 删除 check_mistakes、getchar() 和 system()
3. 将 Darknet 转换为使用 C++ 编译器(Linux 上的 g++,Windows 上的 VisualStudio)
4. 修复 Windows 构建
5. 修复 Python 支持
6. 构建 darknet 库
7. 重新启用预测上的标签(“alphabet”代码)
8. 重新启用 CUDA/GPU 代码
9. 重新启用 CUDNN
10. 重新启用 CUDNN half
11. 不要硬编码 CUDA 架构
12. 更好的 CUDA 版本信息
13. 重新启用 AVX
14. 删除旧的解决方案和 Makefile
15. 使 OpenCV 成为非可选的
16. 删除对旧 pthread 库的依赖
17. 删除 STB
18. 重新编写 CMakeLists.txt 以使用新的 CUDA 检测
19. 删除旧的“alphabet”代码,并删除 data/labels 中的 700 多张图像
20. 构建源代码之外
21. 具有更好的版本号输出
22. 与训练相关的性能优化(正在进行的任务)
23. 与推理相关的性能优化(正在进行的任务)
24. 尽可能使用传值引用
25. 清理 .hpp 文件
26. 重新编写 darknet.h
27. 不要将 cv::Mat 转换为 void*,而是将其用作正确的 C++ 对象
28. 修复或保持内部图像结构的使用方式一致
29. 修复针对基于 ARM 的 Jetson 设备的构建
- 原始 Jetson 设备不太可能被修复,因为它们不再受 NVIDIA 支持(没有 C++17 编译器)
- 新的 Jetson Orin 设备正在运行
30. 修复 V3 中的 Python API
31. 需要更好的 Python 支持(任何 Python 开发人员想要帮助吗?)
短期目标
1. 将 printf() 替换为 std::cout(正在进行)
2. 调查旧的 zed 摄像头支持
3. 更好、更一致的命令行解析(正在进行)
中期目标
1. 删除所有 char* 代码,并用 std::string 替换
2. 不要隐藏警告,并清理编译器警告(正在进行)
3. 更好地使用 cv::Mat 而不是 C 中的自定义图像结构(正在进行)
4. 将旧的列表功能替换为 std::vector 或 std::list
5. 修复对 1 通道灰度图像的支持
6. 添加对 N 通道图像的支持,其中 N > 3(例如,具有额外深度或热通道的图像)
7. 正在进行的代码清理(正在进行)
长期目标
1. 修复所有 GPU 的 CUDA/CUDNN 问题
2. 重新编写 CUDA+cuDNN 代码
3. 调查添加对非 NVIDIA GPU 的支持
4. 旋转的边界框,或某种“角度”支持
5. 关键点/骨架
6. 热图(正在进行)
7. 分割