find duplicates
1.0.0
find-duplicates
find-duplicates
根据文件内容的 xxHashes 快速查找重复文件。
$ go install github.com/twpayne/find-duplicates@latest
$ find-duplicates
{
"cdb8979062cbdf9c169563ccc54704f0": [
".git/refs/remotes/origin/main",
".git/refs/heads/main",
".git/ORIG_HEAD"
]
}
find-duplicates [options] [paths...]
paths
是递归遍历的目录。如果没有给出paths
,则遍历当前目录。
输出是一个 JSON 对象,其中包含每个观察到的 xxHash 的属性以及包含该 xxHash 内容的文件名值数组。
选项有:
--keep-going
或-k
出现错误后继续前进。
--output=<file>
或-o <file>
将输出写入<file>
,默认为 stdout。
--threshold=<int>
或-t <int>
设置被视为重复的具有相同内容的文件的最小数量。默认值为 2。
--statistics
或-s
将统计信息打印到 stderr。
find-duplicates
如何工作? find-duplicates
目标是尽可能快地完成尽可能少的工作,有效地使用每个 CPU 核心,并使用计算机上的所有 CPU 核心。
它由多个组件组成:
所有组件同时运行。
麻省理工学院