find-duplicates
find-duplicates
быстро находит дубликаты файлов на основе xxHash-кодов их содержимого.
$ go install github.com/twpayne/find-duplicates@latest
$ find-duplicates
{
"cdb8979062cbdf9c169563ccc54704f0": [
".git/refs/remotes/origin/main",
".git/refs/heads/main",
".git/ORIG_HEAD"
]
}
find-duplicates [options] [paths...]
paths
— это каталоги для рекурсивного обхода. Если paths
не указаны, то выполняется обход текущего каталога.
Выходные данные представляют собой объект JSON со свойствами для каждого наблюдаемого xxHash и массивами значений имен файлов с содержимым с этим xxHash.
Варианты:
--keep-going
или -k
продолжать работу после ошибок.
--output=<file>
или -o <file>
записать вывод в <file>
, по умолчанию — стандартный вывод.
--threshold=<int>
или -t <int>
устанавливает минимальное количество файлов с одинаковым содержимым, которые будут считаться дубликатами. Значение по умолчанию — 2.
--statistics
или -s
выводит статистику в stderr.
find-duplicates
? Цель find-duplicates
— работать как можно быстрее, выполняя как можно меньше работы, эффективно используя каждое ядро ЦП и все ядра ЦП на вашем компьютере.
Он состоит из нескольких компонентов:
Все компоненты работают одновременно.
Массачусетский технологический институт