find-duplicates
find-duplicates
encontra arquivos duplicados rapidamente com base nos xxHashes de seu conteúdo.
$ go install github.com/twpayne/find-duplicates@latest
$ find-duplicates
{
"cdb8979062cbdf9c169563ccc54704f0": [
".git/refs/remotes/origin/main",
".git/refs/heads/main",
".git/ORIG_HEAD"
]
}
find-duplicates [options] [paths...]
paths
são diretórios para percorrer recursivamente. Se nenhum paths
for fornecido, o diretório atual será percorrido.
A saída é um objeto JSON com propriedades para cada xxHash observado e matrizes de valores de nomes de arquivos com conteúdo desse xxHash.
As opções são:
--keep-going
ou -k
continua após erros.
--output=<file>
ou -o <file>
grava a saída em <file>
, o padrão é stdout.
--threshold=<int>
ou -t <int>
define o número mínimo de arquivos com o mesmo conteúdo para serem considerados duplicados. O padrão é 2.
--statistics
ou -s
imprime estatísticas em stderr.
find-duplicates
? find-duplicates
pretende ser o mais rápido possível, realizando o mínimo de trabalho possível, usando cada núcleo da CPU de forma eficiente e usando todos os núcleos da CPU em sua máquina.
Consiste em vários componentes:
Todos os componentes são executados simultaneamente.
MIT