find duplicates
1.0.0
find-duplicates
find-duplicates
根據檔案內容的 xxHashes 快速尋找重複檔案。
$ go install github.com/twpayne/find-duplicates@latest
$ find-duplicates
{
"cdb8979062cbdf9c169563ccc54704f0": [
".git/refs/remotes/origin/main",
".git/refs/heads/main",
".git/ORIG_HEAD"
]
}
find-duplicates [options] [paths...]
paths
是遞歸遍歷的目錄。如果沒有給予paths
,則遍歷目前目錄。
輸出是一個 JSON 對象,其中包含每個觀察到的 xxHash 的屬性以及包含該 xxHash 內容的檔案名稱值數組。
選項有:
--keep-going
或-k
出現錯誤後繼續前進。
--output=<file>
或-o <file>
將輸出寫入<file>
,預設為 stdout。
--threshold=<int>
或-t <int>
設定被視為重複的具有相同內容的檔案的最小數量。預設值為 2。
--statistics
或-s
將統計資訊列印到 stderr。
find-duplicates
如何運作? find-duplicates
目標是盡可能快地完成盡可能少的工作,有效地使用每個 CPU 核心,並使用電腦上的所有 CPU 核心。
它由多個組件組成:
所有組件同時運作。
麻省理工學院