unduhan duplicut - pengunduhan kode sumber duplicut

duplicut

kode sumber C#

v2.2 release

Unduh

Duplikat ✂️

Hapus daftar kata dalam jumlah besar dengan cepat, tanpa mengubah urutannya

_{Dibuat oleh nil0x42 dan kontributor}

Ringkasan

Saat ini, pembuatan daftar kata kata sandi biasanya berarti menggabungkan beberapa sumber data.

Idealnya, sebagian besar kemungkinan kata sandi harus berada di awal daftar kata, sehingga sebagian besar kata sandi umum dapat dipecahkan secara instan.

Dengan alat dedupe yang ada, Anda dipaksa untuk memilih apakah Anda lebih suka mempertahankan urutan ATAU menangani daftar kata yang sangat besar .

Sayangnya, pembuatan daftar kata memerlukan keduanya :

Jadi saya menulis duplikat dalam C yang sangat dioptimalkan untuk memenuhi kebutuhan yang sangat spesifik ini?

Mulai cepat

git clone https://github.com/nil0x42/duplicut
cd duplicut/ && make
./duplicut wordlist.txt -o clean-wordlist.txt

? Pilihan

Fitur :
- Tangani daftar kata yang sangat besar, bahkan yang ukurannya melebihi RAM yang tersedia
- Filter garis berdasarkan panjang maksimal (opsi -l )
- Dapat menghapus baris yang berisi karakter ASCII yang tidak dapat dicetak (opsi -p )
- Tekan tombol apa saja untuk menampilkan status program saat runtime.
Implementasi :
- Ditulis dalam kode C murni, dirancang agar cepat
- Item hashmap terkompresi pada platform 64 bit
- Dukungan multithread
Keterbatasan :
- Baris apa pun yang lebih panjang dari 255 karakter akan diabaikan

Detail Teknis

? 1- Memori dioptimalkan:

Sebuah uint64 cukup untuk mengindeks baris dalam hashmap, dengan mengemas informasi size dalam bit tambahan pointer:

? 2- Penanganan file besar-besaran:

Jika seluruh file tidak dapat ditampung dalam memori, maka file tersebut akan dipecah menjadi beberapa bagian virtual, sedemikian rupa sehingga setiap bagian menggunakan RAM sebanyak mungkin.

Setiap potongan kemudian dimuat ke dalam hashmap, dideduplikasi, dan diuji terhadap potongan berikutnya.

Dengan begitu, waktu eksekusi dikurangi menjadi paling banyak bilangan segitiga :

Pemecahan masalah

Jika Anda menemukan bug, atau sesuatu tidak berfungsi seperti yang diharapkan, harap kompilasi duplikat dalam mode debug dan posting masalah dengan keluaran terlampir:

 # debug level can be from 1 to 4
make debug level=1
./duplicut [OPTIONS] 2>&1 | tee /tmp/duplicut-debug.log

Memperluas

Informasi Tambahan

Versi v2.2 release
Tipe kode sumber C#
Waktu Pembaruan 2024-12-13
ukuran 374.69KB
Berasal dari Github

Aplikasi Terkait

traildb

2024-12-13
opensurge

2024-12-13
mdns

2024-12-13
C# sistem manajemen rumah sakit

2009-05-24
RetrOS 32

2024-12-13
libmem

2024-12-13

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
traildb

kode sumber C#

1.0.0
opensurge

kode sumber C#

Open Surge 0.6.1.2
mdns

kode sumber C#

1.4.3
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua