Загрузка duplicut - Загрузка исходного кода duplicut

duplicut

Исходный код С#

v2.2 release

Скачать

Дубликат ✂️

Быстро дедупликация огромных списков слов без изменения порядка

_{Создано nil0x42 и участниками}

Обзор

В настоящее время создание списка слов паролей обычно подразумевает объединение нескольких источников данных.

В идеале наиболее вероятные пароли должны стоять в начале списка слов, чтобы наиболее распространенные пароли были взломаны мгновенно.

С существующими инструментами дедупликации вы вынуждены выбирать, предпочитаете ли вы сохранять порядок ИЛИ обрабатывать огромные списки слов .

К сожалению, для создания списка слов требуются оба :

Итак, я написал duplicut на высокооптимизированном C, чтобы удовлетворить эту очень специфическую потребность?

Быстрый старт

git clone https://github.com/nil0x42/duplicut
cd duplicut/ && make
./duplicut wordlist.txt -o clean-wordlist.txt

? Параметры

Функции :
- Обработка огромных списков слов, даже тех, размер которых превышает доступную оперативную память.
- Фильтровать строки по максимальной длине (опция -l )
- Можно удалить строки, содержащие непечатаемые символы ASCII (опция -p ).
- Нажмите любую клавишу, чтобы отобразить статус программы во время выполнения.
Выполнение :
- Написан на чистом коде C и предназначен для быстрой работы.
- Сжатые элементы хэш-карты на 64-битных платформах
- Поддержка многопоточности
Ограничения :
- Любая строка длиной более 255 символов игнорируется.

Технические детали

? 1- Оптимизирована память:

uint64 достаточно для индексации строк в хэш-карте, упаковывая информацию size в дополнительные биты указателя:

? 2- Массивная обработка файлов:

Если весь файл не помещается в памяти, он разбивается на виртуальные фрагменты таким образом, чтобы каждый фрагмент использовал как можно больше оперативной памяти.

Затем каждый фрагмент загружается в хэш-карту, дедуплицируется и тестируется на последующих фрагментах.

Таким образом, время выполнения уменьшится не более чем до числа треугольников :

Устранение неполадок

Если вы обнаружили ошибку или что-то работает не так, как ожидалось, скомпилируйте дубликат в режиме отладки и опубликуйте сообщение о проблеме с прикрепленным выводом:

 # debug level can be from 1 to 4
make debug level=1
./duplicut [OPTIONS] 2>&1 | tee /tmp/duplicut-debug.log

Расширять

Дополнительная информация

Версия v2.2 release
Тип Исходный код С#
Время обновления 2024-12-13
размер 374.69KB
От Github

Связанные приложения

Система управления питанием

2009-05-24
Система управления больницей C#

2009-05-24
traildb

2024-12-13
opensurge

2024-12-13
mdns

2024-12-13
RetrOS 32

2024-12-13

duplicut

Дубликат ✂️

Быстро дедупликация огромных списков слов без изменения порядка

Обзор

Быстрый старт

? Параметры

Технические детали

? 1- Оптимизирована память:

? 2- Массивная обработка файлов:

Устранение неполадок

Система управления питанием

Система управления больницей C#

traildb

opensurge

mdns

RetrOS 32

chat.petals.dev

GPT Prompt Templates

GPTyped

Система управления питанием

Система управления больницей C#

traildb

waymo open dataset

termwind

wp functions