[Блог] [Демо на YouTube] [Бумага]
rclip — это инструмент поиска фотографий с командной строкой, основанный на потрясающей нейронной сети CLIP OpenAI.
sudo snap install rclip
pip
)Если ваш дистрибутив Linux не поддерживает Snap, вы можете использовать один из альтернативных вариантов установки:
В Linux x86_64 вы можете установить rclip как автономный исполняемый файл.
Загрузите AppImage из последней версии.
Выполните следующие команды:
chmod +x < downloaded AppImage filename >
sudo mv < downloaded AppImage filename > /usr/local/bin/rclip
pip
pip install --extra-index-url https://download.pytorch.org/whl/cpu rclip
brew install yurijmikhalevich/tap/rclip
pip
) pip install rclip
pip
) pip install rclip
cd photos && rclip " search query "
Когда вы впервые запускаете rclip в определенном каталоге, он извлекает объекты из фотографий, что требует времени. Сколько времени это займет, зависит от вашего процессора и количества изображений, которые вы будете искать. На обработку 73 тысяч фотографий на моем NAS, работающем на стареньком процессоре Intel Celeron J3455, ушло около дня, на индексацию 50 тысяч изображений на моем MacBook с процессором M1 Max ушло 7 минут, а на обработку 1,28 миллиона изображений на моем MacBook с процессором M1 Max ушло около дня. тот же Макбук.
Подробную демонстрацию смотрите в видео: https://www.youtube.com/watch?v=tAJHXOkHidw.
Вы можете использовать другое изображение в качестве запроса, передав путь к файлу или даже URL-адрес файла изображения, и rclip найдет изображения, наиболее похожие на то, которое вы использовали в качестве запроса. Если вы ссылаетесь на локальное изображение по относительному пути, вы должны добавить к нему префикс ./
. Например:
cd photos && rclip ./cat.jpg
# or use URL
cd photos && rclip https://raw.githubusercontent.com/yurijmikhalevich/rclip/main/tests/e2e/images/cat.jpg
Посмотрите это видео, чтобы увидеть демонстрацию поиска по изображениям: https://www.youtube.com/watch?v=1YQZKeCBxWM.
Вы можете добавлять и вычитать изображения и текстовые запросы друг из друга; вот несколько примеров использования:
cd photos && rclip horse + stripes
cd photos && rclip apple - fruit
cd photos && rclip " ./new york city.jpg " + night
cd photos && rclip " 2:golden retriever " + " ./swimming pool.jpg "
cd photos && rclip " ./racing car.jpg " - " 2:sports car " + " 2:snow "
Если вы хотите увидеть, как эти запросы выполняются при выполнении на наборе данных ImageNet-1k из 1,28 миллиона изображений, посмотрите демонстрацию на YouTube: https://www.youtube.com/watch?v=MsTgYdOpgcQ.
Если вы используете iTerm2, Konsole (версия 22.04 и выше), wezterm, Mintty или mlterm, все, что вам нужно сделать, это передать аргумент --preview
(или -p
) в rclip :
rclip -p kitty
Если вы используете любой другой терминал или хотите просмотреть результаты в выбранной вами программе просмотра, вы можете передать ему выходные данные rclip . Например, в Linux команда ниже откроет топ-5 результатов для слова «котенок» в программе просмотра изображений по умолчанию:
rclip -f -t 5 kitty | xargs -d ' n ' -n 1 xdg-open
Параметр -f
или --filepath-only
заставляет rclip печатать только пути к файлам, без оценок или заголовка, что делает его идеальным для использования вместе с настраиваемым средством просмотра, как в примере.
Я предпочитаю использовать режим миниатюр feh для предварительного просмотра нескольких результатов:
rclip -f -t 5 kitty | feh -f - -t
https://github.com/yurijmikhalevich/rclip/discussions/new/choose
Этот репозиторий соответствует стандарту обычных коммитов.
Чтобы запустить rclip локально из исходного кода, у вас должны быть установлены Python и Poetry.
Затем выполните:
# clone the source code repository
git clone [email protected]:yurijmikhalevich/rclip.git
# install dependencies and rclip
cd rclip
poetry install
# activate the new poetry environment
poetry shell
Если среда поэзии активна, вы можете использовать rclip локально, как описано в разделе «Использование» выше.
Спасибо этим замечательным людям и организациям (ключ смайлика):
Рамайер | Кафион ? | Абид Хан |
Спасибо команде Caphyon и Advanced Installer за щедрое предоставление проекту rclip лицензии Professional Advanced Installer для создания установщика Windows.
Этот проект соответствует спецификации всех участников. Вклад любого рода приветствуется!
Массачусетский технологический институт