Простой скрипт Python для загрузки презентации с Pitch.com в виде PDF-файла с возможностью поиска. Раньше была поддержка Canva, но теперь она заблокирована из-за обнаружения ботов.
Установите требования и запустите скрипт через:
URL-адрес python main.py [-r разрешение] [--skip-ocr]
Допустимые разрешения: HD, 4K и 8K. Разрешение по умолчанию — 4K.
Базовая функциональность требует Selenium + Chromedriver, Pillow и tqdm. Если вам нужно распознавание текста, вам также необходимо установить ocrmypdf и его зависимости. Если вы предпочитаете этого не делать, запустите сценарий с флагом --skip-ocr.