Используйте возможности искусственного интеллекта с помощью PyScreen, современного инструмента, предназначенного для извлечения, анализа и визуализации соответствующей информации из видеозаписей экрана. PyScreen, основанный на передовых технологиях компьютерного зрения, обработки текста и искусственного интеллекта, преобразует записи вашего экрана в ценную информацию.
Извлечение экрана: плавно извлекает экраны и данные с экранов любого видеофайла.
Размытие экрана : размывает конфиденциальную информацию (например, пароли, номера кредитных карт) на экранах, обеспечивая конфиденциальность и безопасность.
Извлечение текста: извлекает текст с экранов с помощью Tesseract OCR, обеспечивая текстовый анализ.
Генерация облака слов: генерирует динамические облака слов, отражающие наиболее часто используемые слова на ваших экранах, предлагая быстрый обзор контента.
Цветовой анализ: определяет доминирующие цветовые схемы, преобладающие на ваших экранах, предоставляя представление об эстетических и дизайнерских решениях.
Анализ GPT: использует модель GPT-4 OpenAI для создания человеческих текстовых описаний на основе словесных данных, извлеченных с экранов, что улучшает понимание и удобство обнаружения контента.
Клонируем репозиторий:
git clone https://github.com/alexandrevl/pyscreen.git
Перейдите в каталог проекта:
cd pyscreen
Запустите PyScreen в предпочитаемой вами записи экрана:
python main.py --input your_screen_recording.mp4
PyScreen использует следующие библиотеки Python:
gc
для оптимального управления памятьюjson
и pandas
для удобного манипулирования даннымиcv2
(opencv) для комплексной обработки изображений.pytesseract
для функции OCRnltk
для расширенной обработки текстаWordCloud
для создания визуально привлекательных облаков слов.openai
для использования модели GPT-4python-dotenv
для хранения конфиденциальной информацииunidecode
для обработки символов ЮникодаУбедитесь, что эти зависимости установлены перед запуском PyScreen. Вы можете установить их с помощью pip:
pip install opencv-python pytesseract nltk wordcloud openai pandas python-dotenv unidecode
Чтобы использовать функцию ChatGPT, у вас должен быть ключ API OpenAI. Вы можете получить его здесь. Получив ключ API, создайте файл .env
в каталоге проекта и добавьте следующую строку:
OPENAI_API_KEY=your_api_key
Кроме того, в вашей системе необходимо установить Tesseract OCR. Следуйте этому руководству для получения подробных инструкций по установке.
Ваш вклад имеет значение! Не стесняйтесь отправить запрос на включение, чтобы расширить функциональность и удобство использования PyScreen.
PyScreen — это программное обеспечение с открытым исходным кодом, лицензируемое в соответствии с условиями лицензии MIT. Не стесняйтесь делиться, изменять и распространять.