pyscreen
1.0.0
使用 PyScreen 来利用 AI 的力量,这是一种最先进的工具,旨在从屏幕录制视频中提取、分析和可视化相关信息。 PyScreen 基于先进的计算机视觉、文本处理和人工智能技术而构建,可将您的屏幕记录转化为数据丰富的见解。
屏幕提取:从任何给定视频文件的屏幕中无缝提取屏幕和数据。
屏幕模糊:模糊屏幕中的敏感信息(例如密码、信用卡号),确保隐私和安全。
文本提取:使用 Tesseract OCR 从屏幕中提取文本,从而实现基于文本的分析。
词云生成:生成反映屏幕中最常用单词的动态词云,提供快速的内容概述。
颜色分析:识别屏幕中流行的主要配色方案,提供美学和设计选择的快照。
GPT分析:采用OpenAI的GPT-4模型,根据从屏幕中提取的文字数据生成类似人类的文本描述,增强内容理解和可发现性。
克隆存储库:
git clone https://github.com/alexandrevl/pyscreen.git
导航到项目目录:
cd pyscreen
在您喜欢的屏幕录制上运行 PyScreen:
python main.py --input your_screen_recording.mp4
PyScreen 依赖于以下 Python 库:
gc
实现最佳内存管理json
和pandas
轻松进行数据操作cv2
(opencv)pytesseract
用于 OCR 功能nltk
WordCloud
用于制作视觉上引人注目的文字云openai
使用 GPT-4 模型python-dotenv
用于存储敏感信息unidecode
用于处理 Unicode 字符确保在运行 PyScreen 之前安装这些依赖项。您可以使用 pip 安装它们:
pip install opencv-python pytesseract nltk wordcloud openai pandas python-dotenv unidecode
要使用 chatGPT 功能,您必须拥有 OpenAI API 密钥。您可以在这里获取一个。获得 API 密钥后,在项目目录中创建一个.env
文件并添加以下行:
OPENAI_API_KEY=your_api_key
此外,您的系统上还需要安装 Tesseract OCR。请按照本指南获取详细的安装说明。
您的贡献很重要!请随意提交拉取请求以增强 PyScreen 的功能和可用性。
PyScreen 是开源软件,根据 MIT 许可证条款获得许可。请随意分享、修改和分发。