Aproveche el poder de la IA con PyScreen, una herramienta de última generación diseñada para extraer, analizar y visualizar información pertinente de videos de grabación de pantalla. Basado en técnicas avanzadas de visión por computadora, procesamiento de texto e inteligencia artificial, PyScreen transforma las grabaciones de su pantalla en información rica en datos.
Extracción de pantalla: extrae sin problemas pantallas y datos de las pantallas de cualquier archivo de vídeo determinado.
Desenfoque de pantalla : difumina la información confidencial (por ejemplo, contraseñas, números de tarjetas de crédito) en sus pantallas, garantizando privacidad y seguridad.
Extracción de texto: extrae texto de las pantallas utilizando Tesseract OCR, lo que permite el análisis basado en texto.
Generación de nube de palabras: genera nubes de palabras dinámicas que reflejan las palabras más utilizadas en sus pantallas, ofreciendo una descripción general rápida del contenido.
Análisis de color: identifica los esquemas de color dominantes que prevalecen en sus pantallas, proporcionando una instantánea de las opciones estéticas y de diseño.
Análisis GPT: emplea el modelo GPT-4 de OpenAI para generar descripciones de texto similares a las humanas basadas en datos de palabras extraídos de las pantallas, lo que mejora la comprensión y la visibilidad del contenido.
Clonar el repositorio:
git clone https://github.com/alexandrevl/pyscreen.git
Navegue al directorio del proyecto:
cd pyscreen
Ejecute PyScreen en su grabación de pantalla preferida:
python main.py --input your_screen_recording.mp4
PyScreen se basa en las siguientes bibliotecas de Python:
gc
para una gestión óptima de la memoriajson
y pandas
para una manipulación de datos sin esfuerzocv2
(opencv) para un procesamiento integral de imágenespytesseract
para la funcionalidad OCRnltk
para procesamiento de texto avanzadoWordCloud
para crear nubes de palabras visualmente atractivasopenai
para utilizar la versión GPT-4python-dotenv
para almacenar información confidencialunidecode
para manejar caracteres UnicodeAsegúrese de que estas dependencias estén instaladas antes de ejecutar PyScreen. Puedes instalarlos usando pip:
pip install opencv-python pytesseract nltk wordcloud openai pandas python-dotenv unidecode
Para utilizar la funcionalidad chatGPT, debe tener una clave API de OpenAI. Puedes obtener uno aquí. Una vez que tenga su clave API, cree un archivo .env
en el directorio del proyecto y agregue la siguiente línea:
OPENAI_API_KEY=your_api_key
Además, es necesario instalar Tesseract OCR en su sistema. Siga esta guía para obtener instrucciones detalladas de instalación.
¡Tus contribuciones importan! No dude en enviar una solicitud de extracción para aumentar la funcionalidad y usabilidad de PyScreen.
PyScreen es un software de código abierto, con licencia según los términos de la licencia MIT. Siéntase libre de compartir, modificar y distribuir.