Nutzen Sie die Leistungsfähigkeit der KI mit PyScreen, einem hochmodernen Tool zum Extrahieren, Analysieren und Visualisieren relevanter Informationen aus Bildschirmaufzeichnungsvideos. PyScreen basiert auf fortschrittlichen Computer-Vision-, Textverarbeitungs- und künstlichen Intelligenztechniken und verwandelt Ihre Bildschirmaufzeichnungen in datenreiche Erkenntnisse.
Bildschirmextraktion: Extrahiert nahtlos Bildschirme und Daten aus den Bildschirmen einer beliebigen Videodatei.
Bildschirmunschärfe : Verwischt vertrauliche Informationen (z. B. Passwörter, Kreditkartennummern) auf Ihren Bildschirmen und sorgt so für Privatsphäre und Sicherheit.
Textextraktion: Extrahiert Text aus Bildschirmen mit Tesseract OCR und ermöglicht so eine textbasierte Analyse.
Wortwolken-Generierung: Erzeugt dynamische Wortwolken, die die am häufigsten verwendeten Wörter auf Ihren Bildschirmen widerspiegeln und einen schnellen Überblick über den Inhalt bieten.
Farbanalyse: Identifiziert die vorherrschenden Farbschemata auf Ihren Bildschirmen und liefert einen Überblick über die ästhetischen und gestalterischen Entscheidungen.
GPT-Analyse: Verwendet das GPT-4-Modell von OpenAI, um menschenähnliche Textbeschreibungen auf der Grundlage von Wortdaten zu generieren, die von Bildschirmen extrahiert wurden, und so das Verständnis und die Auffindbarkeit von Inhalten zu verbessern.
Klonen Sie das Repository:
git clone https://github.com/alexandrevl/pyscreen.git
Navigieren Sie zum Projektverzeichnis:
cd pyscreen
Führen Sie PyScreen für Ihre bevorzugte Bildschirmaufnahme aus:
python main.py --input your_screen_recording.mp4
PyScreen basiert auf den folgenden Python-Bibliotheken:
gc
für optimale Speicherverwaltungjson
und pandas
für mühelose Datenmanipulationcv2
(opencv) für umfassende Bildverarbeitungpytesseract
für OCR-Funktionalitätnltk
für erweiterte TextverarbeitungWordCloud
zum Erstellen visuell ansprechender Wortwolkenopenai
für die Nutzung des GPT-4-Modellspython-dotenv
zum Speichern vertraulicher Informationenunidecode
zur Verarbeitung von Unicode-ZeichenStellen Sie sicher, dass diese Abhängigkeiten installiert sind, bevor Sie PyScreen ausführen. Sie können sie mit pip installieren:
pip install opencv-python pytesseract nltk wordcloud openai pandas python-dotenv unidecode
Um die ChatGPT-Funktionalität nutzen zu können, benötigen Sie einen OpenAI-API-Schlüssel. Eines können Sie hier erwerben. Sobald Sie Ihren API-Schlüssel haben, erstellen Sie eine .env
Datei im Projektverzeichnis und fügen Sie die folgende Zeile hinzu:
OPENAI_API_KEY=your_api_key
Darüber hinaus muss Tesseract OCR auf Ihrem System installiert sein. Befolgen Sie diese Anleitung für detaillierte Installationsanweisungen.
Ihre Beiträge zählen! Senden Sie gerne eine Pull-Anfrage, um die Funktionalität und Benutzerfreundlichkeit von PyScreen zu erweitern.
PyScreen ist eine Open-Source-Software, die unter den Bedingungen der MIT-Lizenz lizenziert ist. Fühlen Sie sich frei, es zu teilen, zu ändern und zu verbreiten.