PyScreen を使用して AI の力を活用します。PyScreen は、画面録画ビデオから関連情報を抽出、分析、視覚化するように設計された最先端のツールです。 PyScreen は、高度なコンピューター ビジョン、テキスト処理、人工知能技術に基づいて構築されており、画面記録をデータ豊富な洞察に変換します。
画面抽出:特定のビデオ ファイルの画面から画面とデータをシームレスに抽出します。
画面ぼかし: 画面内の機密情報 (パスワード、クレジット カード番号など) をぼかし、プライバシーとセキュリティを確保します。
テキスト抽出: Tesseract OCR を使用して画面からテキストを抽出し、テキストベースの分析を可能にします。
ワード クラウドの生成:画面内で最も頻繁に使用される単語を反映した動的なワード クラウドを生成し、コンテンツの概要を素早く確認できます。
カラー分析:画面に広く普及している主要なカラースキームを特定し、美的およびデザイン上の選択のスナップショットを提供します。
GPT 分析: OpenAI の GPT-4 モデルを採用して、画面から抽出された単語データに基づいて人間のようなテキスト説明を生成し、コンテンツの理解と発見可能性を高めます。
リポジトリのクローンを作成します。
git clone https://github.com/alexandrevl/pyscreen.git
プロジェクト ディレクトリに移動します。
cd pyscreen
好みの画面録画で PyScreen を実行します。
python main.py --input your_screen_recording.mp4
PyScreen は次の Python ライブラリに依存しています。
gc
json
とpandas
による簡単なデータ操作cv2
(opencv)pytesseract
nltk
WordCloud
openai
python-dotenv
unidecode
PyScreen を実行する前に、これらの依存関係がインストールされていることを確認してください。 pip を使用してインストールできます。
pip install opencv-python pytesseract nltk wordcloud openai pandas python-dotenv unidecode
chatGPT 機能を使用するには、OpenAI API キーが必要です。ここで入手できます。 API キーを取得したら、プロジェクト ディレクトリに.env
ファイルを作成し、次の行を追加します。
OPENAI_API_KEY=your_api_key
さらに、Tesseract OCR がシステムにインストールされている必要があります。詳しいインストール手順については、このガイドに従ってください。
あなたの貢献は重要です! PyScreen の機能と使いやすさを強化するために、お気軽にプル リクエストを送信してください。
PyScreen はオープンソース ソフトウェアであり、MIT ライセンスの条件に基づいてライセンスされています。自由に共有、変更、配布してください。