화면 녹화 비디오에서 관련 정보를 추출, 분석 및 시각화하도록 설계된 최첨단 도구인 PyScreen으로 AI의 강력한 기능을 활용하세요. 고급 컴퓨터 비전, 텍스트 처리 및 인공 지능 기술을 기반으로 구축된 PyScreen은 화면 녹화를 데이터가 풍부한 통찰력으로 변환합니다.
화면 추출: 특정 비디오 파일의 화면에서 화면과 데이터를 원활하게 추출합니다.
화면 흐림 : 화면의 민감한 정보(예: 비밀번호, 신용카드 번호)를 흐리게 하여 개인정보 보호와 보안을 보장합니다.
텍스트 추출: Tesseract OCR을 사용하여 화면에서 텍스트를 추출하여 텍스트 기반 분석을 가능하게 합니다.
단어 클라우드 생성: 화면에서 가장 자주 사용되는 단어를 반영하는 동적 단어 클라우드를 생성하여 빠른 콘텐츠 개요를 제공합니다.
색상 분석: 화면에 널리 퍼져 있는 주요 색상 구성표를 식별하여 미적 및 디자인 선택에 대한 스냅샷을 제공합니다.
GPT 분석: OpenAI의 GPT-4 모델을 사용하여 화면에서 추출된 단어 데이터를 기반으로 인간과 유사한 텍스트 설명을 생성하여 콘텐츠 이해와 검색 가능성을 높입니다.
저장소를 복제합니다.
git clone https://github.com/alexandrevl/pyscreen.git
프로젝트 디렉터리로 이동합니다.
cd pyscreen
원하는 화면 녹화에서 PyScreen을 실행하세요.
python main.py --input your_screen_recording.mp4
PyScreen은 다음 Python 라이브러리를 사용합니다.
gc
json
및 pandas
cv2
(opencv)pytesseract
nltk
WordCloud
openai
python-dotenv
unidecode
PyScreen을 실행하기 전에 이러한 종속성이 설치되어 있는지 확인하세요. pip를 사용하여 설치할 수 있습니다.
pip install opencv-python pytesseract nltk wordcloud openai pandas python-dotenv unidecode
chatGPT 기능을 사용하려면 OpenAI API 키가 있어야 합니다. 여기서 얻을 수 있습니다. API 키가 있으면 프로젝트 디렉터리에 .env
파일을 만들고 다음 줄을 추가합니다.
OPENAI_API_KEY=your_api_key
또한 Tesseract OCR이 시스템에 설치되어 있어야 합니다. 자세한 설치 지침을 보려면 이 가이드를 따르세요.
귀하의 기여가 중요합니다! PyScreen의 기능과 유용성을 강화하려면 자유롭게 풀 요청을 제출하세요.
PyScreen은 MIT 라이센스 조건에 따라 라이센스가 부여된 오픈 소스 소프트웨어입니다. 자유롭게 공유, 수정, 배포할 수 있습니다.