비디오 및 오디오 콘텐츠를 복사하고, 요약하고, 스마트 클립을 만듭니다.
전사 : WhisperX를 사용하여 오디오를 전사합니다.
스마트 요약 : 다양한 목적에 맞게 비디오 콘텐츠의 간결한 요약을 생성합니다.
회의록
팟캐스트 요약
강의 노트
인터뷰 하이라이트
일반 콘텐츠 요약
지능형 클립 생성 : 영상에서 논의된 주요 순간과 주제의 클립을 자동으로 생성합니다.
다중 형식 지원 : 다양한 비디오 및 오디오 파일 형식을 처리합니다.
클라우드 통합 : 효율적인 파일 처리 및 처리를 위해 AWS S3를 활용합니다.
파이썬 3.8+
적절한 권한으로 구성된 AWS CLI
시스템에 설치된 FFmpeg
Node.js 및 npm(프런트엔드 GUI 실행용)
저장소를 복제합니다.
git clone https://github.com/sidedwards/ai-video-summarizer.git cd ai-video-summarizer
백엔드를 설정합니다.
config/config-example.yaml
config/config.yaml
에 복사합니다.
API 키와 기본 설정으로 config/config.yaml
편집하세요.
가상 환경 생성 및 활성화:
python -m venv .venv source .venv/bin/activate # On Windows, use `.venvScriptsactivate`
필요한 종속성을 설치합니다.
pip install -r requirements.txt
구성을 설정합니다.
프런트엔드 설정(GUI 사용의 경우 선택 사항):
프런트엔드 디렉터리로 이동합니다.
cd frontend
필요한 종속성을 설치합니다.
npm install
CLI 스크립트를 실행합니다.
python backend/cli.py
지시에 따라 비디오 파일을 선택하고 생성하려는 요약 유형을 선택하십시오.
생성된 요약 파일은 입력 비디오 파일의 이름을 딴 디렉터리에 저장됩니다.
백엔드 서버를 시작합니다.
백엔드 서버를 실행합니다.
python backend/server.py
프런트엔드 개발 서버를 시작합니다.
새 터미널 창에서 프런트엔드 디렉터리로 이동합니다.
cd frontend
프런트엔드 개발 서버를 실행합니다.
npm run dev
웹 브라우저를 열고 http://localhost:5173
으로 이동하여 AI Video Summarizer GUI에 액세스하세요.
웹 인터페이스를 사용하여 비디오 파일을 업로드하고 원하는 요약 유형을 선택한 후 처리를 시작하십시오.
처리가 완료되면 생성된 요약 파일을 zip 아카이브로 다운로드할 수 있습니다.
config/config.yaml
편집하여 다음을 설정합니다.
AWS CLI 경로 및 S3 버킷 이름
API 키 및 모델 버전 복제
Anthropic API 키 및 모델 선택
기타 사용자 정의 가능한 매개변수
웹 기반 GUI
기본 CLI
더 많은 LLM 옵션
다양한 문서 형식(PDF, DOCX 등)에 대한 내보내기 옵션
기여를 환영합니다! 언제든지 Pull Request를 제출해 주세요.
MIT 라이센스
이 프로젝트에서는 전사를 위해 OpenAI Whisper 모델의 고급 버전인 WhisperX를 사용합니다. WhisperX는 다음을 제공합니다:
가속화된 전사
고급 화자 분할
화자 분할의 정확성이 향상되었습니다.
WhisperX 모델은 https://github.com/sidewards/whisperx를 기반으로 하는 Replicate API를 통해 실행됩니다.