openai_whisper_transcribe_yt_videos 다운로드 - openai_whisper_transcribe_yt_videos 소스 코드 다운로드

한국어

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

홈페이지>프로그래밍 관련>AI 소스 코드

openai_whisper_transcribe_yt_videos

AI 소스 코드

1.0.0

다운로드

YouTube 비디오 전사기

이 프로젝트는 사용자가 YouTube 비디오에서 오디오를 다운로드하고 OpenAI의 Whisper 모델을 사용하여 텍스트로 변환하고 페이지 매김을 사용하여 텍스트로 표시할 수 있는 Streamlit 기반 애플리케이션입니다.

특징

YouTube 비디오에서 오디오 다운로드
OpenAI의 Whisper 모델을 사용하여 오디오 녹음
페이지 매김을 사용하여 전사본 표시
호환성을 위해 파일 이름을 삭제하세요
CUDA 가속 지원(사용 가능한 경우)

데모

애플리케이션 데모를 확인하세요: OpenAI Whisper YouTube 동영상 전사

요구사항

파이썬 3.9+
파이토치
yt-dlp
속삭임
틱토큰
유선형
FFmpeg(오디오 변환용)

설치

다음 저장소를 복제하세요.

 git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos

필수 패키지를 설치합니다:
```
 pip install -r requirements.txt
```
시스템에 아직 FFmpeg가 없으면 설치하세요. 설치 방법은 운영 체제에 따라 다릅니다.

용법

Streamlit 앱을 실행합니다.
```
 streamlit run .srcapp.py
```
제공된 입력 필드에 YouTube 동영상 URL을 입력하세요.
앱은 오디오를 다운로드하여 텍스트로 변환하고 페이지 매김과 함께 텍스트를 표시합니다.

작동 방식

오디오 다운로드 : download_audio 함수는 yt-dlp를 사용하여 제공된 YouTube URL에서 오디오를 다운로드합니다. 오디오를 WAV 파일로 저장합니다.
오디오 녹음 : transcribe_audio 기능은 OpenAI의 Whisper 모델을 사용하여 다운로드한 오디오 파일을 녹음합니다.
Display Transcript : display_transcript_with_pagination 함수는 스크립트를 페이지로 분할하고 Streamlit의 UI 구성 요소를 사용하여 표시합니다.
프로세스 오디오 : process_audio 함수는 다운로드부터 복사 및 결과 표시까지 전체 프로세스를 조정합니다.

맞춤화

transcribe_audio 함수의 model_name 매개변수를 수정하여 Whisper 모델 크기를 변경할 수 있습니다.
페이지당 표시되는 텍스트의 양을 변경하려면 display_transcript_with_pagination 의 tokens_per_page 매개변수를 조정하세요.

메모

이 애플리케이션은 특히 긴 비디오의 경우 상당한 양의 계산 리소스가 필요합니다. CUDA 지원 GPU를 사용하면 전사 프로세스 속도가 크게 향상될 수 있습니다.

특허

MIT 라이센스

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2024-12-25
크기 70.31MB
출처 Github

관련 애플리케이션

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
개_여우_토끼

2022-08-01
리화 데이터 분석 엔진 무료 버전 3.0_search_navigation_collection_여론_순위_api

2022-06-28

추천

chat.petals.dev

기타 소스코드

1.0.0
GPT Prompt Templates

기타 소스코드

1.0.0
GPTyped

기타 소스코드

GPTyped 1.0.5
node telegram bot api

AI 소스 코드

v0.50.0
typebot.io

AI 소스 코드

v3.1.2
python wechaty getting started

AI 소스 코드

1.0.0
waymo open dataset

기타 소스코드

December 2023 Update
termwind

기타 카테고리

v2.3.0
wp functions

기타 카테고리

1.0.0

관련 정보 전체