Python을 사용하면 누구에게나 장난스럽고 재미있는 소리를 들려줄 수 있습니다.
오디오를 전사하기 위해 전사 모델(여기서는 Whisper)을 활용하여 mp4에서 원하는 키워드를 소리내어 낸 다음, 선택한 단어와 연관된 추출된 타임스탬프를 사용하여 선택한 단어를 경보 음 소리로 대상 지정하고 바꿉니다.
모든 처리는 로컬에서 수행됩니다.
버전 전체 비교
예
설치
연습
최종 제품의 몇 가지 예(볼륨이 켜져 있는지 확인하세요. 기본적으로 꺼져 있습니다.)
위의 마지막 예를 더 자세히 살펴보겠습니다. 아래는 이 저장소의 파이프라인을 사용하여 몇 가지 단어를 읊어볼 짧은 클립입니다. (오디오를 켜야 합니다. 기본적으로 꺼져 있습니다.)
이제 "treetz", "ice", "cream", "chocolate", "syrup", "cookie"라는 단어가 포함된 동일한 클립이 삐 소리가 났습니다.
노트북 실행/자신의 비디오 신호음/strealit 데모 실행을 위한 설정을 얻으려면 먼저 터미널에 아래 항목을 붙여넣어 이 프로젝트에 대한 요구 사항을 설치하십시오.
pip install - r requirements . streamlit
Gradio 데모에 대한 요구 사항을 설치하려면 이 설치를 사용하십시오.
pip install - r requirements . gradio
컴퓨터에도 ffmpeg가 설치되어 있어야 합니다.
삐 소리를 내고 싶은 동영상에 대한 YouTube/Shorts URL을 입력할 수 있는 이 스트림라이트 데모를 로컬에서 시작하세요.
python - m streamlit run bleep_that_sht / app_url_download . py
또는 동일한 기능으로 Gradio 서버를 시작할 수 있습니다
python - m bleep_that_sht / gradio_app_url_download . py
docker compose를 사용할 수도 있습니다.
docker compose up
핵심 세부 사항을 재생하거나 보려면 beep_that_sht_walkthrough.ipynb
)를 참조하세요.