Haz que cualquiera suene travieso/divertido con Python.
Silencia las palabras clave que elijas de un mp4 aprovechando un modelo de transcripción (aquí Whisper) para transcribir el audio, luego selecciona y reemplaza las palabras elegidas con sonidos de pitido usando las marcas de tiempo extraídas asociadas con las palabras elegidas.
Todo el procesamiento se realiza localmente.
Comparación general de versiones
Ejemplos
Instalación
Tutorial
Algunos ejemplos del producto final (asegúrese de activar el volumen, está desactivado de forma predeterminada).
Veamos más de cerca el último ejemplo anterior: a continuación se muestra un breve clip en el que eliminaremos algunas palabras del uso de la canalización en este repositorio. (asegúrate de activar el audio; está desactivado de forma predeterminada)
Ahora sonó el mismo clip con las palabras "treetz", "ice", "cream", "chocolate", "syrup" y "cookie".
Para configurar para ejecutar la computadora portátil / reproducir sus propios videos / ejecutar la demostración de strealit, primero instale los requisitos para este proyecto pegando lo siguiente en su terminal.
pip install - r requirements . streamlit
Para instalar los requisitos para la demostración de gradio utilice esta instalación
pip install - r requirements . gradio
También necesitarás tener instalado ffmpeg en tu máquina.
Inicie esta demostración optimizada localmente que le permite ingresar en una URL de youtube/shorts a un video que desea emitir un pitido.
python - m streamlit run bleep_that_sht / app_url_download . py
Alternativamente, puedes iniciar un servidor gradio con la misma funcionalidad.
python - m bleep_that_sht / gradio_app_url_download . py
También puedes usar Docker Compose.
docker compose up
Consulte beep_that_sht_walkthrough.ipynb
) para jugar/ver detalles esenciales.