Заставьте кого-нибудь звучать непослушно/смешно с помощью Python.
Выделите ключевые слова по вашему выбору из mp4, используя модель транскрипции (здесь «Шепот») для расшифровки аудио, затем нацельтесь и замените выбранные слова звуковыми сигналами, используя извлеченные временные метки, связанные с выбранными вами словами.
Вся обработка выполняется локально.
Общее сравнение версий
Примеры
Установка
Прохождение
Несколько примеров конечного продукта (обязательно включите громкость, по умолчанию она отключена).
Давайте более внимательно рассмотрим последний пример выше — ниже приведен короткий видеоролик, в котором мы выделим несколько слов из использования конвейера в этом репозитории. (обязательно включите звук — по умолчанию он выключен)
Теперь запищал тот же клип со словами - "тритц", "лед", "сливки", "шоколад", "сироп" и "печенье".
Чтобы настроить запуск ноутбука/прослушать собственное видео/запустить демо-версию strealit, сначала установите требования для этого проекта, вставив приведенную ниже команду в свой терминал.
pip install - r requirements . streamlit
Чтобы установить требования для демонстрационной версии Gradio, используйте эту установку.
pip install - r requirements . gradio
Вам также понадобится установленный на вашем компьютере ffmpeg.
Запустите эту демонстрационную версию с потоковой подсветкой локально, которая позволит вам ввести URL-адрес YouTube или Shorts для видео, которое вы хотите просигналить.
python - m streamlit run bleep_that_sht / app_url_download . py
Альтернативно вы можете запустить сервер Gradio с той же функциональностью.
python - m bleep_that_sht / gradio_app_url_download . py
Вы также можете использовать Docker Compose
docker compose up
См. beep_that_sht_walkthrough.ipynb
), чтобы поиграть/увидеть мельчайшие детали.