Donnez à n'importe qui un air méchant/drôle avec Python.
Faites biper les mots-clés de votre choix à partir d'un mp4 en utilisant un modèle de transcription (ici Whisper) pour transcrire l'audio, puis ciblez et remplacez les mots choisis par des bips en utilisant les horodatages extraits associés au(x) mot(s) choisi(s).
Tout le traitement est effectué localement.
Comparaison globale des versions
Exemples
Installation
Procédure pas à pas
Quelques exemples du produit final (assurez-vous d'activer le volume, il est désactivé par défaut).
Examinons de plus près le dernier exemple ci-dessus. Vous trouverez ci-dessous un court extrait dans lequel nous émettrons quelques mots liés à l'utilisation du pipeline dans ce dépôt. (assurez-vous d'activer l'audio - il est désactivé par défaut)
Maintenant, le même clip avec les mots - "treetz", "ice", "cream", "chocolate", "sirop" et "cookie" - a été émis.
Pour configurer l'exécution du notebook / faire biper vos propres vidéos / exécuter la démo Strealit, installez d'abord les exigences de ce projet en collant ce qui suit dans votre terminal.
pip install - r requirements . streamlit
Pour installer la configuration requise pour la démo gradio, utilisez cette installation
pip install - r requirements . gradio
Vous aurez également besoin de ffmpeg installé sur votre machine.
Démarrez localement cette démo simplifiée qui vous permet de saisir une URL youtube/shorts vers une vidéo que vous souhaitez biper
python - m streamlit run bleep_that_sht / app_url_download . py
Alternativement, vous pouvez démarrer un serveur gradio avec la même fonctionnalité
python - m bleep_that_sht / gradio_app_url_download . py
Vous pouvez également utiliser Docker Compose
docker compose up
Voir beep_that_sht_walkthrough.ipynb
) pour jouer/voir les moindres détails.