Ce référentiel utilise yt-dlp
et Openai's Whisper pour générer des fichiers sous-titre pour toute vidéo YouTube.
Pour commencer, vous aurez besoin de Python 3.7 ou plus récent. Installez le binaire en exécutant la commande suivante:
pip install git+https://github.com/m1guelpf/yt-whisper.git
Vous devrez également installer ffmpeg
, qui est disponible auprès de la plupart des gestionnaires de packages:
# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg
# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg
# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg
La commande suivante générera un fichier VTT à partir de la vidéo YouTube spécifiée
yt_whisper "https://www.youtube.com/watch?v=dQw4w9WgXcQ"
Le paramètre par défaut (qui sélectionne le small
modèle) fonctionne bien pour transcrire l'anglais. Vous pouvez éventuellement utiliser un modèle plus grand pour de meilleurs résultats (en particulier avec d'autres langues). Les modèles disponibles sont tiny
, tiny.en
, base
, base, base.en
, small
, small.en
, medium
, medium.en
, large
.
yt_whisper "https://www.youtube.com/watch?v=dQw4w9WgXcQ" --model medium
Ajout --task translate
traditionne les sous-titres en anglais:
yt_whisper "https://www.youtube.com/watch?v=dQw4w9WgXcQ" --task translate
Exécutez ce qui suit pour afficher toutes les options disponibles:
yt_whisper --help
Ce script est open-source et sous licence sous la licence MIT. Pour plus de détails, vérifiez le fichier de licence.