? GPT Subtitler est une application web inspirée de ce projet, avec de nombreuses fonctionnalités puissantes :
Prend en charge la traduction de sous-titres de haute qualité à l'aide de divers modèles tels que Anthropic Claude, GPT-3.5 et GPT-4. Actuellement, le modèle Claude-Haiku est recommandé.
De plus, les modèles Gemini-1.5-flash et Gemini-1.5-pro sont disponibles gratuitement pour les utilisateurs, bien qu'ils ne soient peut-être pas aussi précis que le modèle Claude-Haiku.
? Les nouveaux utilisateurs reçoivent 100 000 jetons gratuits lors de leur inscription, soit suffisamment pour traduire gratuitement 20 minutes de sous-titres vidéo.
? Les jetons gratuits peuvent être réclamés quotidiennement et les jetons peuvent également être achetés à bas prix. Aucune clé API n'est requise pour utiliser la traduction AI.
? Aperçu en temps réel des résultats de traduction, prise en charge des invites d'édition, exemples succincts et possibilité d'arrêter la traduction à tout moment et de la redémarrer depuis n'importe quelle position. Après traduction, plusieurs formats de fichiers de sous-titres SRT peuvent être exportés (traduction + original ou original + traduction sous-titres bilingues).
Le site Web est actuellement au début de son développement et a besoin de votre soutien et de vos commentaires ! Vous êtes invités à l’essayer et à fournir de précieuses suggestions.
Si vous rencontrez des bugs ou avez des suggestions lors de l'utilisation, n'hésitez pas à soulever un problème sur le projet GitHub ou à envoyer des commentaires par e-mail.
Lien vers le site https://gptsubtitler.com/en
Merci pour votre soutien et pour avoir lu jusqu'ici !
Voici un code d'échange pour 100 000 jetons : GPTSubtitler_github_repo
Vous pouvez l'utiliser dans Paramètres
下载 YouTube 视频(或提供您自己的视频)并使用 Whisper et API生成双语字幕,中文文档请见 中文
Ce projet est un script Python qui télécharge une vidéo YouTube (ou utilise un fichier vidéo local), la transcrit, traduit la transcription dans une langue cible et génère une vidéo avec deux sous-titres (original et traduit). La transcription et la traduction sont respectivement alimentées par le modèle Whisper et l'API de traduction (M2M100, google, GPT3.5).
Traduction GPT-3.5 par rapport à Google Translate
Arguments :
De plus, lors de l'exécution du script pour la première fois, il téléchargera les modèles pré-entraînés suivants :
pip install -r requirements.txt
Vous pouvez fournir soit une URL YouTube, soit un fichier vidéo local pour le traitement. Le script transcrira la vidéo, traduira la transcription et générera des sous-titres doubles sous la forme d'un fichier SRT.
python main.py --youtube_url [YOUTUBE_URL] --target_language [TARGET_LANGUAGE] --model [WHISPER_MODEL] --translation_method [TRANSLATION_METHOD]
--youtube_url : L'URL de la vidéo YouTube.
--local_video : Le chemin d'accès au fichier vidéo local.
--target_lingual : La langue cible pour la traduction (par défaut : 'zh').
--model : Choisissez l'un des modèles Whisper (par défaut : 'small', choix : ['tiny', 'base', 'small', 'medium', 'large']).
--translation_method : La méthode à utiliser pour la traduction. (par défaut : 'google', choix : ['m2m100', 'google', 'whisper', 'gpt', 'no_translate']).
--no_transcribe : ignorez l'étape de transcription. Supposons qu'il existe un fichier SRT portant le même nom que le fichier vidéo
Remarque : Vous devez fournir soit --youtube_url, soit --local_video, mais pas les deux.
Pour télécharger une vidéo YouTube, la transcrire et générer des sous-titres dans la langue cible à l'aide de l'API Google pour la traduire :
python main.py --youtube_url [YOUTUBE_URL] --target_language 'zh' --model 'small' --translation_method 'google'
Pour traiter un fichier vidéo local, le transcrire et générer des sous-titres dans la langue cible à l'aide de gpt3.5-16k (vous devrez fournir une clé API OpenAI) :
python main.py --local_video [VIDEO_FILE_PATH] --target_language 'zh' --model 'medium' --translation_method 'gpt'
Le script générera les fichiers de sortie suivants dans le même répertoire que la vidéo d'entrée :
Ce script traduit les sous-titres à l'aide du modèle de langage GPT-3.5 d'OpenAI. Il nécessite une clé API OpenAI pour fonctionner. Dans la plupart des cas, les traductions basées sur GPT produisent de bien meilleurs résultats que Google Translate, en particulier lorsqu'il s'agit de traductions spécifiques au contexte ou d'expressions idiomatiques. Ce script vise à fournir une méthode alternative pour traduire les sous-titres lorsque les services de traduction traditionnels comme Google Translate ne produisent pas de résultats satisfaisants.
OPENAI_API_KEY=your_api_key_here
Remplacez your_api_key_here par la clé API que vous avez obtenue auprès d'OpenAI.
python translate_gpt.py --input_file INPUT_FILE_PATH [--batch_size BATCH_SIZE] [--target_language TARGET_LANGUAGE] [--source_language SOURCE_LANGUAGE] [--video_info VIDEO_INFO] [--model MODEL_NAME] [--no_mapping] [--load_tmp_file]
Vous pouvez vérifier le fichier response.log
dans le dossier contenant le fichier vidéo d'entrée pour les mises à jour en direct, similaire à l'expérience avec ChatGPT.
Note:
Informations vidéo : l'argument --video_info
accepte les détails dans n'importe quelle langue. Il peut être utilisé pour informer le modèle GPT sur le contenu de la vidéo, améliorant ainsi la traduction de termes spécifiques au contexte, tels que les noms propres dans un jeu. Par exemple, si vous traduisez une vidéo liée à un jeu, vous pouvez demander à GPT d'utiliser des traductions précises pour la terminologie du jeu.
Mappage de traduction : cette fonctionnalité maintient la cohérence des termes fréquemment utilisés en stockant les paires de traduction source-cible. Lorsqu'il est activé, il empêche les variations dans la traduction de termes tels que les noms propres et le jargon technique dans la vidéo. Désactivez ceci avec l'indicateur --no_mapping
si vous préférez.
Reprise des traductions : utilisez l'indicateur --load_tmp_file
pour poursuivre une tâche de traduction là où elle a été précédemment interrompue. Le script enregistre la progression dans tmp_subtitles.json
, permettant une reprise transparente sans refaire le travail préalable.
Prise en charge linguistique : bien que le script excelle dans les traductions de l'anglais vers le chinois simplifié, il peut s'adapter à d'autres paires de langues. Améliorez la précision pour des langues supplémentaires en ajoutant des exemples personnalisés à few_shot_examples.json
. Notez que les performances des modèles GPT peuvent varier en fonction des entrées multilingues et que des ajustements rapides dans translate_gpt.py
peuvent être nécessaires.
Les contributions sont plus que bienvenues !
Vous pouvez également essayer ce script à l'aide d'un bloc-notes Google Colab. Cliquez sur le lien ci-dessous pour accéder à l'exemple :
Suivez les instructions du bloc-notes pour télécharger les packages et modèles nécessaires et pour exécuter le script sur la vidéo YouTube ou le fichier vidéo local de votre choix.