? GPT Subtitler — это веб-приложение, вдохновленное этим проектом, со множеством мощных функций:
Поддерживает высококачественный перевод субтитров с использованием различных моделей, таких как Anthropic Claude, GPT-3.5 и GPT-4. В настоящее время рекомендуется модель Клода-Хайку .
Кроме того, бесплатные модели доступны для тестирования моделями Gemini-1.5-flash и Gemini-1.5-pro , хотя они могут быть не такими точными, как модель Claude-Haiku.
? Новые пользователи при регистрации получают 100 000 бесплатных жетонов, которых достаточно для бесплатного перевода 20 минут видеосубтитров.
? Бесплатные токены можно запрашивать ежедневно, а жетоны также можно приобрести по низким ценам. Для использования перевода AI не требуется ключ API.
? Предварительный просмотр результатов перевода в реальном времени, поддержка подсказок по редактированию, примеры из нескольких кадров, а также возможность остановить перевод в любой момент и перезапустить его с любой позиции. После перевода можно экспортировать несколько форматов файлов субтитров SRT (перевод + оригинал или оригинал + перевод двуязычных субтитров).
Сайт в настоящее время находится на ранней стадии разработки и нуждается в вашей поддержке и отзывах! Вы можете попробовать его и дать ценные предложения.
Если во время использования вы обнаружите какие-либо ошибки или у вас возникнут какие-либо предложения, пожалуйста, не стесняйтесь поднять проблему в проекте GitHub или отправить отзыв по электронной почте.
Ссылка на сайт https://gptsubtitler.com/en
Спасибо за вашу поддержку и за то, что дочитали до этого момента!
Вот код активации на 100 000 токенов: GPTSubtitler_github_repo
Вы можете использовать его в настройках
下载 YouTube 视频(或提供您自己的视频)并使用 Whisper 和翻译API生成双语字幕,中文文档请见中文
Этот проект представляет собой скрипт Python, который загружает видео с YouTube (или использует локальный видеофайл), расшифровывает его, переводит расшифровку на целевой язык и создает видео с двумя субтитрами (оригинальным и переведенным). Транскрипция и перевод основаны на модели Whisper и API перевода (M2M100, Google, GPT3.5) соответственно.
Перевод GPT-3.5 по сравнению с Google Translate
Аргументы:
Кроме того, при первом запуске сценария он загрузит следующие предварительно обученные модели:
pip install -r requirements.txt
Вы можете предоставить для обработки URL-адрес YouTube или локальный видеофайл. Скрипт расшифрует видео, переведет расшифровку и сгенерирует двойные субтитры в виде файла SRT.
python main.py --youtube_url [YOUTUBE_URL] --target_language [TARGET_LANGUAGE] --model [WHISPER_MODEL] --translation_method [TRANSLATION_METHOD]
--youtube_url: URL-адрес видео YouTube.
--local_video: путь к локальному видеофайлу.
--target_language: целевой язык для перевода (по умолчанию: «zh»).
--model: выберите одну из моделей Whisper (по умолчанию: «маленькая», варианты выбора: [«крошечный», «базовый», «маленький», «средний», «большой»]).
--translation_method: метод, используемый для перевода. (по умолчанию: «google», варианты: ['m2m100», «google», «whisper», «gpt», «no_translate»]).
--no_transcribe: пропустить этап транскрипции. Предположим, что существует файл SRT с тем же именем, что и видеофайл.
Примечание. Необходимо указать либо --youtube_url, либо --local_video, но не оба одновременно.
Чтобы загрузить видео с YouTube, расшифровать его и создать субтитры на целевом языке с помощью API Google для перевода:
python main.py --youtube_url [YOUTUBE_URL] --target_language 'zh' --model 'small' --translation_method 'google'
Чтобы обработать локальный видеофайл, расшифровать его и создать субтитры на целевом языке с помощью gpt3.5-16k (вам потребуется предоставить ключ API OpenAI)):
python main.py --local_video [VIDEO_FILE_PATH] --target_language 'zh' --model 'medium' --translation_method 'gpt'
Скрипт сгенерирует следующие выходные файлы в том же каталоге, что и входное видео:
Этот скрипт переводит субтитры, используя языковую модель OpenAI GPT-3.5. Для работы требуется ключ API OpenAI . В большинстве случаев перевод на основе GPT дает гораздо лучшие результаты по сравнению с Google Translate, особенно при работе с контекстно-зависимыми переводами или идиоматическими выражениями. Этот скрипт призван предоставить альтернативный метод перевода субтитров, когда традиционные службы перевода, такие как Google Translate, не дают удовлетворительных результатов.
OPENAI_API_KEY=your_api_key_here
Замените your_api_key_here ключом API, полученным от OpenAI.
python translate_gpt.py --input_file INPUT_FILE_PATH [--batch_size BATCH_SIZE] [--target_language TARGET_LANGUAGE] [--source_language SOURCE_LANGUAGE] [--video_info VIDEO_INFO] [--model MODEL_NAME] [--no_mapping] [--load_tmp_file]
Вы можете проверить файл response.log
в папке, содержащей входной видеофайл, на наличие обновлений в реальном времени, аналогично тому, как это происходит с ChatGPT.
Примечание:
Информация о видео: Аргумент --video_info
принимает сведения на любом языке. Его можно использовать для информирования модели GPT о содержании видео, улучшая перевод контекстно-зависимых терминов, таких как имена собственные, в игре. Например, если вы переводите видео, связанное с играми, вы можете поручить GPT использовать точные переводы внутриигровой терминологии.
Сопоставление перевода: эта функция обеспечивает согласованность часто используемых терминов за счет хранения пар перевода «источник-цель». Когда эта функция включена, она предотвращает вариации в переводе таких терминов, как имена собственные и технический жаргон, в видео. Если необходимо, отключите это с помощью флага --no_mapping
.
Возобновление перевода: используйте флаг --load_tmp_file
, чтобы продолжить задачу перевода с того места, где она была ранее прервана. Скрипт сохраняет прогресс в tmp_subtitles.json
, что позволяет плавно возобновить работу без повторного выполнения предыдущей работы.
Языковая поддержка: хотя сценарий превосходно выполняет переводы с английского на упрощенный китайский, он может работать и с другими языковыми парами. Повысьте точность работы с дополнительными языками, добавив специальные примеры с несколькими примерами в few_shot_examples.json
. Обратите внимание, что производительность моделей GPT может меняться в зависимости от многоязычного ввода, поэтому могут потребоваться быстрые изменения в translate_gpt.py
.
Вклад более чем приветствуется!
Вы также можете опробовать этот скрипт, используя блокнот Google Colab. Нажмите на ссылку ниже, чтобы получить доступ к примеру:
Следуйте инструкциям в блокноте, чтобы загрузить необходимые пакеты и модели, а также запустить сценарий для нужного видео YouTube или локального видеофайла.