? GPT Subtitler adalah aplikasi web yang terinspirasi oleh proyek ini, dengan banyak fitur canggih:
Mendukung terjemahan subtitle berkualitas tinggi menggunakan berbagai model seperti Anthropic Claude, GPT-3.5, dan GPT-4. Saat ini, model Claude-Haiku direkomendasikan.
Selain itu, model Gemini-1.5-flash dan Gemini-1.5-pro tersedia untuk dicoba oleh pengguna gratis, meskipun model tersebut mungkin tidak seakurat model Claude-Haiku.
? Pengguna baru menerima 100.000 token gratis saat mendaftar, cukup untuk menerjemahkan subtitle video berdurasi 20 menit secara gratis.
? Token gratis dapat diklaim setiap hari, dan token juga dapat dibeli dengan harga murah. Tidak diperlukan kunci API untuk menggunakan terjemahan AI.
? Pratinjau hasil terjemahan secara real-time, dukungan untuk petunjuk pengeditan, contoh beberapa contoh, dan kemampuan untuk menghentikan terjemahan kapan saja dan memulai kembali dari posisi mana pun. Setelah terjemahan, beberapa format file subtitle SRT dapat diekspor (terjemahan + asli atau asli + terjemahan subtitle bilingual).
Situs web ini sedang dalam tahap pengembangan awal dan membutuhkan dukungan dan masukan Anda! Anda dipersilakan untuk mencobanya dan memberikan saran yang berharga.
Jika Anda menemukan bug atau memiliki saran selama penggunaan, jangan ragu untuk menyampaikan masalah pada proyek GitHub atau mengirimkan masukan melalui email.
Tautan situs web https://gptsubtitler.com/en
Terima kasih atas dukungan Anda dan telah membaca sejauh ini!
Berikut kode penukaran 100.000 token: GPTSubtitler_github_repo
Anda dapat menggunakannya di Pengaturan
Melalui YouTube, Whisper, dan API, dan seterusnya
Proyek ini adalah skrip Python yang mengunduh video YouTube (atau menggunakan file video lokal), menyalinnya, menerjemahkan transkripnya ke dalam bahasa target, dan menghasilkan video dengan subtitle ganda (asli dan terjemahan). Transkripsi dan terjemahan masing-masing didukung oleh model Whisper dan API terjemahan (M2M100, google, GPT3.5).
Terjemahan GPT-3.5 dibandingkan dengan Google Terjemahan
Argumen:
Selain itu, saat menjalankan skrip untuk pertama kalinya, skrip tersebut akan mengunduh model terlatih berikut:
pip install -r requirements.txt
Anda dapat memberikan URL YouTube atau file video lokal untuk diproses. Script akan mentranskripsikan video, menerjemahkan transkripnya, dan menghasilkan dual subtitle dalam bentuk file SRT.
python main.py --youtube_url [YOUTUBE_URL] --target_language [TARGET_LANGUAGE] --model [WHISPER_MODEL] --translation_method [TRANSLATION_METHOD]
--youtube_url: URL video YouTube.
--local_video: Jalur ke file video lokal.
--target_bahasa: Bahasa target untuk terjemahan (default: 'zh').
--model: Pilih salah satu model Whisper (default: 'small', pilihan: ['tiny', 'base', 'small', 'medium', 'large']).
--translation_method: Metode yang digunakan untuk terjemahan. (default: 'google', pilihan: ['m2m100', 'google', 'whisper', 'gpt', 'no_translate']).
--no_transcribe: Lewati langkah transkripsi. Asumsikan ada file SRT dengan nama yang sama dengan file video
Catatan: Anda harus memberikan --youtube_url atau --local_video, namun tidak keduanya.
Untuk mengunduh video YouTube, menyalinnya, dan membuat subtitle dalam bahasa target menggunakan google api untuk menerjemahkan:
python main.py --youtube_url [YOUTUBE_URL] --target_language 'zh' --model 'small' --translation_method 'google'
Untuk memproses file video lokal, menyalinnya, dan menghasilkan subtitle dalam bahasa target menggunakan gpt3.5-16k (Anda perlu menyediakan kunci API OpenAI)):
python main.py --local_video [VIDEO_FILE_PATH] --target_language 'zh' --model 'medium' --translation_method 'gpt'
Skrip akan menghasilkan file keluaran berikut di direktori yang sama dengan video masukan:
Skrip ini menerjemahkan subtitle menggunakan model bahasa GPT-3.5 OpenAI. Ini memerlukan kunci API OpenAI agar dapat berfungsi. Dalam kebanyakan kasus, terjemahan berbasis GPT memberikan hasil yang jauh lebih baik dibandingkan dengan Google Terjemahan, terutama ketika menangani terjemahan konteks spesifik atau ekspresi idiomatik. Skrip ini bertujuan untuk memberikan metode alternatif untuk menerjemahkan subtitle ketika layanan terjemahan tradisional seperti Google Translate tidak memberikan hasil yang memuaskan.
OPENAI_API_KEY=your_api_key_here
Ganti your_api_key_here dengan kunci API yang Anda peroleh dari OpenAI.
python translate_gpt.py --input_file INPUT_FILE_PATH [--batch_size BATCH_SIZE] [--target_language TARGET_LANGUAGE] [--source_language SOURCE_LANGUAGE] [--video_info VIDEO_INFO] [--model MODEL_NAME] [--no_mapping] [--load_tmp_file]
Anda dapat memeriksa file response.log
di folder yang berisi file video masukan untuk pembaruan langsung, serupa dengan pengalaman dengan ChatGPT.
Catatan:
Informasi Video: Argumen --video_info
menerima detail dalam bahasa apa pun. Hal ini dapat digunakan untuk menginformasikan model GPT tentang konten video, meningkatkan terjemahan istilah spesifik konteks, seperti kata benda dalam game. Misalnya, jika menerjemahkan video terkait game, Anda dapat menginstruksikan GPT untuk menggunakan terjemahan yang tepat untuk terminologi dalam game.
Pemetaan Terjemahan: Fungsi ini menjaga konsistensi istilah yang sering digunakan dengan menyimpan pasangan terjemahan sumber-target. Jika diaktifkan, ini mencegah variasi dalam penerjemahan istilah seperti kata benda dan jargon teknis di seluruh video. Nonaktifkan ini dengan tanda --no_mapping
jika diinginkan.
Melanjutkan Terjemahan: Gunakan tanda --load_tmp_file
untuk melanjutkan tugas terjemahan dari tempat yang sebelumnya terputus. Skrip menyimpan kemajuan di tmp_subtitles.json
, memungkinkan dimulainya kembali dengan lancar tanpa mengulangi pekerjaan sebelumnya.
Dukungan Bahasa: Meskipun skrip ini unggul dalam terjemahan Bahasa Inggris ke Bahasa Mandarin Sederhana, skrip ini dapat mengakomodasi pasangan bahasa lainnya. Tingkatkan akurasi untuk bahasa tambahan dengan menambahkan contoh beberapa contoh yang disesuaikan ke few_shot_examples.json
. Perlu diperhatikan bahwa performa model GPT mungkin berbeda tergantung masukan multibahasa, dan penyesuaian cepat pada translate_gpt.py
mungkin diperlukan.
Kontribusi sangat diharapkan!
Anda juga dapat mencoba skrip ini menggunakan notebook Google Colab. Klik tautan di bawah untuk mengakses contoh:
Ikuti petunjuk di buku catatan untuk mengunduh paket dan model yang diperlukan, dan untuk menjalankan skrip pada video YouTube atau file video lokal yang Anda inginkan.