هذا المشروع عبارة عن تطبيق قائم على Streamlit يسمح للمستخدمين بتنزيل الصوت من مقاطع فيديو YouTube، ونسخها باستخدام نموذج OpenAI's Whisper، وعرض النسخ مع ترقيم الصفحات.
تحقق من العرض التوضيحي للتطبيق: OpenAI Whisper Transcribe YouTube Videos
استنساخ هذا المستودع:
git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos
تثبيت الحزم المطلوبة:
pip install -r requirements.txt
قم بتثبيت FFmpeg إذا لم يكن موجودًا على نظامك بالفعل. تختلف طرق التثبيت حسب نظام التشغيل.
قم بتشغيل تطبيق Streamlit:
streamlit run .srcapp.py
أدخل عنوان URL لفيديو YouTube في حقل الإدخال المقدم.
سيقوم التطبيق بتنزيل الصوت ونسخه وعرض النسخ مع ترقيم الصفحات.
تنزيل الصوت : تستخدم وظيفة download_audio
yt-dlp لتنزيل الصوت من عنوان URL المقدم على YouTube. يقوم بحفظ الصوت كملف WAV.
Transcribe Audio : تستخدم وظيفة transcribe_audio
نموذج Whisper الخاص بـ OpenAI لنسخ الملف الصوتي الذي تم تنزيله.
عرض النص : تقوم وظيفة display_transcript_with_pagination
بتقسيم النص إلى صفحات وتعرضها باستخدام مكونات واجهة المستخدم الخاصة بـ Streamlit.
معالجة الصوت : تقوم وظيفة process_audio
بتنسيق العملية بأكملها، بدءًا من التنزيل وحتى نسخ النتيجة وعرضها.
model_name
في وظيفة transcribe_audio
.tokens_per_page
في display_transcript_with_pagination
لتغيير مقدار النص المعروض في كل صفحة. يتطلب هذا التطبيق قدرًا كبيرًا من الموارد الحسابية، خاصة لمقاطع الفيديو الطويلة. يمكن أن يؤدي استخدام وحدة معالجة الرسومات التي تدعم CUDA إلى تسريع عملية النسخ بشكل كبير.
رخصة معهد ماساتشوستس للتكنولوجيا