openai_whisper_transcribe_yt_videos تنزيل - openai_whisper_transcribe_yt

openai_whisper_transcribe_yt_videos

كود الذكاء الاصطناعي

1.0.0

تنزيل

يوتيوب فيديو الناسخ

هذا المشروع عبارة عن تطبيق قائم على Streamlit يسمح للمستخدمين بتنزيل الصوت من مقاطع فيديو YouTube، ونسخها باستخدام نموذج OpenAI's Whisper، وعرض النسخ مع ترقيم الصفحات.

سمات

تحميل الصوت من أشرطة فيديو يوتيوب
قم بنسخ الصوت باستخدام نموذج Whisper الخاص بـ OpenAI
عرض النسخ مع ترقيم الصفحات
تطهير أسماء الملفات من أجل التوافق
دعم تسريع CUDA (إن وجد)

تجريبي

تحقق من العرض التوضيحي للتطبيق: OpenAI Whisper Transcribe YouTube Videos

متطلبات

بايثون 3.9+
باي تورش
yt-dlp
الهمس
com.tiktoken
تبسيط
FFmpeg (لتحويل الصوت)

تثبيت

استنساخ هذا المستودع:

 git clone https://github.com/RiteshGenAI/openai_whisper_transcribe_yt_videos.git
cd openai_whisper_transcribe_yt_videos

تثبيت الحزم المطلوبة:
```
 pip install -r requirements.txt
```
قم بتثبيت FFmpeg إذا لم يكن موجودًا على نظامك بالفعل. تختلف طرق التثبيت حسب نظام التشغيل.

الاستخدام

قم بتشغيل تطبيق Streamlit:
```
 streamlit run .srcapp.py
```
أدخل عنوان URL لفيديو YouTube في حقل الإدخال المقدم.
سيقوم التطبيق بتنزيل الصوت ونسخه وعرض النسخ مع ترقيم الصفحات.

كيف يعمل

تنزيل الصوت : تستخدم وظيفة download_audio yt-dlp لتنزيل الصوت من عنوان URL المقدم على YouTube. يقوم بحفظ الصوت كملف WAV.
Transcribe Audio : تستخدم وظيفة transcribe_audio نموذج Whisper الخاص بـ OpenAI لنسخ الملف الصوتي الذي تم تنزيله.
عرض النص : تقوم وظيفة display_transcript_with_pagination بتقسيم النص إلى صفحات وتعرضها باستخدام مكونات واجهة المستخدم الخاصة بـ Streamlit.
معالجة الصوت : تقوم وظيفة process_audio بتنسيق العملية بأكملها، بدءًا من التنزيل وحتى نسخ النتيجة وعرضها.

التخصيص

يمكنك تغيير حجم نموذج Whisper عن طريق تعديل المعلمة model_name في وظيفة transcribe_audio .
اضبط معلمة tokens_per_page في display_transcript_with_pagination لتغيير مقدار النص المعروض في كل صفحة.

ملحوظة

يتطلب هذا التطبيق قدرًا كبيرًا من الموارد الحسابية، خاصة لمقاطع الفيديو الطويلة. يمكن أن يؤدي استخدام وحدة معالجة الرسومات التي تدعم CUDA إلى تسريع عملية النسخ بشكل كبير.