قم بنسخ وتلخيص وإنشاء مقاطع ذكية من محتوى الفيديو والصوت.
النسخ : نسخ الصوت باستخدام WhisperX
التلخيص الذكي : قم بإنشاء ملخصات موجزة لمحتوى الفيديو، مصممة خصيصًا لأغراض مختلفة:
محضر الاجتماع
ملخصات البودكاست
ملاحظات المحاضرة
أبرز المقابلة
ملخصات المحتوى العام
إنشاء مقطع ذكي : إنشاء مقاطع للحظات والموضوعات الرئيسية التي تمت مناقشتها في الفيديو تلقائيًا.
دعم التنسيقات المتعددة : معالجة تنسيقات ملفات الفيديو والصوت المختلفة.
التكامل السحابي : يستخدم AWS S3 لمعالجة الملفات ومعالجتها بكفاءة.
بايثون 3.8+
تم تكوين AWS CLI بالأذونات المناسبة
تم تثبيت FFmpeg على نظامك
Node.js وnpm (لتشغيل واجهة المستخدم الرسومية الأمامية)
استنساخ المستودع:
git clone https://github.com/sidedwards/ai-video-summarizer.git cd ai-video-summarizer
إعداد الواجهة الخلفية:
انسخ config/config-example.yaml
إلى config/config.yaml
قم بتحرير config/config.yaml
باستخدام مفاتيح API وتفضيلاتك
إنشاء وتفعيل بيئة افتراضية:
python -m venv .venv source .venv/bin/activate # On Windows, use `.venvScriptsactivate`
تثبيت التبعيات المطلوبة:
pip install -r requirements.txt
قم بإعداد التكوين الخاص بك:
قم بإعداد الواجهة الأمامية (اختياري، لاستخدام واجهة المستخدم الرسومية):
انتقل إلى دليل الواجهة الأمامية:
cd frontend
تثبيت التبعيات المطلوبة:
npm install
قم بتشغيل البرنامج النصي CLI:
python backend/cli.py
اتبع المطالبات لتحديد ملف فيديو واختيار نوع الملخص الذي تريد إنشاءه.
سيتم حفظ ملفات التلخيص التي تم إنشاؤها في دليل يحمل اسم ملف الفيديو المدخل.
بدء تشغيل الخادم الخلفي:
تشغيل الخادم الخلفي:
python backend/server.py
ابدأ خادم تطوير الواجهة الأمامية:
في نافذة طرفية جديدة، انتقل إلى دليل الواجهة الأمامية:
cd frontend
تشغيل خادم تطوير الواجهة الأمامية:
npm run dev
افتح متصفح الويب الخاص بك وانتقل إلى http://localhost:5173
للوصول إلى واجهة المستخدم الرسومية لـ AI Video Summarizer.
استخدم واجهة الويب لتحميل ملف فيديو، وحدد نوع الملخص المطلوب، وابدأ المعالجة.
بمجرد اكتمال المعالجة، يمكنك تنزيل الملفات الموجزة التي تم إنشاؤها كأرشيف مضغوط.
تحرير config/config.yaml
لتعيين:
مسار AWS CLI واسم حاوية S3
تكرار مفتاح API وإصدار النموذج
مفتاح API الأنثروبي واختيار النموذج
معلمات أخرى قابلة للتخصيص
واجهة المستخدم الرسومية على شبكة الإنترنت
سطر الأوامر الأساسي
المزيد من خيارات LLM
خيارات التصدير لتنسيقات المستندات المختلفة (PDF، DOCX، إلخ.)
المساهمات هي موضع ترحيب! لا تتردد في تقديم طلب السحب.
رخصة معهد ماساتشوستس للتكنولوجيا
يستخدم هذا المشروع WhisperX، وهو إصدار متقدم من نموذج Whisper الخاص بـ OpenAI، للنسخ. عروض WhisperX:
النسخ المتسارع
مذكرات المتحدث المتقدمة
تحسين الدقة في تجزئة السماعات
يتم تشغيل نموذج WhisperX عبر Replicate API، استنادًا إلى https://github.com/sidewards/whisperx.