تنزيل Stage Whisper - تنزيل رمز المصدر Stage Whisper

Stage Whisper

شفرة المصدر الأخرى

1.0.0

تنزيل

المرحلة

هذا هو الريبو الرئيسي لـ Whisper-تطبيق نسخ صوتي مجاني ومفتوح المصدر وسهل الاستخدام. يستخدم Stage Whisper نموذج التعلم الآلي Whisper من Openai لإنتاج نسخ دقيقة للغاية من ملفات الصوت ، ويسمح أيضًا للمستخدمين بتخزين وتعديل النسخ باستخدام واجهة مستخدم رسومية بسيطة وبسيطة.

Quickstart

يتكون الهمس المسرح من مكونين متصلان:

ظهر بيثون الذي يتفاعل مع مكتبة همس Openai
واجهة العقدة/الإلكترون التي تعمل بالطاقة

المتطلبات الأساسية

سيتطلب إصدار 1.0 في نهاية المطاف من Stage Whisper (من الناحية المثالية) أي برنامج إضافي. في الوقت الحالي ، ستحتاج إلى التثبيت التالي على جهازك لتطوير الهمس على المسرح. من الممكن حاليًا العمل بشكل منفصل على واجهة الإلكترون أو الواجهة الخلفية لـ Python ، لذلك إذا كنت تخطط للعمل فقط على واحد أو آخر ، فعليك فقط تثبيت المتطلبات الخاصة بهذا المكون.

العقدة (مطلوبة للإلكترون)
الغزل (مطلوب للإلكترون)
بيثون 3.x (مطلوب للواجهة الخلفية)
الصدأ (مطلوب للداخل الخلفي)
FFMPEG (مطلوب للداخل الخلفي)
الشعر (مطلوب للداخل)

هناك أي عدد من الطرق لتثبيت كل هذه التبعيات على محطة العمل الخاصة بك ، ولكن فيما يلي مثال على كيفية تثبيت كل ما سبق على جهاز Mac (تخطي أي خطوة لشيء قمت بتثبيته بالفعل):

 # Install Homebrew
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) "

# Install Python, Node, Rust, ffmpeg, and Yarn
brew install python node rust ffmpeg yarn

# Install Poetry
curl -sSL https://install.python-poetry.org | POETRY_HOME=/etc/poetry python3 -

تشغيل بيثون الخلفية

تثبيت التبعيات:

 cd backend
poetry install

على الرغم من أن الغرض الأساسي للواجهة الخلفية سيكون تشغيله كخدمة لتطبيق الإلكترون للاتصال به ، إلا أنه يمكن أيضًا تشغيله كنص مستقل. للقيام بذلك ، قم بالتشغيل:

poetry run python stagewhisper --input /path/to/audio/file.mp3

تشغيل واجهة الإلكترون

 cd electron
yarn
yarn dev

هدف

في وقت سابق من هذا العام ، أصدرت Openai Whisper ، نظام التعرف على الكلام التلقائي (ASR) الذي يتم تدريبه على "680،000 ساعة من البيانات التي يتم جمعها من المهام المتعددة والمهام التي تم جمعها من الويب." يمكنك معرفة المزيد من خلال قراءة الورقة [PDF] أو النظر إلى الأمثلة على موقع Openai.

كما لاحظ دان نغوين على تويتر ، يمكن أن يكون هذا "هبة من أجل غرف الأخبار".

المشكلة الوحيدة ، كما أشار @stpetersterne ، هي أن جميع الصحفيين (أو غيرهم ممن يمكنهم الاستفادة من هذا النوع من أدوات النسخ) مرتاحون لخط الأوامر وتثبيت التبعيات المطلوبة لتشغيل الهمس.

هدفنا هو حزم الهمس بطريقة أسهل في الاستخدام بحيث يمكن للمستخدمين التقنيين الاستفادة من هذه الشبكة العصبية.

جاء بيتر باسم المشروع ، المسرح الهاوية.

من يشارك

أنشأت @Petersterne و @Filmgirl (كريستينا وارن) المشروع ، و @Harrislapiroff و @crazy4pi314 (سارة كايزر) يقودون التطوير مع Oenu (Adam Newton-Flows) قيادة تطوير الواجهة.

نود أن نتعاون مع أي شخص لديه أفكار حول كيفية حزم Whisper بسهولة أكبر وتجعل من السهل استخدامه للمستخدمين غير التقنيين.

حالة المشروع

المشروع حاليا في المراحل المبكرة من التطوير. لدينا نموذج أولي يعمل يستخدم أطر الإلكترون والموانتين لإنشاء تطبيق يتيح للمستخدمين إدخال ملفات الصوت ، ونسخها باستخدام Whisper ، ثم إدارة النسخ الناتجة وتحريرها. سيكون التطبيق متاحًا لـ MacOS و Windows و Linux. نحن نعمل حاليًا على تنفيذ التحسينات الرئيسية ونأمل في إصدار نسخة تجريبية قريبًا.

طلب الميزات أو طرح أسئلة حول مناقشات المشروع على Github.
تجد خطأ؟ افتح مشكلة حتى نتمكن من رؤية كيف يمكننا إصلاحها.
تريد المساهمة؟ تحقق من مشكلاتنا الأولى الجيدة ودليلنا المساهمين.
انضم إلى Discord Server لمناقشة تخطيط المشروع وتطويره.

رخصة

سيتم فتح أي رمز نقوم بتوزيعه واتباع شروط ترخيص أي من المشاريع التي نستخدمها. تم ترخيص Whisper ، لكن بعض تبعياتها (FFMPEG) مرخصة بموجب شروط مختلفة. سنكون متأكدين من الالتزام بأي/جميع شروط الترخيص ، وفي حالة عدم تمكننا من تجميع FFMPEG مع الهمس على المسرح ، سنجعل من السهل الحصول عليها قدر الإمكان للمستخدم النهائي. سيتم ترخيص أي رمز خاص بالهمس بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-01
الحجم 1.86MB
من Github

تطبيقات ذات صلة

أداة الصور المرحلة من Dell

2024-11-09
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
مسرح هاتسوني ميكو الملون

2024-09-29
نظام خدمة العملاء مفتوح المصدر بالكامل عبر الإنترنت PC+حساب رسمي+APP+H5+برنامج صغير لخدمة العملاء WHISPER

2022-09-26

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
chat.petals.dev

شفرة المصدر الأخرى

1.0.0
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل