مجموعة من التأثيرات والمولدات والمحللات المدعمة بالذكاء الاصطناعي لبرنامج Audacity®. تعمل ميزات الذكاء الاصطناعي هذه بنسبة 100% محليًا على جهاز الكمبيوتر الخاص بك؟ - لا يوجد اتصال بالإنترنت ضروري! يتم استخدام OpenVINO™ لتشغيل نماذج الذكاء الاصطناعي على المسرعات المدعومة الموجودة في نظام المستخدم مثل وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU) ووحدة المعالجة العصبية (NPU).
فصل الموسيقى - قم بفصل مسار أحادي أو استريو إلى سيقان فردية - الطبول، والباس، والغناء، والآلات الأخرى.
قمع الضوضاء - يزيل ضوضاء الخلفية من عينة صوتية.
إنشاء الموسيقى واستمرارها - يستخدم MusicGen LLM لإنشاء مقتطفات من الموسيقى، أو لإنشاء استمرار لمقتطف موجود من الموسيقى.
Whisper Transcription - يستخدم whisper.cpp لإنشاء مسار تسمية يحتوي على النسخ أو الترجمة لمجموعة محددة من الصوت أو الغناء المنطوق.
انتقل هنا للعثور على حزم التثبيت والتعليمات الخاصة بأحدث إصدار من Windows.
تعليمات بناء ويندوز
تعليمات بناء لينكس
نحن نرحب بكم لتقديم قضية هنا ل
أسئلة
تقارير الأخطاء
طلبات الميزة
ردود الفعل من أي نوع - كيف يمكننا تحسين هذا المشروع؟
مساهماتك موضع ترحيب وتقدير، مهما كانت كبيرة أو صغيرة. لا تتردد في تقديم طلب السحب!
فريق تطوير Audacity® ومجموعة Muse - شكرًا لك على دعمك!
Audacity® جيثب - https://github.com/audacity/audacity
يستخدم محلل النسخ والترجمة Whisper whisper.cpp (مع الواجهة الخلفية OpenVINO™): https://github.com/ggerganov/whisper.cpp
يستخدم إنشاء الموسيقى واستمرارها نموذج MusicGen من Meta.
لدينا حاليًا دعم لـ MusicGen-Small وMusicGen-Small-Stereo
تم نقل خطوط أنابيب txt-to-music من python إلى C++، بالإشارة إلى المنطق من مشروع Hugging Face Transformers: https://github.com/huggingface/transformers
يستخدم تأثير فصل الموسيقى نموذج Meta's Demucs v4 (https://github.com/facebookresearch/demucs)، والذي تم نقله للعمل مع OpenVINO™
قمع الضوضاء:
نقل النماذج وخط الأنابيب من هنا: https://github.com/Rikorose/DeepFilterNet
لقد استفدنا أيضًا من شوكة/فرع @grazder (https://github.com/grazder/DeepFilterNet/tree/torchDF-changes) لفهم تنفيذ Rust بشكل أفضل، ولذلك قمنا أيضًا ببناء بعض تطبيقات C++ لدينا على torch_df_offline.py
وجدت هنا.
الاستشهادات:
@inproceedings{schroeter2022deepfilternet2,title = {{DeepFilterNet2}: نحو تحسين الكلام في الوقت الفعلي على الأجهزة المضمنة للصوت كامل النطاق}، المؤلف = {Schröter، Hendrik and Escalante-B.، Alberto N. and Rosenkranz، Tobias and Maier، Andreas},booktitle={17 ورشة العمل الدولية للصوتيات تحسين الإشارة (IWAENC 2022)}، السنة = {2022}، } @inproceedings{schroeter2023deepfilternet3,title = {{DeepFilterNet}: تحسين الكلام في الوقت الحقيقي المحفز للإدراك الحسي},author = {Schröter, Hendrik and Rosenkranz, Tobias and Escalante-B., Alberto N. and Maier, Andreas},booktitle={ حوار}، سنة = {2023}، }
Noise-suppression-denseunet-ll: من OpenVINO™'s Open Model Zoo: https://github.com/openvinotoolkit/open_model_zoo
DeepFilterNet2 وDeepFilterNet3:
دفاتر ملاحظات OpenVINO™ - لقد تعلمنا الكثير من هذه المجموعة الرائعة من دفاتر ملاحظات python، وما زلنا نستخدمها لتعلم أحدث/أفضل الممارسات لتنفيذ مسارات الذكاء الاصطناعي باستخدام OpenVINO™!