أصدرت Nexa AI أحدث طراز للغة الصوتية OmniAudio-2.6B، وهي أداة قوية مُحسّنة للأجهزة المتطورة. فهو يدمج التعرف التلقائي على الكلام (ASR) ونماذج اللغة في إطار موحد، مما يحسن بشكل كبير من سرعة وكفاءة المعالجة، ويحل مشاكل عدم الكفاءة والتأخير الناجمة عن الاتصالات بين المكونات في البنى التقليدية. يعد هذا النموذج مناسبًا بشكل خاص للأجهزة ذات موارد الحوسبة المحدودة، مثل الأجهزة القابلة للارتداء وأنظمة السيارات وأجهزة إنترنت الأشياء.
أطلقت Nexa AI مؤخرًا نموذج اللغة الصوتية الجديد OmniAudio-2.6B، المصمم لتلبية احتياجات النشر الفعال للأجهزة المتطورة. على عكس البنى التقليدية التي تفصل بين التعرف التلقائي على الكلام (ASR) ونماذج اللغة، يقوم OmniAudio-2.6B بدمج Gemma-2-2b وWhisper Turbo وأجهزة العرض المخصصة في إطار موحد يعد ربط المكونات المختلفة في الشبكة مناسبًا بشكل خاص للأجهزة ذات موارد الحوسبة المحدودة.
أبرز النقاط:
سرعة المعالجة: OmniAudio-2.6B يتفوق في الأداء. على جهاز 2024Mac Mini M4Pro، باستخدام Nexa SDK وباستخدام تنسيق FP16GGUF، حقق النموذج 35.23 رمزًا مميزًا في الثانية، و66 رمزًا مميزًا في الثانية بتنسيق Q4_K_M GGUF. بالمقارنة، يمكن لـ Qwen2-Audio-7B التعامل مع 6.38 رمزًا مميزًا في الثانية فقط على أجهزة مماثلة، مما يدل على ميزة كبيرة في السرعة. كفاءة الموارد: يقلل التصميم المدمج للنموذج من الاعتماد على الموارد السحابية، مما يجعله مثاليًا للأجهزة القابلة للارتداء ذات الطاقة وعرض النطاق الترددي، وأنظمة السيارات، وأجهزة إنترنت الأشياء. تتيح هذه الميزة التشغيل الفعال في ظل ظروف الأجهزة المحدودة. دقة ومرونة عالية: على الرغم من أن OmniAudio-2.6B يركز على السرعة والكفاءة، إلا أنه يعمل أيضًا بشكل جيد من حيث الدقة وهو مناسب لمجموعة متنوعة من المهام مثل النسخ والترجمة والتلخيص وما إلى ذلك. سواء أكان الأمر يتعلق بمعالجة الكلام في الوقت الفعلي أو المهام اللغوية المعقدة، يمكن أن يوفر OmniAudio-2.6B نتائج دقيقة.
يمثل إطلاق OmniAudio-2.6B تقدمًا مهمًا آخر لـ Nexa AI في مجال نماذج اللغة الصوتية، ولا تعمل بنيتها المحسنة على تحسين سرعة المعالجة وكفاءتها فحسب، بل توفر أيضًا المزيد من الإمكانيات لأجهزة الحوسبة المتطورة. مع استمرار تزايد شعبية إنترنت الأشياء والأجهزة القابلة للارتداء، من المتوقع أن يلعب OmniAudio-2.6B دورًا مهمًا في سيناريوهات التطبيقات المتعددة.
عنوان النموذج: https://huggingface.co/NexaAIDev/OmniAudio-2.6B
عنوان المنتج: https://nexa.ai/blogs/omniaudio-2.6b
بشكل عام، أحدث OmniAudio-2.6B تغييرات ثورية في معالجة الصوت على الأجهزة المتطورة بفضل بنيته الفعالة وأدائه الممتاز، مما يضع أساسًا متينًا لنشر تطبيقات الذكاء الاصطناعي على نطاق واسع في المستقبل. إن ابتكار Nexa AI يستحق التطلع إليه.