تطلق Nvidia نموذجًا جديدًا للتعرف على الكلام مدعومًا بالذكاء الاصطناعي Parakeet، ويُقال إنه أفضل من Whisper

الكاتب：Eve Cole وقت التحديث：2025-01-22 09:00:03

أطلقت NVIDIA NeMo سلسلة نماذج Parakeet ASR، وهو نموذج متقدم للتعرف التلقائي على الكلام (ASR) يمكنه نسخ اللغة الإنجليزية المنطوقة بدقة. ويمثل هذا النموذج، الذي تم تطويره بالشراكة مع NVIDIA NeMo وSuno.ai، إنجازًا كبيرًا في تكنولوجيا التعرف على الكلام. وستعمل قدراته العالية الدقة على نسخ الكلام على تحسين كفاءة وطبيعية التفاعل بين الإنسان والحاسوب بشكل كبير، مما يوفر آفاقًا للتطبيقات المبتكرة في جميع مناحي الحياة. لا شك أن إطلاق نموذج Parakeet ASR سيعزز التطبيق الواسع النطاق للتكنولوجيا الصوتية في المزيد من المجالات ويوفر دعمًا فنيًا قويًا للتطوير الذكي في المستقبل.

أطلقت NVIDIA NeMo، مجموعة أدوات المحادثة الرائدة مفتوحة المصدر المعتمدة على الذكاء الاصطناعي، سلسلة نماذج Parakeet ASR، وهي سلسلة من أحدث نماذج التعرف التلقائي على الكلام (ASR) القادرة على نسخ اللغة الإنجليزية المنطوقة بدقة مذهلة. تم تطوير نموذج Parakeet ASR بالشراكة مع Suno.ai، وهو يمثل طفرة في مجال التعرف على الكلام، مما يمهد الطريق لمزيد من التفاعل الطبيعي والفعال بين الإنسان والحاسوب.

لا يؤدي إطلاق نموذج Parakeet ASR إلى تحسين دقة التعرف على الكلام فحسب، بل الأهم من ذلك أنه يوفر أساسًا متينًا لبناء نظام تفاعل أكثر طبيعية وكفاءة بين الإنسان والحاسوب، مما يشير إلى إمكانيات غير محدودة لتطبيقات تكنولوجيا الكلام المستقبلية. ومن المتوقع أن يدعم هذا النموذج المزيد من اللغات ويتم تطبيقه على نطاق أوسع من السيناريوهات في المستقبل.