أصدرت كيوتاي ، مختبر أبحاث الذكاء الاصطناعي غير الربحي في فرنسا ، مؤخرًا مساعد صوتي يسمى Moshi ، والذي يمثل اختراقًا كبيرًا في تكنولوجيا النموذج الأساسي المتعدد الوسائط الأصلي في الوقت الحقيقي. كنموذج ثوري من الذكاء الاصطناعي ، لا يقلد موشي فقط GPT-4O من Openai في بعض الوظائف الأساسية ، ولكنه يحقق أيضًا تجاوزًا كبيرًا ، مما يفتح اتجاهات تطوير جديدة لتكنولوجيا التفاعل الصوتي.
بوابة المنتج: https://top.aibase.com/tool/moshi- Chat
ميزة موشي الأكثر لقبًا هي مهاراتها العاطفية الممتازة والتعبير. هذا المساعد الصوتي قادر على المحادثات الطبيعية في مجموعة متنوعة من لهجات ، بما في ذلك المتغيرات اللغوية المتعددة ، بما في ذلك الفرنسية. الأمر الأكثر إثارة للدهشة هو أن موشي يمكنه معالجة إدخال الصوت والإخراج الصوتي في نفس الوقت ، وأثناء الحفاظ على التواصل السلس للتفكير في النص ، يعرض 70 مشاعر إنسانية مختلفة وأنماط التحدث ، مما يحسن إلى حد كبير من الطبيعة والتقارب بين التفاعل بين الإنسان والحاسوب .
فيما يتعلق بالتنفيذ الفني ، يتبنى Moshi آلية فريدة من نوعها لدفق الصوت المزدوج تتيح التفاعل الحقيقي في الوقت الفعلي. يتم دعم ميزة الاختراق هذه من خلال الدعم القوي للهيليوم ، وهو نموذج لغة معلمة 7 مليارات تم تطويره بواسطة Kyutai.
لضمان جودة صوت موشي وتجربة المستخدم ، أجرى فريق Kyutai عملية صعبة دقيقة. من خلال تقنية النص إلى الكلام (TTS) ، قام الفريق بتحويل 100000 محادثات صناعية "النمط المنطوق" وتدريبها باستخدام البيانات الاصطناعية التي تم إنشاؤها بواسطة نموذج TTS آخر. أسفرت هذه الجهود في النهاية عن تحقيق موشي لم الكمون المذهل من طرف إلى طرف ، مما يوفر للمستخدمين تجربة استجابة شبه ثابتة.
بالنظر إلى احتياجات المستخدمين المختلفين ، قام Kyutai أيضًا بتطوير نسخة خفيفة الوزن من Moshi. يمكن أن يعمل هذا الإصدار الأمثل بسلاسة على وحدات معالجة الرسومات MacBook أو المستهلك ، مما يقلل بشكل كبير من الحاجز المراد استخدامه والسماح بقاعدة مستخدمين أوسع لتجربة تقنية التفاعل الصوتي المتقدمة هذه.
باعتباره أحدث إنجاز لمختبر Kyutai ، لا يوضح Moshi فقط الإمكانات الضخمة لتكنولوجيا الصوت الذكاء الاصطناعى ، ولكنها توفر أيضًا إمكانيات جديدة لطرق تفاعل الحاسوب البشرية في المستقبل. من الفهم العاطفي إلى الدعم متعدد اللغات ، من التفاعل في الوقت الفعلي إلى النشر الخفيف ، تعكس كل ميزة من موشي روح كيوتاي المبتكرة والقوة التقنية في مجال أبحاث الذكاء الاصطناعي.