انتهى التحدي الثاني للتعرف على المشاعر متعدد الوسائط (MER24) بنجاح، وفاز فريق التكنولوجيا الصوتية لتطبيق Soul بالبطولة بأدائه الممتاز على المسار النصف. يُعرف المسار بصعوبة عالية ومنافسة شرسة، مما يتطلب من الفرق المشاركة تدريب نماذج التعرف على المشاعر بقدرات تعميمية عالية عندما تكون البيانات نادرة. لا يُظهر نجاح فريق Soul تراكمه العميق في فهم البيانات متعددة الوسائط وخوارزميات التعرف على المشاعر فحسب، بل يوفر أيضًا إمكانيات جديدة للتفاعل العاطفي للذكاء الاصطناعي في المجال الاجتماعي، مما يشير إلى تطبيق تقنية التعرف على المشاعر بالذكاء الاصطناعي على أشخاص حقيقيين لقد دخل التطبيق في سيناريوهات التفاعل مع الكمبيوتر مرحلة جديدة.
حقق الذكاء الاصطناعي تقدمًا كبيرًا في فهم المشاعر الإنسانية. في بداية هذا الشهر، اختُتم بنجاح التحدي الثاني للتعرف على المشاعر متعدد الوسائط (MER24)، وقد تمت رعاية هذه المسابقة رفيعة المستوى بشكل مشترك من قبل عدد من العلماء المشهورين عالميًا وتهدف إلى تعزيز تطبيق تقنية التعرف على المشاعر بالذكاء الاصطناعي في الإنسان الحقيقي. - سيناريوهات التفاعل مع الكمبيوتر.
يتكون تحدي MER24 من ثلاثة مسارات، وقد جذب المسار شبه منها الكثير من الاهتمام بسبب صعوبته العالية والمنافسة الشرسة. يتطلب المسار شبه من الفرق المشاركة استخدام كمية صغيرة من بيانات الفيديو المُسمى وكمية كبيرة من بيانات الفيديو غير المُسمى لتدريب النموذج وتقييم أداء النموذج وقدرته على التعميم على مجموعة البيانات غير المُسمى. فاز فريق التكنولوجيا الصوتية في Soul App بالمركز الأول في هذا المسار بحلوله التقنية المبتكرة.
الموقع الرسمي للمسابقة: https://zeroqiaoba.github.io/MER2024-website/#organization
يرجع نجاح فريق Soul إلى تراكمه العميق وابتكاره في فهم البيانات متعددة الوسائط، وخوارزميات التعرف على المشاعر، وأدوات النظام الأساسي لتحسين النماذج، وبناء سير العمل الداخلي، وما إلى ذلك، بالإضافة إلى التعاون الفعال للفريق الفني. في مواجهة التحدي المتمثل في ندرة البيانات، اعتمد فريق Soul مجموعة متنوعة من الاستراتيجيات، بما في ذلك تحسين تكنولوجيا التعلم شبه الخاضع للإشراف، واستخدام نماذج مدربة مسبقًا لاستخراج ميزات متعددة الوسائط، واقتراح طرق دمج الميزات الفعالة، ونماذج مبتكرة للفيديو والنص الطرائق.
لا يعمل الحل الفني الذي يقدمه فريق Soul على تحسين دقة التعرف على المشاعر فحسب، بل يميز أيضًا الحدود العاطفية التي يسهل الخلط بينها بشكل أفضل. يعد هذا الإنجاز تعبيرًا مركزًا عن تنمية Soul العميقة لتكنولوجيا النماذج الكبيرة للذكاء الاصطناعي في المجال الاجتماعي، وخاصة قدرات التفاعل العاطفي متعدد الوسائط.
هناك طلب متزايد على الذكاء الاصطناعي العاطفي في المجال الاجتماعي. ومن خلال بناء ذكاء اصطناعي يتمتع بقدرات عاطفية، حققت Soul التحول من مؤدي المهام إلى رفيق يلبي الاحتياجات العاطفية البشرية. تُظهر كل من AI Goudan التي طورتها Soul، ولعبة Werewolf Phantom، وتطبيق الاستجابة العالمية المختلفة، وما إلى ذلك، قدرات Soul التكاملية في التجسيد والمعرفة والوسائط المتعددة وإدراك الوقت والجوانب الأخرى، مما يوفر للمستخدمين تجارب تفاعلية غنية ودافئة بالذكاء الاصطناعي .
يعتبر عام 2024 هو العام الأول لتطبيق AIGC، وقد حققت الشركات المحلية مثل Soul نتائج ملحوظة في اتجاه الشبكات الاجتماعية للذكاء الاصطناعي من خلال تراكم التكنولوجيا المطورة ذاتيًا. احتضنت شركة Soul سلسلة من المنتجات القائمة على نماذج كبيرة من اللغة والكلام المطورة ذاتيًا، وتراكمت لديها تقنيات مبتكرة غنية وخبرة عملية في عملية تحسين تجربة التفاعل العاطفي بين الذكاء الاصطناعي والمستخدمين.
في المستقبل، ستستمر منصات مثل Soul، التي تصر على الابتكار التكنولوجي والمنتجات، في خلق قيمة للمستخدمين وتحقيق قيمة أعمال أكثر استدامة وتنوعًا بناءً على تكوين محتوى مزدهر وبيئة مجتمعية.
يبشر التقدم المذهل الذي حققه فريق Soul في تحدي MER24 بآفاق واسعة لتقنية التعرف على المشاعر بالذكاء الاصطناعي في المجال الاجتماعي، كما يوفر اتجاهات ودوافع جديدة لمزيد من التفاعلات الطبيعية والعاطفية بين الذكاء الاصطناعي والبشر في المستقبل. ونحن نتطلع إلى ظهور المزيد من التقنيات المبتكرة في المستقبل لتعزيز التقدم المستمر للذكاء الاصطناعي في مجال الحوسبة العاطفية.