第 2 回マルチモーダル感情認識チャレンジ (MER24) は成功裡に終了し、Soul App 音声テクノロジー チームがセミ トラックでの優れたパフォーマンスで優勝しました。このトラックは難易度が高く競争が激しいことで知られており、参加チームはデータが不足している場合に高い汎化能力を備えた感情認識モデルをトレーニングする必要があります。 Soul チームの成功は、マルチモーダルなデータ理解と感情認識アルゴリズムにおける深い蓄積を証明するだけでなく、ソーシャル分野における AI の感情的相互作用に新たな可能性をもたらし、AI 感情認識テクノロジーの現実の人々への応用を示しています。コンピュータ対話シナリオにおけるアプリケーションは新たな段階に入りました。
人工知能は人間の感情の理解において大きな進歩を遂げました。今月初め、第 2 回マルチモーダル感情認識チャレンジ (MER24) が無事終了しました。この注目を集めるコンテストは、多数の国際的に著名な学者が共同主催し、実際の人間への AI 感情認識テクノロジーの応用を促進することを目的としていました。 -コンピュータ対話シナリオ。
MER24チャレンジには3つのトラックがあり、その中でもセミトラックは難易度の高さと競争の激しさから注目を集めています。セミ トラックでは、参加チームは少量のラベル付きビデオ データと大量のラベルなしビデオ データを使用してモデルをトレーニングし、ラベルなしデータ セットでのモデルのパフォーマンスと汎化能力を評価する必要があります。 Soul App の音声テクノロジー チームは、その革新的な技術ソリューションにより、このトラックで 1 位を獲得しました。
コンテスト公式ウェブサイト:https://zeroqiaaba.github.io/MER2024-website/#organization
Soul チームの成功は、マルチモーダルデータ理解、感情認識アルゴリズム、モデル最適化プラットフォームツール、内部ワークフロー構築などにおける深い蓄積と革新、そして技術チームの効率的なコラボレーションによるものです。データ不足という課題に直面して、Soul チームは、半教師あり学習テクノロジーの改善、マルチモーダル特徴を抽出するための事前トレーニング済みモデルの使用、効果的な特徴融合手法の提案、ビデオとテキストの革新的なモデルなど、さまざまな戦略を採用してきました。モダリティ。
Soul チームの技術ソリューションは、感情認識の精度を向上させるだけでなく、混乱しやすい感情の境界をより適切に区別します。この成果は、Soul がソーシャル分野で AI ラージ モデル テクノロジーを深く培ってきたこと、特にそのマルチモーダルな感情的インタラクション機能を凝縮して表現したものです。
ソーシャル分野では感情型AIの需要が高まっています。感情的な機能を備えた AI を構築することで、ソウルはタスク遂行者から人間の感情的なニーズを満たす仲間への変革を達成しました。 Soul が自社開発した AI Goudan、人狼ファントム ゲーム、異世界応答アプリケーションなどはすべて、擬人化、知識、マルチモダリティ、時間認識などの側面で Soul の統合機能を実証し、ユーザーに豊かで温かみのある AI インタラクティブ体験を提供します。 。
2024年はAIGC適用元年と位置付けられており、ソウルなどの国内企業は自社開発技術の蓄積を通じてAIソーシャルネットワーキング分野で目覚ましい成果を上げている。 Soul は、自社開発の言語と音声の大型モデルに基づいた一連の製品を開発し、AI とユーザーの間の感情的なインタラクション エクスペリエンスを向上させる過程で豊富な革新的技術と実践経験を蓄積してきました。
将来的には、Soul のような技術革新と製品革新を主張するプラットフォームは、ユーザーのための価値を創造し続け、豊かなコンテンツとコミュニティ生態学の形成に基づいて、より永続的で多様なビジネス価値を達成するでしょう。
MER24 チャレンジにおける Soul チームの画期的な進歩は、ソーシャル分野における AI 感情認識テクノロジーの幅広い展望を告げるものであり、将来の AI と人間の間のより自然で感情的な相互作用に対する新たな方向性と動機も提供します。私たちは、感情コンピューティングの分野における AI の継続的な進歩を促進するために、将来的により革新的なテクノロジーの出現を期待しています。