El segundo Desafío de Reconocimiento de Emociones Multimodal (MER24) concluyó con éxito y el equipo de tecnología de voz de Soul App ganó el campeonato con su excelente desempeño en la pista Semi. La pista es conocida por su alta dificultad y feroz competencia, lo que requiere que los equipos participantes entrenen modelos de reconocimiento de emociones con altas capacidades de generalización cuando los datos son escasos. El éxito del equipo de Soul no solo demuestra su profunda acumulación en algoritmos de reconocimiento de emociones y comprensión de datos multimodales, sino que también proporciona nuevas posibilidades para la interacción emocional de la IA en el campo social, lo que marca la aplicación de la tecnología de reconocimiento de emociones de la IA a personas reales. La aplicación en escenarios de interacción informática ha entrado en una nueva etapa.
La inteligencia artificial ha logrado avances significativos en la comprensión de las emociones humanas. A principios de este mes, concluyó con éxito el segundo Desafío de reconocimiento de emociones multimodal (MER24). Esta competencia de alto perfil fue patrocinada conjuntamente por varios académicos de renombre internacional y tenía como objetivo promover la aplicación de la tecnología de reconocimiento de emociones de IA en humanos reales. -escenarios de interacción informática.
El MER24 Challenge cuenta con tres pistas, de las cuales la Semipista ha llamado mucho la atención por su alta dificultad y feroz competencia. La Semi pista requiere que los equipos participantes utilicen una pequeña cantidad de datos de video etiquetados y una gran cantidad de datos de video sin etiquetar para entrenar el modelo y evaluar el rendimiento y la capacidad de generalización del modelo en el conjunto de datos sin etiquetar. El equipo de tecnología de voz de Soul App ganó el primer lugar en esta pista con sus innovadoras soluciones técnicas.
Sitio web oficial del concurso: https://zeroqiaoba.github.io/MER2024-website/#organization
El éxito del equipo de Soul se debe a su profunda acumulación e innovación en comprensión de datos multimodales, algoritmos de reconocimiento de emociones, herramientas de plataforma de optimización de modelos, construcción de flujo de trabajo interno, etc., así como a la colaboración eficiente del equipo técnico. Ante el desafío de la escasez de datos, el equipo de Soul ha adoptado una variedad de estrategias, incluida la mejora de la tecnología de aprendizaje semisupervisada, el uso de modelos previamente entrenados para extraer características multimodales, la propuesta de métodos efectivos de fusión de características y modelos innovadores para video y texto. modalidades.
La solución técnica del equipo de Soul no sólo mejora la precisión del reconocimiento de emociones, sino que también distingue mejor los límites emocionales que se confunden fácilmente. Este logro es una expresión concentrada del profundo cultivo de Soul de la tecnología de modelos grandes de IA en el campo social, especialmente sus capacidades de interacción emocional multimodal.
Existe una demanda creciente de IA emocional en el ámbito social. Al construir una IA con capacidades emocionales, Soul ha logrado la transformación de un ejecutante de tareas a un compañero que satisface las necesidades emocionales humanas. El AI Goudan de desarrollo propio de Soul, el juego Werewolf Phantom, la aplicación Different World Response, etc., demuestran las capacidades de integración de Soul en personificación, conocimiento, multimodalidad, percepción del tiempo y otros aspectos, brindando a los usuarios experiencias interactivas de AI ricas y cálidas. .
2024 se considera el primer año de la aplicación de AIGC. Empresas nacionales como Soul han logrado resultados notables en la dirección de las redes sociales de IA mediante la acumulación de tecnología de desarrollo propio. Soul ha incubado una serie de productos basados en grandes modelos de lenguaje y habla de desarrollo propio, y ha acumulado ricas tecnologías innovadoras y experiencia práctica en el proceso de mejorar la experiencia de interacción emocional entre la IA y los usuarios.
En el futuro, plataformas como Soul que insisten en la innovación tecnológica y de productos continuarán creando valor para los usuarios y lograrán un valor comercial más duradero y diversificado basado en la formación de un contenido próspero y una ecología comunitaria.
El gran avance logrado por el equipo de Soul en el desafío MER24 presagia las amplias perspectivas de la tecnología de reconocimiento de emociones de IA en el campo social y también proporciona nuevas direcciones y motivación para interacciones más naturales y emocionales entre la IA y los humanos en el futuro. Esperamos con interés la aparición de tecnologías más innovadoras en el futuro para promover el progreso continuo de la IA en el campo de la informática afectiva.