Senta es un sistema de análisis de sentimiento de código abierto desarrollado por Baidu.
El análisis de sentimientos tiene como objetivo identificar y extraer automáticamente información subjetiva como tendencias, posiciones, valoraciones y opiniones en los textos. Incluye una variedad de tareas, como clasificación de emociones a nivel de oración, clasificación de emociones a nivel de objeto de evaluación, extracción de opiniones, clasificación de emociones, etc. El análisis de sentimientos es una importante dirección de investigación de la inteligencia artificial y tiene un alto valor académico. Al mismo tiempo, el análisis de sentimientos tiene aplicaciones importantes en la toma de decisiones de los consumidores, el análisis de la opinión pública, las recomendaciones personalizadas y otros campos, y tiene un alto valor comercial.
Recientemente, Baidu lanzó oficialmente el modelo de preentrenamiento emocional SKEP (Preentrenamiento mejorado del conocimiento del sentimiento para el análisis de sentimientos). SKEP utiliza conocimiento emocional para mejorar el modelo de preentrenamiento y supera a SOTA en 14 tareas típicas de análisis de sentimientos en chino e inglés. Este trabajo ha sido aceptado por ACL 2020.
Para facilitar que el personal de I+D y los socios comerciales compartan tecnología de análisis de sentimiento de vanguardia, Baidu ha abierto el código de preentrenamiento de sentimiento basado en SKEP y los modelos de preentrenamiento de sentimiento en chino e inglés en Senta. Además, para reducir aún más el umbral de usuarios, Baidu ha integrado una herramienta de predicción y análisis de sentimientos con un solo clic para la industrialización en el proyecto de código abierto SKEP. Los usuarios solo necesitan unas pocas líneas de código para implementar funciones de predicción de modelos y preentrenamiento emocional basado en SKEP.
CESTA
SKEP es un algoritmo de preentrenamiento emocional basado en la mejora del conocimiento emocional propuesto por el equipo de investigación de Baidu. Este algoritmo utiliza un método no supervisado para extraer automáticamente el conocimiento emocional y luego usa el conocimiento emocional para construir un objetivo de preentrenamiento para que la máquina. Puede aprender a comprender la semántica emocional. SKEP proporciona una representación semántica emocional poderosa y unificada para diversas tareas de análisis de sentimientos.
El equipo de investigación de Baidu realizó tres tareas típicas de análisis de sentimientos: clasificación de sentimientos a nivel de oración, clasificación de sentimientos a nivel de aspecto y etiquetado de roles de opinión, con un total de 14 datos en chino e inglés. Lo anterior verificó aún más el efecto del entrenamiento previo emocional. modelo SKEP. Los experimentos muestran que utilizando el modelo general de preentrenamiento ERNIE (interno) como inicialización, SKEP mejora en promedio aproximadamente un 1,2% en comparación con ERNIE, y mejora en promedio aproximadamente un 2% en comparación con el SOTA original.