Senta est un système open source d'analyse des sentiments développé par Baidu.
L'analyse des sentiments vise à identifier et extraire automatiquement des informations subjectives telles que les tendances, les positions, les évaluations et les opinions dans les textes. Il comprend une variété de tâches, telles que la classification des émotions au niveau de la phrase, la classification des émotions au niveau de l'objet d'évaluation, l'extraction d'opinions, la classification des émotions, etc. L’analyse des sentiments est une direction de recherche importante en intelligence artificielle et a une grande valeur académique. Dans le même temps, l'analyse des sentiments a des applications importantes dans la prise de décision des consommateurs, l'analyse de l'opinion publique, les recommandations personnalisées et d'autres domaines, et a une grande valeur commerciale.
Récemment, Baidu a officiellement publié le modèle de pré-formation émotionnelle SKEP (Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis). SKEP utilise les connaissances émotionnelles pour améliorer le modèle de pré-formation et surpasse SOTA dans 14 tâches typiques d'analyse des sentiments en chinois et en anglais. Ce travail a été accepté par l'ACL 2020.
Afin de permettre au personnel de R&D et aux partenaires commerciaux de partager une technologie de pointe d'analyse des sentiments, Baidu a mis en open source le code de pré-formation des sentiments basé sur SKEP et les modèles de pré-formation des sentiments en chinois et en anglais dans Senta. De plus, afin d'abaisser davantage le seuil d'utilisation, Baidu a intégré un outil d'analyse et de prédiction des sentiments en un clic pour l'industrialisation dans le projet open source SKEP. Les utilisateurs n'ont besoin que de quelques lignes de code pour implémenter des fonctions de pré-entraînement émotionnel et de prédiction de modèle basées sur SKEP.
Ignorer
SKEP est un algorithme de pré-entraînement émotionnel basé sur l'amélioration des connaissances émotionnelles proposé par l'équipe de recherche de Baidu. Cet algorithme utilise une méthode non supervisée pour exploiter automatiquement les connaissances émotionnelles, puis utilise les connaissances émotionnelles pour construire une cible de pré-entraînement, de sorte que la machine. peut apprendre à comprendre la sémantique émotionnelle. SKEP fournit une représentation sémantique émotionnelle unifiée et puissante pour diverses tâches d'analyse des sentiments.
L'équipe de recherche de Baidu a effectué trois tâches typiques d'analyse des sentiments : la classification des sentiments au niveau de la phrase, la classification des sentiments au niveau de l'aspect et l'étiquetage des rôles d'opinion, avec un total de 14 données en chinois et en anglais. Les éléments ci-dessus ont permis de vérifier davantage l'effet de la pré-formation émotionnelle. modèle SKEP. Les expériences montrent qu'en utilisant le modèle général de pré-formation ERNIE (interne) comme initialisation, SKEP s'améliore d'environ 1,2 % en moyenne par rapport à ERNIE, et s'améliore d'environ 2 % en moyenne par rapport au SOTA d'origine.