Senta ist ein von Baidu entwickeltes Open-Source-Stimmungsanalysesystem.
Ziel der Sentimentanalyse ist es, subjektive Informationen wie Tendenzen, Positionen, Bewertungen und Meinungen in Texten automatisch zu identifizieren und zu extrahieren. Es umfasst eine Vielzahl von Aufgaben, wie z. B. Emotionsklassifizierung auf Satzebene, Bewertungsklassifizierung von Emotionen auf Objektebene, Meinungsextraktion, Emotionsklassifizierung usw. Die Stimmungsanalyse ist eine wichtige Forschungsrichtung der künstlichen Intelligenz und hat einen hohen akademischen Wert. Gleichzeitig hat die Stimmungsanalyse wichtige Anwendungen bei der Entscheidungsfindung von Verbrauchern, bei der Analyse der öffentlichen Meinung, bei personalisierten Empfehlungen und in anderen Bereichen und hat einen hohen kommerziellen Wert.
Kürzlich hat Baidu offiziell das emotionale Pre-Training-Modell SKEP (Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis) veröffentlicht. SKEP nutzt emotionales Wissen, um das Pre-Training-Modell zu verbessern und übertrifft SOTA bei 14 typischen chinesischen und englischen Stimmungsanalyseaufgaben. Diese Arbeit wurde von ACL 2020 angenommen.
Um F&E-Mitarbeitern und Geschäftspartnern den Austausch modernster Sentiment-Analysetechnologie zu erleichtern, hat Baidu den SKEP-basierten Sentiment-Pre-Training-Code sowie chinesische und englische Sentiment-Pre-Training-Modelle in Senta als Open Source bereitgestellt. Um die Benutzerschwelle weiter zu senken, hat Baidu außerdem ein One-Click-Sentimentanalyse- und Vorhersagetool für die Industrialisierung in das Open-Source-Projekt SKEP integriert. Benutzer benötigen nur wenige Codezeilen, um SKEP-basierte emotionale Vortrainings- und Modellvorhersagefunktionen zu implementieren.
SKEP
SKEP ist ein emotionaler Pre-Training-Algorithmus, der vom Baidu-Forschungsteam vorgeschlagen wurde. Dieser Algorithmus verwendet eine unbeaufsichtigte Methode, um emotionales Wissen automatisch zu extrahieren, und verwendet dann das emotionale Wissen, um ein Pre-Training-Ziel zu erstellen, sodass die Maschine kann lernen, emotionale Semantik zu verstehen. SKEP bietet eine einheitliche und leistungsstarke emotionale semantische Darstellung für verschiedene Aufgaben der Stimmungsanalyse.
Das Baidu-Forschungsteam führte drei typische Stimmungsanalyseaufgaben durch: Stimmungsklassifizierung auf Satzebene, Stimmungsklassifizierung auf Aspektebene und Markierung der Meinungsrolle, wobei insgesamt 14 chinesische und englische Daten verwendet wurden. Das Obige verifizierte die Wirkung des emotionalen Vortrainings weiter Modell SKEP. Experimente zeigen, dass sich SKEP bei Verwendung des allgemeinen Vortrainingsmodells ERNIE (intern) als Initialisierung im Vergleich zu ERNIE um durchschnittlich etwa 1,2 % und im Vergleich zum ursprünglichen SOTA um durchschnittlich etwa 2 % verbessert.