Senta是一款百度開源的情緒分析系統。
情緒分析旨在自動辨識和提取文本中的傾向、立場、評價、觀點等主觀資訊。它包含各式各樣的任務,例如句子層級情緒分類、評估對象層級情緒分類、觀點抽取、情緒分類等。情感分析是人工智慧的重要研究方向,具有很高的學術價值。同時,情感分析在消費決策、輿情分析、個人化推薦等領域均有重要的應用,且具有很高的商業價值。
近日,百度正式發布情緒預訓練模型SKEP(Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis)。 SKEP利用情緒知識增強預訓練模型, 在14項中英情感分析典型任務上全面超越SOTA,此工作已被ACL 2020錄取。
為了方便研發人員和商業夥伴共享效果領先的情緒分析技術,本次百度在Senta中開源了基於SKEP的情緒預訓練程式碼和中英情緒預訓練模式。而且,為了進一步降低使用者的使用門檻,百度在SKEP開源專案中整合了以產業化為導向的一鍵情緒分析預測工具。使用者只需要幾行程式碼即可實現基於SKEP的情緒預訓練以及模型預測功能。
SKEP
SKEP是百度研究團隊提出的基於情感知識增強的情緒預訓練演算法,此演算法採用無監督方法自動挖掘情緒知識,然後利用情緒知識建構預訓練目標,讓機器學會理解情緒語意。 SKEP為各類情感分析任務提供統一且強大的情緒語意表示。
百度研究團隊在三個典型情感分析任務,句子層級情感分類(Sentence-level Sentiment Classification),評估物件層級情感分類(Aspect-level Sentiment Classification)、觀點抽取(Opinion Role Labeling),共14個中英文資料上進一步驗證了情緒預訓練模型SKEP的效果。實驗顯示,以通用預訓練模型ERNIE(內部)作為初始化,SKEP相比ERNIE平均提升約1.2%,並且較原始SOTA平均提升約2%。