Senta adalah sistem analisis sentimen open source yang dikembangkan oleh Baidu.
Analisis sentimen bertujuan untuk secara otomatis mengidentifikasi dan mengekstrak informasi subjektif seperti kecenderungan, posisi, evaluasi, dan opini dalam teks. Ini mencakup berbagai tugas, seperti klasifikasi emosi tingkat kalimat, klasifikasi emosi tingkat objek evaluasi, ekstraksi opini, klasifikasi emosi, dll. Analisis sentimen merupakan arah penelitian kecerdasan buatan yang penting dan memiliki nilai akademis yang tinggi. Pada saat yang sama, analisis sentimen memiliki aplikasi penting dalam pengambilan keputusan konsumen, analisis opini publik, rekomendasi yang dipersonalisasi, dan bidang lainnya, serta memiliki nilai komersial yang tinggi.
Baru-baru ini, Baidu secara resmi merilis model pra-pelatihan emosional SKEP (Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis). SKEP menggunakan pengetahuan emosional untuk meningkatkan model pra-pelatihan dan melampaui SOTA dalam 14 tugas analisis sentimen khas Tiongkok dan Inggris.
Untuk memfasilitasi personel penelitian dan pengembangan serta mitra bisnis untuk berbagi teknologi analisis sentimen terdepan, Baidu telah membuka sumber kode pra-pelatihan sentimen berbasis SKEP dan model pra-pelatihan sentimen berbahasa Mandarin dan Inggris di Senta. Selain itu, untuk lebih menurunkan ambang batas pengguna, Baidu telah mengintegrasikan analisis sentimen sekali klik dan alat prediksi industrialisasi ke dalam proyek sumber terbuka SKEP. Pengguna hanya memerlukan beberapa baris kode untuk mengimplementasikan fungsi pra-pelatihan emosional dan prediksi model berbasis SKEP.
SKEP
SKEP adalah algoritma pra-pelatihan emosional berdasarkan peningkatan pengetahuan emosional yang diusulkan oleh tim peneliti Baidu. Algoritme ini menggunakan metode tanpa pengawasan untuk secara otomatis menambang pengetahuan emosional, dan kemudian menggunakan pengetahuan emosional untuk membangun target pra-pelatihan, sehingga mesin tersebut dapat dibuat. dapat belajar memahami semantik emosional. SKEP memberikan representasi semantik emosional yang terpadu dan kuat untuk berbagai tugas analisis sentimen.
Tim peneliti Baidu melakukan tiga tugas analisis sentimen yang umum: Klasifikasi Sentimen Tingkat Kalimat, Klasifikasi Sentimen Tingkat Aspek, dan Pelabelan Peran Opini, dengan total 14 data berbahasa Mandarin dan Inggris. Hal di atas semakin memverifikasi pengaruh pra-pelatihan emosional model SKEP. Eksperimen menunjukkan bahwa dengan menggunakan model pra-pelatihan umum ERNIE (internal) sebagai inisialisasi, SKEP meningkat rata-rata sekitar 1,2% dibandingkan dengan ERNIE, dan meningkat rata-rata sekitar 2% dibandingkan dengan SOTA asli.