Di era ledakan informasi, analisis data teks pendek telah menjadi tantangan besar di bidang kecerdasan buatan. Karena terbatasnya jumlah informasi dalam teks pendek dan kurangnya asosiasi kontekstual, metode analisis tradisional sulit untuk diproses secara efektif. Justin Miller, seorang mahasiswa pascasarjana di Universitas Sydney, mengambil pendekatan berbeda dan mengembangkan metode analisis teks pendek baru menggunakan model bahasa besar (LLM) untuk memberikan solusi inovatif terhadap masalah ini. Hasil penelitiannya tidak hanya meningkatkan efisiensi dan akurasi analisis teks pendek, tetapi juga menunjukkan potensi besar kecerdasan buatan dalam pemrosesan dan pemahaman informasi, memberikan wawasan data yang lebih mendalam untuk berbagai bidang masyarakat.
Di dunia digital saat ini, penggunaan teks pendek telah menjadi hal penting dalam komunikasi online. Namun, karena teks-teks ini sering kali tidak memiliki kosa kata atau konteks yang sama, kecerdasan buatan (AI) menghadapi banyak tantangan saat menganalisisnya. Dalam hal ini, Justin Miller, seorang mahasiswa pascasarjana sastra Inggris dan ilmuwan data di Universitas Sydney, mengusulkan metode baru yang menggunakan model bahasa besar (LLM) untuk melakukan pemahaman dan analisis teks pendek secara mendalam.
Penelitian Miller berfokus pada cara efektif mengklasifikasikan teks pendek dalam jumlah besar, seperti profil media sosial, umpan balik pelanggan, atau komentar online terkait peristiwa bencana. Alat AI yang dikembangkannya dapat mengelompokkan puluhan ribu profil pengguna Twitter ke dalam sepuluh kategori yang mudah dipahami. Proses ini berhasil menganalisis hampir 40 postingan tentang Presiden AS Trump dalam dua hari pada September 2020. Klasifikasi ini dapat membantu mengidentifikasi tidak hanya kecenderungan profesional pengguna, sikap politik, dan bahkan emoji yang mereka gunakan.
“Sorotan dari penelitian ini adalah konsep desain humanistik.” Miller mengatakan bahwa klasifikasi yang dihasilkan menggunakan model bahasa besar tidak hanya efisien secara komputasi, tetapi juga konsisten dengan pemahaman intuitif manusia. Penelitiannya juga menunjukkan bahwa AI generatif seperti ChatGPT dalam beberapa kasus dapat memberikan nama klasifikasi yang lebih jelas dan konsisten dibandingkan pengulas manusia, terutama dalam hal membedakan pola bermakna dari kebisingan latar belakang.
Alat Miller memiliki potensi untuk berbagai aplikasi. Penelitiannya menunjukkan bahwa kumpulan data yang besar dapat direduksi menjadi kelompok yang dapat dikelola dan bermakna. Misalnya, dalam sebuah proyek mengenai perang Rusia-Ukraina, ia mengumpulkan lebih dari 1 juta postingan media sosial dan mengidentifikasi sepuluh topik berbeda, termasuk kampanye disinformasi Rusia dan penggunaan hewan sebagai simbol dalam bantuan kemanusiaan. Selain itu, melalui klaster ini, organisasi, pemerintah, dan dunia usaha dapat memperoleh wawasan yang dapat ditindaklanjuti untuk membantu mengambil keputusan yang lebih tepat.
Miller menyimpulkan: “Penerapan AI dengan penggunaan ganda ini tidak hanya mengurangi ketergantungan pada tinjauan manusia yang mahal dan subjektif, namun juga memberi kita cara yang terukur untuk memahami sejumlah besar data tekstual. Dari analisis tren media sosial hingga pemantauan Krisis dan wawasan pelanggan , pendekatan ini secara efektif menggabungkan efisiensi mesin dengan pemahaman manusia, memberikan ide-ide baru untuk pengorganisasian dan interpretasi data ”.
Penelitian Miller memberikan ide-ide baru untuk analisis data teks pendek. Alat AI yang dikembangkannya memiliki prospek penerapan yang luas dan memberikan dukungan yang kuat untuk analisis data dan pengambilan keputusan di berbagai bidang bidang pemrosesan informasi.