Google baru-baru ini merilis kerangka kerja baru yang disebut ASPIRE, yang bertujuan untuk meningkatkan akurasi model bahasa besar (LLM) dalam situasi dengan tingkat kepercayaan rendah. Kerangka kerja ini mencapai prediksi selektif penilaian mandiri dengan menggabungkan teknik seperti penyesuaian tugas dan pengambilan sampel jawaban, yang secara efektif memecahkan masalah kalibrasi kepercayaan LLM. Terobosan ini sangat penting untuk meningkatkan keandalan dan kepraktisan LLM, menandai babak baru dalam pengembangan teknologi LLM.
Google baru-baru ini meluncurkan kerangka kerja ASPIRE, yang dirancang untuk membantu model bahasa besar membuat penilaian yang tepat dalam kondisi kepercayaan rendah. Kerangka kerja ini didasarkan pada penilaian mandiri atas prediksi selektif, yang diterapkan melalui modul teknis seperti penyesuaian tugas dan pengambilan sampel jawaban. Data eksperimen menunjukkan bahwa ASPIRE berkinerja baik pada berbagai kumpulan data, mengisi kesenjangan dalam kalibrasi kepercayaan model bahasa besar, dan meningkatkan stabilitas dan akurasi model. Peluncuran ASPIRE akan memberikan kinerja yang lebih baik dan layanan yang lebih andal untuk model bahasa besar di berbagai bidang.
Keberhasilan penerapan kerangka ASPIRE menunjukkan bahwa model bahasa besar akan lebih andal dan akurat dalam penerapan praktis, memberikan arah dan kemungkinan baru untuk pengembangan teknologi kecerdasan buatan di masa depan. Terobosannya dalam kalibrasi kepercayaan tidak diragukan lagi akan mendorong penerapan dan mempopulerkan LLM di lebih banyak bidang.