Editor Downcodes mengetahui bahwa OpenAI baru-baru ini merilis kumpulan data multibahasa blockbuster MMMLU, yang bertujuan untuk mengevaluasi kinerja AI dalam 14 bahasa, mencakup bahasa Arab, Jerman, Swahili, dan bahasa lainnya, dan digunakan dalam Hugging Face yang dipublikasikan secara publik di platform. Langkah ini menandai kemajuan penting lainnya yang dibuat oleh OpenAI di bidang AI global, mengisi kesenjangan dalam penelitian AI yang berfokus pada bahasa dengan sumber daya rendah, dan juga menyediakan cara baru bagi perusahaan dan pemerintah untuk berinteraksi lebih baik dengan pengguna global. Peluncuran kumpulan data MMMLU tidak diragukan lagi akan mendorong pengembangan dan penerapan teknologi AI multi-bahasa.
Baru-baru ini, OpenAI meluncurkan kumpulan data multibahasa blockbuster yang dirancang untuk mengevaluasi kinerja kecerdasan buatan dalam 14 bahasa, termasuk Arab, Jerman, Swahili, Bengali, dan Yoruba.
Kumpulan data ini, yang disebut "Pemahaman Bahasa Multi-Tugas Skala Besar Multi-Bahasa" (MMMLU), telah dirilis pada platform data terbuka Hugging Face, menandai kemajuan penting OpenAI lainnya di bidang AI global.
Pintu masuk kumpulan data: https://huggingface.co/datasets/openai/MMMLU
Kumpulan data "Pemahaman Bahasa Multi-Tugas Skala Besar" (MMLU) sebelumnya hanya dievaluasi pada bahasa Inggris dan mencakup 57 mata pelajaran seperti matematika, hukum, dan ilmu komputer. Kumpulan data MMMLU yang baru dirilis berfokus pada berbagai bahasa dan bertujuan untuk mengisi kesenjangan dalam bahasa dengan sumber daya rendah dalam penelitian AI. Langkah OpenAI kali ini adalah untuk memenuhi kebutuhan perusahaan dan pemerintah yang terus meningkat agar sistem AI dapat berinteraksi lebih baik dengan pengguna di seluruh dunia.
Untuk memastikan keakuratan kumpulan data yang tinggi, OpenAI mengandalkan penerjemah manusia profesional untuk membuat kumpulan data MMMLU. Hal ini sangat penting karena banyak alat terjemahan otomatis rentan terhadap kesalahan halus saat memproses bahasa dengan sumber daya rendah, yang dapat menimbulkan konsekuensi serius dalam industri yang sangat kritis seperti layanan kesehatan, hukum, dan keuangan. Oleh karena itu, OpenAI menggunakan terjemahan manusia untuk memastikan bahwa kumpulan data dapat memberikan dasar yang andal untuk evaluasi model AI multibahasa.
Pada saat yang sama, OpenAI juga mengumumkan peluncuran "OpenAI Academy", sebuah proyek yang dirancang untuk mendukung pengembang dan organisasi yang memiliki misi, terutama di negara-negara berpenghasilan rendah dan menengah, untuk menggunakan teknologi AI guna memecahkan masalah lokal. OpenAI akan memberikan pelatihan, panduan teknis, dan kredit penggunaan API senilai US$1 juta untuk membantu talenta AI lokal mengakses sumber daya terbaru.
Bagi perusahaan, kumpulan data MMMLU memberikan peluang bagus untuk mengevaluasi sistem AI mereka di pasar global. Baik itu layanan pelanggan, moderasi konten, atau analisis data, sistem AI yang dapat bekerja dengan baik dalam berbagai bahasa akan membantu perusahaan mengurangi hambatan komunikasi dan meningkatkan pengalaman pengguna.
Ketika semakin banyak perusahaan dan peneliti mulai menggunakan tolok ukur multibahasa ini untuk pengujian, kemampuan multibahasa sistem AI akan menjadi semakin penting di masa depan. Peluncuran kumpulan data OpenAI tidak hanya menempatkannya di bidang AI multibahasa, namun juga secara aktif mendorong perkembangan teknologi di masa depan.
Menyorot:
? OpenAI merilis kumpulan data MMMLU, yang mencakup 14 bahasa, untuk mempromosikan penelitian dan penerapan AI multibahasa.
??Kumpulan data dihasilkan oleh penerjemah manusia profesional untuk memastikan akurasi tinggi, terutama cocok untuk industri dengan permintaan tinggi.
OpenAI Academy diluncurkan untuk memberikan dukungan guna mendorong pertumbuhan dan pengembangan pengembang AI di negara-negara berpenghasilan rendah.
Secara keseluruhan, kumpulan data MMMLU yang dirilis oleh OpenAI dan proyek pendukung OpenAI Academy menunjukkan tekad dan tindakannya untuk mendorong pengembangan AI global dan mendorong inklusivitas teknologi AI. Hal ini akan berdampak positif pada penelitian dan penerapan AI multibahasa, dan patut mendapat perhatian industri.