Editor Downcodes mengetahui bahwa model bahasa 7 miliar parameter yang disebut Teuken-7B telah dirilis pada platform Hugging Face, mendukung 24 bahasa resmi UE. Model ini dikembangkan oleh proyek penelitian EU OpenGPT-X dan tersedia untuk pengguna sebagai sumber terbuka. Tidak seperti kebanyakan model bahasa AI yang berpusat pada Inggris, Teuken-7B dibuat dari awal, dengan sekitar setengah dari data pelatihannya berasal dari bahasa Eropa non-Inggris, sehingga memberikan keunggulan signifikan dalam menangani berbagai bahasa Eropa.
Teuken-7B, model bahasa dengan 7 miliar parameter, kini tersedia di Hugging Face dan mendukung 24 bahasa resmi UE. Model ini dikembangkan oleh proyek penelitian EU OpenGPT-X dan tersedia untuk pengguna sebagai proyek sumber terbuka. Tidak seperti kebanyakan model bahasa AI yang berpusat pada Inggris, Teuken-7B dibuat dari awal, dengan sekitar setengah dari data pelatihannya berasal dari bahasa Eropa non-Inggris.
Catatan sumber gambar: Gambar dihasilkan oleh AI, dan gambar tersebut disahkan oleh penyedia layanan Midjourney
Tim pengembangan mengatakan Teuken-7B bekerja dengan baik dalam semua bahasa yang dilatihnya, dan keandalannya sangat mengesankan ketika berhadapan dengan bahasa non-Inggris. Untuk mengukur kinerja model bahasa dalam bahasa-bahasa Eropa, tim proyek juga membuat peringkat LLM Eropa baru, melampaui metode pengujian standar sebelumnya yang sebagian besar didasarkan pada bahasa Inggris.
Rilis ini menandai langkah maju yang signifikan dalam dorongan Eropa untuk model AI multibahasa, sekaligus menyediakan alat yang kuat dan beragam bagi pengembang untuk mendukung aplikasi dan penelitian lintas bahasa.
Peluncuran Teuken-7B yang bersifat open source menghadirkan kemungkinan-kemungkinan baru di bidang AI multi-bahasa dan mencerminkan upaya aktif Eropa dalam penelitian independen dan pengembangan teknologi AI. Kemampuan pemrosesan multi-bahasanya yang luar biasa akan memberikan lebih banyak kemudahan bagi pengembang global dan mendorong pengembangan aplikasi lintas bahasa yang pesat. Diharapkan Teuken-7B dapat berperan di lebih banyak bidang di masa depan.