Institut Kecerdasan Buatan Allen berkolaborasi dengan sejumlah universitas untuk bersama-sama merilis model bahasa OLMo berskala besar yang sepenuhnya open source dan pertama di dunia. Hal ini menandai tonggak penting dalam bidang kecerdasan buatan dan akan mendorong pengembangan teknologi model besar yang lebih transparan dan terbuka. OLMo mencakup bobot model, kode, kumpulan data, dan proses pelatihan lengkap. Versi parameter 7B-nya berkinerja baik dalam banyak tugas. Selain itu, tim peneliti juga mengungkapkan kumpulan data Dolma sebelum pelatihan dan menyediakan alat pengumpulan dan analisis data untuk memaksimalkan transparansi data, yang memiliki arti luas dalam mempromosikan penelitian dan penerapan model bahasa besar di dunia akademis dan industri.
Institut Kecerdasan Buatan Allen dan beberapa universitas merilis OLMo model besar sumber terbuka 100% pertama di dunia, termasuk bobot, kode, kumpulan data, dan seluruh proses pelatihan. Evaluasi kinerja menunjukkan bahwa OLMo-7B sedikit lebih unggul dalam banyak tugas. Pada saat yang sama, para peneliti telah mengungkapkan kumpulan data pra-pelatihan Dolma untuk mempromosikan penelitian terbuka di bidang pra-pelatihan model bahasa. Dalam hal transparansi data, disediakan alat pengumpulan data dan alat analisis.
Peluncuran OLMo yang bersifat open source tidak hanya menurunkan ambang batas bagi penelitian model skala besar, namun juga menyumbangkan sumber daya berharga bagi komunitas kecerdasan buatan global, yang menandai hadirnya ekosistem kecerdasan buatan yang lebih terbuka dan kolaboratif. Di masa depan, kita diharapkan melihat lebih banyak aplikasi inovatif dan hasil penelitian berdasarkan OLMo bermunculan.