Allen Institute for Artificial Intelligence ร่วมมือกับมหาวิทยาลัยหลายแห่งเพื่อร่วมกันเปิดตัว OLMo โมเดลภาษาโอเพ่นซอร์สขนาดใหญ่เต็มรูปแบบตัวแรกของโลก นี่เป็นหลักชัยสำคัญในด้านปัญญาประดิษฐ์ และจะส่งเสริมการพัฒนาเทคโนโลยีแบบจำลองขนาดใหญ่ที่มีความโปร่งใสและเปิดกว้างมากขึ้น OLMo ประกอบด้วยน้ำหนักโมเดล โค้ด ชุดข้อมูล และกระบวนการฝึกอบรมที่สมบูรณ์ เวอร์ชันพารามิเตอร์ 7B ทำงานได้ดีในหลายงาน นอกจากนี้ ทีมวิจัยยังได้เปิดเผยชุดข้อมูลก่อนการฝึกอบรม Dolma และจัดเตรียมเครื่องมือเปรียบเทียบและวิเคราะห์ข้อมูลเพื่อเพิ่มความโปร่งใสของข้อมูล ซึ่งมีความสำคัญอย่างกว้างขวางในการส่งเสริมการวิจัยและการประยุกต์ใช้แบบจำลองภาษาขนาดใหญ่ในแวดวงวิชาการและอุตสาหกรรม
สถาบันปัญญาประดิษฐ์แห่งอัลเลนและมหาวิทยาลัยหลายแห่งเปิดตัว OLMo โมเดลโอเพ่นซอร์สขนาดใหญ่ 100% ตัวแรกของโลก ซึ่งรวมถึงน้ำหนัก รหัส ชุดข้อมูล และกระบวนการฝึกอบรมทั้งหมด การประเมินประสิทธิภาพแสดงให้เห็นว่า OLMo-7B เหนือกว่าเล็กน้อยในหลาย ๆ งาน ในเวลาเดียวกัน นักวิจัยได้เปิดเผยชุดข้อมูลก่อนการฝึกอบรม Dolma เพื่อส่งเสริมการวิจัยแบบเปิดในด้านแบบจำลองภาษาก่อนการฝึกอบรม ในแง่ของความโปร่งใสของข้อมูล มีการจัดเตรียมเครื่องมือจัดเรียงข้อมูลและเครื่องมือวิเคราะห์
การเปิดตัวโอเพ่นซอร์สของ OLMo ไม่เพียงแต่ช่วยลดเกณฑ์สำหรับการวิจัยโมเดลขนาดใหญ่เท่านั้น แต่ยังมีส่วนช่วยทรัพยากรที่มีคุณค่าให้กับชุมชนปัญญาประดิษฐ์ทั่วโลก ถือเป็นการประกาศการมาถึงของระบบนิเวศปัญญาประดิษฐ์ที่เปิดกว้างและทำงานร่วมกันมากขึ้น ในอนาคต เราคาดว่าจะเห็นการใช้งานเชิงนวัตกรรมและผลการวิจัยที่อิงจาก OLMo ที่เกิดขึ้นใหม่มากขึ้น