บรรณาธิการของ Downcodes ได้เรียนรู้ว่า Allen Institute for Artificial Intelligence (Ai2) เพิ่งเปิดตัว Molmo ซึ่งเป็นตระกูลโมเดล AI แบบโอเพ่นซอร์สหลายรูปแบบใหม่ ประสิทธิภาพการทำงานนั้นยอดเยี่ยมมาก แม้จะเหนือกว่า GPT-4o และ Anthropic ของ OpenAI ในการทดสอบเกณฑ์มาตรฐานของบุคคลที่สามหลายรายการ Claude3.5Sonnet และ Google's Gemini1.5 Molmo ไม่เพียงแต่วิเคราะห์ภาพที่ผู้ใช้อัปโหลดเท่านั้น แต่ยังใช้ข้อมูลระหว่างการฝึกอบรมน้อยกว่าคู่แข่งถึง 1,000 เท่า ด้วยเทคนิคการฝึกอบรมที่เป็นเอกลักษณ์ ความก้าวหน้าครั้งนี้แสดงให้เห็นถึงความมุ่งมั่นของ Ai2 ในการวิจัยแบบเปิด โดยสร้างแบบจำลองประสิทธิภาพสูง ตลอดจนน้ำหนักและข้อมูลแบบเปิดสำหรับชุมชนและองค์กรในวงกว้าง
Molmo ไม่เพียงแต่ยอมรับภาพที่ผู้ใช้อัปโหลดเพื่อการวิเคราะห์เท่านั้น แต่ยังใช้ "ข้อมูลน้อยกว่าคู่แข่งถึง 1,000 เท่า" ในการฝึกอบรมด้วยเทคนิคการฝึกอบรมที่เป็นเอกลักษณ์
ข่าวประชาสัมพันธ์ฉบับนี้แสดงให้เห็นถึงความมุ่งมั่นของ Ai2 ในการวิจัยแบบเปิด โดยนำเสนอโมเดลประสิทธิภาพสูงพร้อมน้ำหนักและข้อมูลแบบเปิดสำหรับการใช้งานโดยชุมชนและองค์กรในวงกว้าง ตระกูล Molmo ประกอบด้วยรุ่นหลัก 4 รุ่น ได้แก่ Molmo-72B, Molmo-7B-D, Molmo-7B-O และ MolmoE-1B เป็นรุ่นเรือธงที่มีพารามิเตอร์ 7.2 พันล้านตัว และประสิทธิภาพที่โดดเด่นเป็นพิเศษ
จากการประเมินต่างๆ Molmo-72B ได้รับคะแนนสูงสุดจากเกณฑ์มาตรฐานที่สำคัญ 11 รายการ และอยู่ในอันดับที่สองรองจาก -4o ในแง่ของความพึงพอใจของผู้ใช้ นอกจากนี้ Ai2 ยังได้เปิดตัวโมเดล OLMoE โดยใช้แนวทาง "การรวมโมเดลขนาดเล็ก" เพื่อปรับปรุงความคุ้มค่า
สถาปัตยกรรมของ Molmo ได้รับการออกแบบอย่างพิถีพิถันเพื่อประสิทธิภาพและประสิทธิภาพที่เหนือกว่า ทุกรุ่นใช้โมเดล ViT-L/14336px CLIP ของ OpenAI เป็นตัวเข้ารหัสภาพเพื่อประมวลผลภาพหลายขนาดเป็นคำสั่งภาพ ส่วนโมเดลภาษาคือตัวถอดรหัส Transformer ซึ่งมีความสามารถและความเปิดกว้างที่แตกต่างกัน
ในแง่ของการฝึกอบรม Mol จะต้องผ่านการฝึกอบรมสองขั้นตอน: ขั้นแรก การฝึกล่วงหน้าแบบหลายโมเดล และขั้นที่สอง การปรับแต่งแบบละเอียดภายใต้การดูแล ต่างจากโมเดลสมัยใหม่หลายๆ รุ่นตรงที่ Molmo ไม่ได้พึ่งพาการเรียนรู้แบบเสริมกำลังด้วยการตอบรับจากมนุษย์ แต่อัปเดตพารามิเตอร์ของโมเดลผ่านกระบวนการฝึกอบรมที่ได้รับการปรับแต่งอย่างระมัดระวังแทน
Molmo ทำงานได้ดีในการวัดประสิทธิภาพหลายรายการ โดยเฉพาะอย่างยิ่งในงานที่ซับซ้อน เช่น การอ่านเอกสารและการให้เหตุผลด้วยภาพ ซึ่งแสดงให้เห็นถึงความสามารถที่แข็งแกร่ง Ai2 ได้เปิดตัวโมเดลและชุดข้อมูลเหล่านี้บน Hugging Face และจะเปิดตัวโมเดลเพิ่มเติมและรายงานทางเทคนิคเพิ่มเติมในอีกไม่กี่เดือนข้างหน้า เพื่อจัดหาแหล่งข้อมูลเพิ่มเติมสำหรับนักวิจัย
หากคุณต้องการเรียนรู้เกี่ยวกับความสามารถของ Molmo ขณะนี้สามารถชมการสาธิตต่อสาธารณะได้ผ่านทางเว็บไซต์อย่างเป็นทางการของ Molmo (https://molmo.allenai.org/)
ไฮไลท์:
โมเดล AI แบบโอเพ่นซอร์สของ Ai2Molmo เหนือกว่าผลิตภัณฑ์ชั้นนำของอุตสาหกรรม
? Mol-72B ทำงานได้ดีในการวัดประสิทธิภาพหลายรายการ รองจาก GPT4o เท่านั้น
มีความเปิดกว้างอย่างมาก และนักวิจัยสามารถใช้แบบจำลองและชุดข้อมูลได้อย่างอิสระ
โดยรวมแล้ว การเกิดขึ้นของ Molmo ถือเป็นความก้าวหน้าครั้งสำคัญในด้าน AI แบบหลายรูปแบบ และลักษณะโอเพ่นซอร์สของมันยังมอบทรัพยากรอันมีค่าสำหรับนักวิจัยทั่วโลกอีกด้วย บรรณาธิการของ Downcodes หวังว่า Molmo จะถูกนำมาใช้และพัฒนาอย่างแพร่หลายมากขึ้นในอนาคต และส่งเสริมความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยี AI