ทีม OpenCompass จาก Shanghai Artificial Intelligence Laboratory Sinan และ ModelScope ร่วมกันเปิดตัวการอัปเดตครั้งใหญ่ของแพลตฟอร์มการแข่งขันโมเดลขนาดใหญ่หลายรูปแบบ Compass Multi-Modal Arena! แพลตฟอร์มดังกล่าวมีจุดมุ่งหมายเพื่อให้ผู้ใช้มีแพลตฟอร์มที่สะดวกสบายในการสัมผัสและเปรียบเทียบโมเดลขนาดใหญ่แบบหลายรูปแบบกระแสหลักต่างๆ และช่วยให้ผู้ใช้ค้นพบโมเดลที่ตรงกับความต้องการของตนได้มากที่สุดในท้ายที่สุด บรรณาธิการของ Downcodes จะแนะนำการอัปเดตที่น่าตื่นเต้นนี้ให้กับคุณโดยละเอียด
ทีม OpenCompass จาก Shanghai Artificial Intelligence Laboratory Sinan และ ModelScope ได้ประกาศเมื่อไม่นานนี้ว่า Compass Arena แพลตฟอร์มประเมินโมเดลขนาดใหญ่ของพวกเขาได้รับการอัปเดตครั้งสำคัญ และเปิดตัวส่วนการแข่งขันโมเดลขนาดใหญ่หลายรูปแบบใหม่ Compass Multi-Modal Arena ส่วนใหม่นี้เป็นแพลตฟอร์มให้ผู้ใช้สามารถสัมผัสและเปรียบเทียบผลกระทบของโมเดลขนาดใหญ่หลายรูปแบบกระแสหลักที่หลากหลาย ช่วยให้ผู้ใช้ค้นหาโมเดลที่ตรงกับความต้องการของตนมากที่สุด
เว็บไซต์อย่างเป็นทางการและหน้า ModelScope ของ Compass Multi-Modal Arena เปิดให้บุคคลทั่วไปเข้าชมแล้ว โดยมีอินเทอร์เฟซที่เรียบง่ายและใช้งานง่าย ผู้ใช้สามารถอัปโหลดรูปภาพและป้อนคำถามได้ และระบบจะจัดเตรียมโมเดลขนาดใหญ่หลายรูปแบบที่ไม่ระบุตัวตนสองโมเดล เพื่อสร้างคำตอบตามเนื้อหาที่ป้อน ผู้ใช้ทำการประเมินเชิงอัตนัยตามคุณภาพของเนื้อหาที่สร้างขึ้น โดยเลือกแบบจำลองที่พวกเขาเชื่อว่าทำงานได้ดีกว่า หลังจากการประเมินเสร็จสิ้นผู้ใช้สามารถดูชื่อของแต่ละรุ่นได้
แพลตฟอร์มนี้ยังมีคลังคำถามพิเศษในตัว ซึ่งสะดวกสำหรับผู้ใช้ในการอัปโหลดภาพซึ่งไม่สะดวก การออกแบบนี้มีจุดมุ่งหมายเพื่อประเมินประสิทธิภาพและประสบการณ์ผู้ใช้ของโมเดลขนาดใหญ่หลายรูปแบบในงานส่วนตัว
เว็บไซต์อย่างเป็นทางการของ Compass Multi-Modal Arena
https://opencompass.org.cn/arena?type=multimodal
หน้า ModelScope:
https://modelscope.cn/studios/opencompass/CompassArena
เพจกอดเฟซ
https://huggingface.co/spaces/opencompass/CompassArena
ลิงก์โอเพ่นซอร์สของเครื่องมือประเมินหลายรูปแบบ OpenCompass:
https://github.com/open-compass/VLMEvalKit
โดยรวมแล้ว การอัปเดต Compass Multi-Modal Arena มอบแพลตฟอร์มใหม่และสะดวกสบายสำหรับการประเมินและการเลือกโมเดลขนาดใหญ่แบบหลายโมดัล ซึ่งคุ้มค่ากับประสบการณ์และความสนใจของผู้ใช้ เราหวังว่าจะได้รับการอัปเดตอย่างต่อเนื่องของแพลตฟอร์มนี้ในอนาคตเพื่อนำความประหลาดใจมาสู่ผู้ใช้มากขึ้น!