โมเดลภาษาขนาดใหญ่หลายโหมดล่าสุด MINICPM-O 2.66 ที่เปิดตัวโดยทีม OpenBMB โดยมีพารามิเตอร์ 800 ล้านพารามิเตอร์และความสามารถในการประมวลผลหลายโหมดที่ทรงพลังโดดเด่นในชุมชนโอเพ่นซอร์ส รองรับวิธีการอินพุตต่าง ๆ เช่นรูปภาพวิดีโอข้อความและเสียงและให้ข้อความและเสียงที่มีคุณภาพสูง โหมดเสียงของ MINICPM-O2.6 ยังเพิ่มฟังก์ชั่นการสนทนาแบบเรียลไทม์สองภาษารองรับอารมณ์ความรู้สึกความเร็วและสไตล์การควบคุมและยังสามารถแสดงบทบาทและการโคลนนิ่งด้วยเสียง นอกจากนี้ฟังก์ชั่น OCR ที่ทรงพลังและการสนับสนุนหลายภาษามีความคืบหน้าอย่างมีนัยสำคัญในการทำความเข้าใจวิดีโอจริงและการออกอากาศหลายโหมดบนอุปกรณ์มือถือ
MINICPM-O2.6 มีความสามารถในการประมวลผลอินพุตที่แข็งแกร่งสามารถยอมรับวิธีการป้อนข้อมูลที่หลากหลายเช่นรูปภาพวิดีโอข้อความและเสียงและให้ข้อความและเสียงที่มีคุณภาพสูง
โหมดเสียงของโมเดลนี้เพิ่มฟังก์ชั่นการสนทนาจริงสองภาษา นวัตกรรมชุดนี้ทำให้ MINICPM-O2.6 มีประสบการณ์แบบโต้ตอบมากขึ้นและผู้ใช้สามารถเพลิดเพลินกับวิธีการสื่อสารที่เป็นธรรมชาติและราบรื่นมากขึ้น
นอกเหนือจากความก้าวหน้าในการสนทนาด้วยเสียงแล้ว MINICPM-O2.6 ยังมีความคืบหน้าอย่างมีนัยสำคัญในความสามารถในการประมวลผลภาพ ฟังก์ชั่น OCR (การจดจำอักขระออพติคอล) ที่ทรงพลังและการสนับสนุนหลายภาษาทำให้มีประสิทธิภาพมากขึ้นในการทำความเข้าใจวิดีโอจริง ความสามารถที่ยอดเยี่ยมนี้ยังได้รับการถ่ายทอดสดหลายโหมดบนอุปกรณ์มือถือเป็นครั้งแรก
ตั้งแต่เดือนกุมภาพันธ์ 2567 ซีรี่ส์ MINICPM ได้เปิดตัวหกเวอร์ชันและทีมมีจุดมุ่งหมายเพื่อปรับปรุงประสิทธิภาพและประสิทธิภาพการปรับใช้ของโมเดลต่อไป รุ่นนี้ไม่เพียง แต่มีนวัตกรรมทางเทคนิค แต่ยังแสดงถึงความคืบหน้าครั้งสำคัญในประสบการณ์การโต้ตอบแบบหลายโหมด ไม่ว่าจะเป็นแอปพลิเคชั่นของสาขาวิชาชีพหรือปฏิสัมพันธ์ความบันเทิงในชีวิตประจำวัน MinICPM-O2.6 จะกลายเป็นผู้ช่วยอัจฉริยะที่ขาดไม่ได้สำหรับผู้ใช้
ที่อยู่โครงการ: https://github.com/openbmbmb/minicpm-o
MINICPM-O2.6 ซึ่งเป็นรุ่นล่าสุดของ MinICPM Series แสดงให้เห็นถึงประสิทธิภาพที่แข็งแกร่งและสถานการณ์แอพพลิเคชั่นที่หลากหลายในการโต้ตอบแบบหลายโหมดนำประสบการณ์ที่สะดวกและฉลาดขึ้นให้กับผู้ใช้ นวัตกรรม.