Beijing Dark Side of the Moon Technology Co., Ltd. ได้เปิดตัวโมเดลการทำความเข้าใจรูปภาพหลายรูปแบบ moonshot-v1-vision-preview โมเดลนี้เป็นส่วนขยายของซีรีส์ moonshot-v1 และปรับปรุงความสามารถของ Kimi ในการทำความเข้าใจข้อมูลรูปภาพอย่างมาก . โมเดล Vision มีความสามารถในการจดจำภาพที่ทรงพลัง และสามารถแยกแยะความแตกต่างเล็กๆ น้อยๆ ได้อย่างแม่นยำ เช่น แยกแยะรูปภาพมัฟฟินบลูเบอร์รี่และชิวาวาที่คล้ายกันมากได้อย่างง่ายดาย นอกจากนี้ ยังทำงานได้ดีในการจดจำข้อความ OCR และสามารถจดจำเอกสารต่างๆ ได้อย่างแม่นยำ รวมถึงลายมือที่เขียนด้วยลายมือ เช่น ใบเสร็จรับเงินและคำสั่งจัดส่งด่วน รุ่นนี้รองรับคุณสมบัติที่หลากหลาย เช่น บทสนทนาหลายรอบ สตรีมมิ่งเอาท์พุต ฯลฯ ทำให้ผู้ใช้ได้รับประสบการณ์ที่สะดวกและมีประสิทธิภาพมากขึ้น
เมื่อวันที่ 15 มกราคม 2025 Beijing Dark Side of the Moon Technology Co., Ltd. ได้ประกาศเปิดตัวโมเดลทำความเข้าใจภาพหลายรูปแบบอย่างเป็นทางการ moonshot-v1-vision-preview -v1 model series และช่วยให้ Kimi เข้าใจโลกได้ดีขึ้น
โมเดล Vision มีความสามารถในการจดจำภาพที่ทรงพลัง และสามารถระบุรายละเอียดที่ซับซ้อนและความแตกต่างในภาพได้อย่างแม่นยำ ไม่ว่าจะเป็นอาหารหรือสัตว์ และสามารถแยกแยะวัตถุที่เหมือนกันแต่ไม่เหมือนกันได้ ตัวอย่างเช่น เมื่อต้องเผชิญกับรูปภาพมัฟฟินบลูเบอร์รี่และชิวาวาที่คล้ายกัน 16 ภาพ ซึ่งยากที่สายตามนุษย์จะแยกแยะได้ โมเดลวิชั่นสามารถแยกแยะและระบุพวกมันได้อย่างแม่นยำ
โมเดล Vision ยังมีความสามารถในการจดจำรูปภาพขั้นสูงชั้นนำของประเทศ และทำงานได้ดีในสถานการณ์การจดจำข้อความ OCR และการทำความเข้าใจรูปภาพ ซึ่งมีความแม่นยำมากกว่าการสแกนเอกสารและซอฟต์แวร์การจดจำ OCR ทั่วไป และสามารถจดจำเนื้อหาที่เขียนด้วยลายมืออย่างเขียนลวก ๆ เช่น ใบเสร็จรับเงินและคำสั่งจัดส่งด่วน .
โมเดล Vision Vision รองรับการสนทนาหลายรอบ เอาท์พุตการสตรีม การเรียกใช้เครื่องมือ โหมด JSON โหมดบางส่วน และคุณสมบัติอื่นๆ แต่ในปัจจุบันยังไม่รองรับการค้นหาออนไลน์ ไม่รองรับการสร้าง Context Cache พร้อมเนื้อหารูปภาพ แต่รองรับ การใช้การเรียกแคชที่สร้างสำเร็จ โมเดล Vision ไม่รองรับรูปภาพในรูปแบบ URL และปัจจุบันรองรับเฉพาะเนื้อหารูปภาพที่เข้ารหัส base64 เท่านั้น
การเรียกเก็บเงินแบบจำลอง
ราคาต่อหน่วยการเรียกเก็บเงินโมเดล moonshot-v1-8k-vision-preview1M โทเค็น¥12.00moonshot-v1-32k-vision-preview1M โทเค็น¥24.00moonshot-v1-128k-vision-preview1M โทเค็น¥60.00การเปิดตัวโมเดล moonshot-v1-vision-preview ถือเป็นความก้าวหน้าครั้งใหม่ของบริษัท Beijing Dark Side of the Moon Technology Co., Ltd. ในด้านปัญญาประดิษฐ์หลายรูปแบบ และมอบทิศทางใหม่ในการพัฒนาความเข้าใจเกี่ยวกับภาพ เทคโนโลยี. ประสิทธิภาพอันทรงพลังและฟังก์ชันที่หลากหลายทำให้มีความเป็นไปได้ในการใช้งานในวงกว้างในสถานการณ์การใช้งานต่างๆ มากมาย และคุ้มค่าที่จะรอคอยการพัฒนาและการใช้งานในอนาคต