Shanghai Step Star Intelligent Technology Co., Ltd. ได้เปิดตัวโมเดลการให้เหตุผลแบบพัฒนาตนเอง Step Reasoner mini (Step R-mini) อย่างเป็นทางการเมื่อวันที่ 16 มกราคม 2025 โมเดลนี้เป็นโมเดลการอนุมานรุ่นแรกในซีรีส์ Step Step R-mini ทำงานได้ดีในหลายสาขา เช่น การใช้เหตุผลเชิงตรรกะ การเขียนโค้ด คณิตศาสตร์ และการสร้างสรรค์วรรณกรรม ประสิทธิภาพของการทดสอบเกณฑ์มาตรฐานหลายรายการยังเหนือกว่ารุ่นคู่แข่งบางรุ่นด้วยซ้ำ จุดเด่นของโมเดลนี้คือความสามารถในการคำนึงถึงความสามารถด้านศิลปศาสตร์และวิทยาศาสตร์ ซึ่งหาได้ยากในโมเดลที่คล้ายกัน
เมื่อวันที่ 16 มกราคม 2025 บริษัท Shanghai Step Reasoner Intelligent Technology Co., Ltd. ได้ประกาศเปิดตัวโมเดลการให้เหตุผลแบบพัฒนาตนเอง Step Reasoner mini ("Step R-mini") อย่างเป็นทางการแล้ว ผู้ใช้สามารถเข้าสู่ระบบหน้าเว็บ Yuewen https://yuewen.cn และเลือก "Step R-mini" ที่มุมซ้ายบนเพื่อสัมผัสประสบการณ์ดังกล่าว
Step R-mini เป็นโมเดลการใช้เหตุผลตัวแรกในตระกูล Step series ซึ่งเหมาะกับการวางแผนเชิงรุก การทดลองใช้ และการไตร่ตรอง และให้การตอบสนองที่แม่นยำและเชื่อถือได้แก่ผู้ใช้ผ่านกลไกลอจิกของการคิดช้าๆ และการตรวจสอบซ้ำ ไม่เพียงแต่สามารถแก้ปัญหาที่ซับซ้อน เช่น การใช้เหตุผลเชิงตรรกะ การเขียนโค้ด และคณิตศาสตร์ ผ่านความสามารถในการให้เหตุผลที่ยาวนานเป็นพิเศษ แต่ยังคำนึงถึงสาขาทั่วไป เช่น การสร้างวรรณกรรมด้วย
เมทริกซ์โมเดลพื้นฐานของซีรีส์ Step ที่พัฒนาขึ้นอย่างอิสระโดย Step Star ได้ครอบคลุมความสามารถที่ครอบคลุมตั้งแต่ภาษา หลากหลายรูปแบบ ไปจนถึงการใช้เหตุผล ในการทดสอบเกณฑ์มาตรฐานทางคณิตศาสตร์ เช่น AIME และ Math ประสิทธิภาพของ Step R-mini เหนือกว่า o1-preview และเทียบได้กับ OpenAI o1-mini นอกจากนี้ยังทำงานได้ดีกว่า o1-preview ในงานโค้ด LiveCodeBench เป็นที่น่าสังเกตว่าโมเดลการอนุมานส่วนใหญ่ไม่สามารถคำนึงถึงทั้งศิลปะและวิทยาศาสตร์ แต่ Step R-mini บรรลุ "ทั้งศิลปะและวิทยาศาสตร์" ผ่านการฝึกอบรมการเรียนรู้แบบเสริมกำลังขนาดใหญ่และการใช้อัลกอริธึมการเรียนรู้แบบเสริมตามนโยบาย” ไม่เพียงแต่สามารถตอบคำถามทางคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะได้อย่างแม่นยำ แต่ยังสร้างสรรค์เนื้อหาวรรณกรรมและงานสนทนารายวันได้อย่างสร้างสรรค์อีกด้วย
ในการใช้งานจริง Step R-mini จะแสดงผลลัพธ์ที่ยอดเยี่ยม เมื่อแก้ไขปัญหาทางคณิตศาสตร์ เมื่อเผชิญกับปัญหาทางคณิตศาสตร์โอลิมปิก จะสามารถสร้างห่วงโซ่การให้เหตุผลที่สมเหตุสมผล ตระหนักถึงการวางแผนและวิธีแก้ปัญหาทางคณิตศาสตร์ที่ซับซ้อนทีละขั้นตอน และแจกแจงวิธีแก้ปัญหาต่างๆ สำหรับการตรวจสอบข้าม เมื่อต้องรับมือกับปัญหาเรขาคณิต คุณสามารถสร้างสื่อเนื้อหาสำหรับการคิดเชิงลึกผ่านการร่างภาพได้ ในงานการให้เหตุผลเชิงตรรกะ ให้ลองใช้แนวคิดในการแก้ปัญหาที่หลากหลายอย่างอิสระ และถามตัวเองเพื่อให้แน่ใจว่ามีการแจกแจงวิธีแก้ปัญหาที่ดีทั้งหมด ในแง่ของคำถามเกี่ยวกับการเขียนโค้ด คุณสามารถตอบคำถามอัลกอริทึมได้อย่างถูกต้องด้วยระดับความยาก "ยาก" บนแพลตฟอร์มเทคโนโลยี LeetCode คุณยังสามารถจัดการกับข้อกำหนดการพัฒนาที่ซับซ้อน ค่อยๆ วิเคราะห์ความต้องการและความตั้งใจของผู้ใช้ และสร้างตรรกะของโค้ดได้ ในแง่ของการสร้างเนื้อหา คุณสามารถเข้าใจความต้องการของผู้ใช้ในการแสดงออกอย่างลึกซึ้ง วิเคราะห์ธีมที่สร้างสรรค์ ธีมวรรณกรรม และข้อกำหนดอื่นๆ คิดเกี่ยวกับมุมที่สร้างสรรค์ พรรณนาฉาก เทคนิควาทศิลป์ และโครงสร้างเนื้อหา ให้ความหมายเชิงสัญลักษณ์ในระดับอารมณ์ของมนุษย์ และเพิ่มองค์ประกอบที่เป็นส่วนตัวและสร้างสรรค์ เมื่อพูดถึงประเด็นการแปล เราปฏิบัติตามหลักการของ "ความซื่อสัตย์ ความสง่างาม ความสง่างาม" และมุ่งมั่นที่จะนำเสนอผลการแปลที่ถูกต้องและมีความหมาย
นอกเหนือจากโมเดลการใช้เหตุผลทางภาษาแล้ว Step Star ยังสร้างโมเดลการใช้เหตุผลด้วยภาพเพื่อรวมความสามารถในการให้เหตุผลเข้ากับโมเดลขนาดใหญ่ที่มีรูปแบบเชิงโต้ตอบมากขึ้น โดยมุ่งเป้าไปที่ปัญหาการใช้เหตุผลในฉากภาพที่ซับซ้อน จึงนำแนวคิดเรื่องการรับรู้ที่ช้าและการให้เหตุผลเชิงพื้นที่มาใช้เพื่อถ่ายโอนมาตราส่วนเวลาทดสอบจากพื้นที่ข้อความไปยังพื้นที่ภาพเพื่อให้ตระหนักถึงการคิดเชิงพื้นที่-ช้าในพื้นที่ภาพ ปัจจุบันโมเดลการใช้เหตุผลเชิงภาพได้รับผลลัพธ์เบื้องต้นแล้ว และคาดว่าจะเปิดตัวเวอร์ชันอย่างเป็นทางการแก่ทุกคนในปีนี้
การเปิดตัว Step R-mini ถือเป็นความก้าวหน้าครั้งสำคัญของ Step Star ในด้านปัญญาประดิษฐ์ ในอนาคต เราจะยังคงให้ความสำคัญกับการพัฒนา Step Star ในด้านปัญญาประดิษฐ์ต่อไป