OpenAI ได้เปิดตัวโมเดลการอนุมานรุ่นใหม่ o3 และเวอร์ชันที่มีประสิทธิภาพ o3-mini ซึ่งเป็นรุ่นต่อจากซีรีส์ o1 และได้รับการออกแบบมาเพื่อปรับปรุงความแม่นยำในการตอบคำถามผ่านการคิดเชิงลึก o3 มีความก้าวหน้าอย่างก้าวกระโดดในเกณฑ์มาตรฐาน ARC-AGI ซึ่งแสดงให้เห็นถึงความสามารถในการแก้ไขปัญหาในระดับที่ใกล้เคียงกับมนุษย์ o3-mini มุ่งเน้นไปที่ความเร็วและความคุ้มค่า และเหมาะอย่างยิ่งสำหรับงานการเขียนโปรแกรม แม้ว่าโมเดลซีรีส์ o3 จะไม่เปิดตัวสู่สาธารณะโดยตรง แต่ OpenAI ได้เปิดให้นักวิจัยด้านความปลอดภัยดูตัวอย่าง
โมเดล o3 ทำงานได้ดีในการวัดประสิทธิภาพหลายรายการ ตัวอย่างเช่น ความแม่นยำของการวัดประสิทธิภาพที่ได้รับการรับรองจาก SWE-bench นั้นสูงกว่า o1 มากกว่า 20% และความแม่นยำของคณิตศาสตร์การแข่งขันและ GPQA Diamond ก็ได้รับการปรับปรุงอย่างมีนัยสำคัญเช่นกัน OpenAI ยังได้แนะนำวิธีการประเมินความปลอดภัยใหม่ที่เรียกว่า “การจัดตำแหน่งโดยเจตนา” เพื่อให้มั่นใจถึงความปลอดภัยของโมเดลและการปฏิบัติตามข้อกำหนดด้านความปลอดภัย ปัจจุบัน OpenAI กำลังอยู่ระหว่างการทดสอบความปลอดภัยภายนอกและได้เปิดแอปพลิเคชันที่เข้าถึงได้ก่อนใคร
ในแง่ของการเขียนโปรแกรมและการแก้ปัญหาทางคณิตศาสตร์ โมเดล o3 ได้แสดงให้เห็นถึงความสามารถที่โดดเด่น บนเกณฑ์มาตรฐานที่ได้รับการรับรองจาก SWE-bench ความแม่นยำของ o3 อยู่ที่ประมาณ 71.7% ซึ่งสูงกว่ารุ่น o1 มากกว่า 20% ในรหัสการแข่งขัน o3 ได้รับคะแนน Elo ที่ 2727 ในขณะที่ o1 ได้รับเพียง 1891 เท่านั้น นอกจากนี้ ความแม่นยำของ o3 ในการแข่งขันคณิตศาสตร์สูงถึง 96.7% และความแม่นยำใน GPQA Diamond สูงถึง 87.7% ซึ่งสูงกว่า o1 เกือบ 10%
OpenAI ยังแนะนำวิธีการประเมินความปลอดภัยแบบใหม่ นั่นคือการจัดตำแหน่งอย่างรอบคอบ ซึ่งเป็นกระบวนทัศน์ใหม่ที่สอนข้อกำหนดด้านความปลอดภัยของโมเดลโดยตรง และสามารถฝึกโมเดลให้จำข้อกำหนดเฉพาะได้อย่างชัดเจน และให้เหตุผลอย่างถูกต้องก่อนตอบ วิธีการนี้ใช้เพื่อปรับโมเดล o-series ของ OpenAI และบรรลุการปฏิบัติตามนโยบายความปลอดภัยของ OpenAI อย่างแม่นยำสูง
ปัจจุบัน OpenAI กำลังส่งเสริมการทดสอบความปลอดภัยภายนอก และได้เปิดแอปพลิเคชันการเข้าถึงล่วงหน้าบนเว็บไซต์ ผู้สมัครจำเป็นต้องกรอกแบบฟอร์มออนไลน์และให้ข้อมูลที่เกี่ยวข้อง นักวิจัยที่ได้รับการคัดเลือกจะสามารถเข้าถึง o3 และ o3-mini เพื่อสำรวจความสามารถของพวกเขาและมีส่วนร่วมในการประเมินความปลอดภัย
การเปิดตัวโมเดลซีรีส์ OpenAI o3 ถือเป็นการพัฒนาครั้งสำคัญในด้านความสามารถในการให้เหตุผลด้านปัญญาประดิษฐ์ และประสิทธิภาพที่โดดเด่นในหลายสาขา ถือเป็นการประกาศทิศทางใหม่สำหรับการพัฒนาเทคโนโลยี AI ในอนาคต ในอนาคต เราจะให้ความสำคัญกับความคืบหน้าและการใช้งานโมเดลซีรีส์ o3 ต่อไป