เมื่อเร็วๆ นี้ Mistral Corporation ได้เปิดตัวการอัปเดตครั้งใหญ่สำหรับโมเดลการสร้างโค้ดโอเพ่นซอร์ส Codestral - Codestral25.01 เวอร์ชันนี้ได้รับการปรับให้เหมาะสมทางสถาปัตยกรรม ซึ่งเร็วกว่ารุ่นก่อนหน้าถึงสองเท่า และทำงานได้ดีในการทดสอบเกณฑ์มาตรฐานต่างๆ โดยเฉพาะอย่างยิ่งในการทดสอบการเข้ารหัส Python Codestral25.01 รองรับฟังก์ชันต่างๆ มากมาย เช่น การแก้ไขโค้ด การสร้างการทดสอบ และการเติมโค้ด โดยมีเป้าหมายเพื่อให้นักพัฒนาได้รับประสบการณ์การสร้างโค้ดที่มีประสิทธิภาพมากขึ้น ได้รับความสนใจจากตลาดอย่างรวดเร็วและติดอันดับหนึ่งในการจัดอันดับ Copilot Arena Mistral นำเสนอหลายวิธีในการเข้าถึง Codestral25.01 รวมถึงปลั๊กอิน IDE, แพลตฟอร์ม Mistral, เวอร์ชันตัวอย่าง Google Vertex AI และ Azure AI Foundry และจะพร้อมใช้งานบน Amazon Bedrock ในอนาคต
ตามโพสต์ในบล็อกของ Mistral สถาปัตยกรรมของ Codestral 25.01 ได้รับการปรับให้เหมาะสม และสัญญาว่าจะเป็น "ผู้นำอย่างแท้จริง" ในบรรดาโมเดลที่คล้ายกัน โดยมีการสร้างโค้ดเร็วกว่าเวอร์ชันก่อนหน้าถึงสองเท่า เวอร์ชันใหม่นี้ยังคงรักษาข้อดีของรุ่นเดิม โดยมุ่งเน้นไปที่การดำเนินงานที่มีความหน่วงต่ำและความถี่สูง รองรับงานต่างๆ เช่น การแก้ไขโค้ด การสร้างการทดสอบ และการกรอกโค้ด Mistral กล่าวว่าสิ่งนี้มีความสำคัญอย่างยิ่งสำหรับองค์กรที่มีข้อมูลจำนวนมากและกรณีการใช้งานแบบโมเดล
ในการทดสอบเกณฑ์มาตรฐานต่างๆ Codestral25.01 ทำงานได้ดีในการทดสอบการเข้ารหัส Python โดยได้รับคะแนนสูงถึง 86.6% ในการทดสอบ HumanEval ซึ่งเหนือกว่า Codestral, Codellama70B Instruct และ DeepSeek Coder33B Instruct เวอร์ชันก่อนหน้า
นักพัฒนาสามารถใช้ Codestral25.01 ผ่านพันธมิตรปลั๊กอิน IDE ของ Mistral นอกจากนี้ ผู้ใช้ยังสามารถเข้าถึง API ของโมเดลผ่านแพลตฟอร์มของ Mistral และ Google Vertex AI ได้อีกด้วย
นับตั้งแต่ Codestral เปิดตัวครั้งแรกในเดือนพฤษภาคม 2023 Mistral ได้ส่งเสริมการอัปเกรดและนวัตกรรมของผลิตภัณฑ์อย่างต่อเนื่อง โมเดล Codestral-Mamba ที่แนะนำก่อนหน้านี้ใช้สถาปัตยกรรม Mamba และสามารถสร้างสตริงโค้ดที่ยาวขึ้นและจัดการอินพุตได้มากขึ้น เป็นที่น่าสังเกตว่า Codestral25.01 ได้ไต่ขึ้นสู่อันดับ C opilot Arena อย่างรวดเร็วภายในไม่กี่ชั่วโมงหลังจากการประกาศของ Mistral ซึ่งแสดงให้เห็นถึงความสนใจอย่างมากของตลาดในรุ่นใหม่นี้
การเขียนโค้ดเป็นหนึ่งในคุณสมบัติเบื้องต้นของโมเดลพื้นฐาน แม้ว่าจะใช้ในโมเดลทั่วไป เช่น o3 ของ OpenAI และ Claude ของ Anthropic แต่ในปีที่ผ่านมา โมเดลที่เน้นไปที่การเขียนโปรแกรมก็มีความก้าวหน้าอย่างมาก ซึ่งมักจะเหนือกว่าโมเดลขนาดใหญ่บางรุ่น . รุ่นสากล. ล่าสุด Alibaba, DeepSeek Coder และ Microsoft ได้เปิดตัวโมเดลการเขียนโปรแกรมใหม่ๆ และการแข่งขันก็รุนแรงมากขึ้น
ในบรรดานักพัฒนาจำนวนมาก ยังคงมีการถกเถียงกันว่าจะเลือกโมเดลสำหรับวัตถุประสงค์ทั่วไปหรือโมเดลที่เน้นการเขียนโปรแกรม นักพัฒนาซอฟต์แวร์บางรายชอบใช้โมเดลสำหรับใช้งานทั่วไป เช่น Claude ในขณะที่ความต้องการงานเขียนโปรแกรมกระตุ้นให้เกิดโมเดลเฉพาะทาง เนื่องจาก Codestral ได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่เข้ารหัสโดยเฉพาะ จึงทำงานได้ดีกว่าในงานการเขียนโปรแกรมโดยธรรมชาติ
บล็อกอย่างเป็นทางการ: https://mistral.ai/news/codestral-2501/
ไฮไลท์:
Mistral เปิดตัว Codestral 25.01 ซึ่งเพิ่มความเร็วในการสร้างโค้ดเป็นสองเท่าของเวอร์ชันก่อนหน้า
โมเดลดังกล่าวทำงานได้ดีในการทดสอบการเข้ารหัส Python โดยได้คะแนนการทดสอบ HumanEval 86.6%
Codestral25.01 ขึ้นสู่จุดสูงสุดของ C opilot Arena อย่างรวดเร็ว และได้รับความสนใจอย่างกว้างขวางจากนักพัฒนา
การเปิดตัว Codestral25.01 ถือเป็นการเพิ่มความเข้มข้นของการแข่งขันในด้านโมเดลการสร้างโค้ด ประสิทธิภาพที่ยอดเยี่ยมและการเข้าถึงที่สะดวกสบาย ทำให้เป็นเครื่องมือใหม่ที่คู่ควรแก่ความสนใจของนักพัฒนา เป็นเรื่องที่ควรค่าแก่การรอคอยว่า Mistral จะปรับปรุง Codestral ต่อไปในอนาคตอย่างไร