โมเดลขนาดใหญ่ R1 ซึ่งออกแบบโดยทีมงาน DeepSeek ของจีน ได้แสดงให้เห็นถึงข้อได้เปรียบที่น่าประทับใจทั้งในแง่ของประสิทธิภาพและราคา ซึ่งดึงดูดความสนใจอย่างกว้างขวางจากชุมชนเทคโนโลยีระดับโลก มันเหนือกว่าโมเดล o1 ของ OpenAI ในการทดสอบที่เชื่อถือได้หลายรายการ โดยเฉพาะอย่างยิ่งในสาขาคณิตศาสตร์และการเขียนโปรแกรม มันโดดเด่นด้วยข้อได้เปรียบด้านต้นทุนที่ต่ำมากและกลายเป็นม้ามืดในด้านโอเพนซอร์สโมเดลขนาดใหญ่ โอเพ่นซอร์สของ R1 ไม่เพียงแต่แสดงให้เห็นถึงความก้าวหน้าของจีนในด้านเทคโนโลยีแบบจำลองขนาดใหญ่เท่านั้น แต่ยังอัดฉีดพลังใหม่ให้กับการพัฒนา AI ระดับโลกอีกด้วย
ข้อความ: เมื่อเร็วๆ นี้ ทีม DeepSeek ของจีนได้เปิดตัวโอเพ่นซอร์สรุ่นใหญ่ R1 รุ่นใหม่ล่าสุด ซึ่งได้รับความสนใจอย่างกว้างขวาง ประสิทธิภาพของโมเดล R1 นั้นดีมาก โดยเหนือกว่าโมเดล o1 ของ OpenAI ในการทดสอบหลายๆ ครั้ง โดยเฉพาะในการประเมินทางคณิตศาสตร์และการเขียนโปรแกรม
ในการทดสอบ AIME2024 ของอเมริกาครั้งล่าสุด R1 ได้คะแนน 79.8 แซงหน้า 79.2 คะแนนของ o1 ในการทดสอบ MATH-500 นั้น R1 ได้คะแนน 97.3 คะแนน ซึ่งเหนือกว่า o1 ที่มี 96.4 คะแนนเช่นกัน นอกจากนี้ ในการทดสอบ SWE-bench Verified นั้น R1 ได้คะแนน 49.2 ซึ่งเกินคะแนน 48.9 ของ o1 เช่นกัน แม้ว่าในการทดสอบโค้ด Codeforces นั้น R1 จะต่ำกว่า o1 เพียง 0.3 คะแนน แต่ประสิทธิภาพโดยรวมก็เทียบเท่ากับรุ่น o1
นอกจากประสิทธิภาพแล้ว ความได้เปรียบด้านต้นทุนของ R1 ยังสะดุดตามากยิ่งขึ้นอีกด้วย โมเดล o1 ของ OpenAI มีค่าธรรมเนียมอินพุตสูงถึง 15 เหรียญสหรัฐต่อ 1 ล้านโทเค็น ในขณะที่ราคา R1 อยู่ที่ 0.14 เหรียญสหรัฐ ซึ่งลดต้นทุนได้ถึง 90% ในแง่ของผลผลิต ค่าธรรมเนียมของ o1 อยู่ที่ 60 เหรียญสหรัฐต่อ 1 ล้านโทเค็น ในขณะที่ R1 มีราคาเพียง 2.19 เหรียญสหรัฐ ซึ่งลดลง 27 เท่า ความแตกต่างด้านต้นทุนมหาศาลนี้ทำให้ R1 โดดเด่นในด้านโอเพ่นซอร์สโมเดลขนาดใหญ่
หลังจากที่ทีมงาน DeepSeek ประกาศว่า R1 เป็นโอเพ่นซอร์ส ชาวเน็ตต่างชาติจำนวนมากแสดงความชื่นชมโมเดลนี้ โดยเชื่อว่า R1 เหนือกว่าแพลตฟอร์มโอเพ่นซอร์สที่จัดตั้งขึ้น เช่น Meta และ Mistral ในแง่ของประสิทธิภาพด้านต้นทุนและประสิทธิภาพ หลายๆ คนบอกว่าความสามารถในการให้เหตุผลที่มีประสิทธิภาพของโมเดล R1 ทำให้เป็นเลิศในการเขียนโค้ดและการอธิบายทางคณิตศาสตร์ ผู้ใช้บางคนถึงกับเรียกมันว่า "โมเดลที่คล้ายกับบทพูดคนเดียวภายในตัวของมนุษย์มากที่สุด" ในเวลาเดียวกัน Awni Hannun นักวิจัยด้านแมชชีนเลิร์นนิงของ Apple ยังได้ทดสอบ R1 ด้วย และพบว่า R1 ทำงานได้อย่างรวดเร็วและมีประสิทธิภาพในการอนุมานสูงบน Apple M2Ultra
การพัฒนาโมเดล R1 ต้องผ่านกระบวนการฝึกอบรมแบบหลายขั้นตอน รวมถึงข้อมูลแบบ Cold-Start และการฝึกอบรมแบบหลายขั้นตอนเพื่อปรับปรุงความสามารถในการอนุมานและความสามารถในการอ่าน การปรับปรุงด้านเทคนิคเหล่านี้ช่วยให้มั่นใจได้ถึงประสิทธิภาพที่เหนือกว่าของรุ่น R1 ในงานที่หลากหลาย
ด้วยการเปิดตัว R1 โมเดลโอเพ่นซอร์สขนาดใหญ่ของจีนได้รับความสนใจและการอภิปรายอย่างมากในตลาดต่างประเทศอีกครั้ง และผู้ที่ชื่นชอบเทคโนโลยีจำนวนมากได้แสดงความคาดหวังถึงศักยภาพของโมเดลนี้ การเปิดตัว R1 ถือเป็นความก้าวหน้าอีกขั้นของจีนในด้านเทคโนโลยีโมเดลขนาดใหญ่ และส่งเสริมการพัฒนาเทคโนโลยีโอเพ่นซอร์ส
ที่อยู่โอเพ่นซอร์ส: https://huggingface.co/deepseek-ai/R1
API: https://api-docs.deepseek.com/guides/reasoning_model
ไฮไลท์:
โมเดล R1 เหนือกว่า o1 ของ OpenAI ในการทดสอบหลายครั้ง ซึ่งแสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยม
ต้นทุนอินพุตและเอาต์พุตของ R1 ต่ำเพียง 0.14 ดอลลาร์และ 2.19 ดอลลาร์ตามลำดับ ซึ่งลดต้นทุนได้ถึง 90%
R1 ได้รับความสนใจอย่างกว้างขวางตั้งแต่เป็นโอเพ่นซอร์ส ผู้เชี่ยวชาญจากต่างประเทศจำนวนมากชื่นชมประสิทธิภาพของมันและเชื่อว่ามันคุ้มค่าอย่างยิ่ง
การเกิดขึ้นของ R1 ไม่เพียงแต่ช่วยให้นักพัฒนามีเครื่องมืออันทรงพลังที่มีประสิทธิภาพสูงและต้นทุนต่ำเท่านั้น แต่ยังเป็นการประกาศถึงนวัตกรรมอย่างต่อเนื่องของจีนและการปรับปรุงความสามารถในการแข่งขันในด้านปัญญาประดิษฐ์ เราตั้งตารอที่ R1 จะนำความก้าวหน้ามาสู่สาขาอื่นๆ มากขึ้นในอนาคต