บริษัท AI ในหางโจว DeepSeek ได้เปิดตัวโมเดลภาษาขนาดใหญ่ล่าสุด V3 ซึ่งมีประสิทธิภาพใกล้เคียงกับ GPT-4 ของ OpenAI และ Claude 3.5Sonnet ของ Anthropic ในราคาที่ต่ำ (5.6 ล้านเหรียญสหรัฐ) ซึ่งดึงดูดความสนใจของอุตสาหกรรม ความสำเร็จนี้ตอกย้ำขีดความสามารถด้านการวิจัยและวิศวกรรมอันแข็งแกร่งของ DeepSeek ภายใต้ทรัพยากรที่จำกัด และยังมอบแนวคิดใหม่ๆ สำหรับการวิจัยและพัฒนาแบบจำลองภาษาขนาดใหญ่ ซึ่งท้าทายแนวคิดดั้งเดิมที่ว่าการลงทุนสูงสามารถสร้างผลตอบแทนสูงได้ ความสำเร็จของรุ่น V3 อาจบ่งบอกถึงความเป็นไปได้มากขึ้นในการพัฒนาด้าน AI ในอนาคต
เมื่อเร็วๆ นี้ DeepSeek บริษัท AI ในเมืองหางโจว ได้เปิดตัวโมเดลภาษาขนาดใหญ่รุ่นล่าสุด V3 ประสิทธิภาพของโมเดลโอเพ่นซอร์สนี้ในการทดสอบเกณฑ์มาตรฐานหลายรายการนั้นใกล้เคียงกับประสิทธิภาพของ 4o ของ OpenAI และ Claude3.5Sonnet ของ Anthropic ซึ่งสร้างความประทับใจให้กับอุตสาหกรรม เมื่อเทียบกับเงินลงทุนหลายร้อยล้านดอลลาร์ที่ลงทุนโดยบริษัทคู่ค้าในอเมริกา ราคารวมของรุ่น V3 ของ DeepSeek อยู่ที่เพียง 5.6 ล้านดอลลาร์สหรัฐฯ ซึ่งแตกต่างอย่างมากจนสะดุดตา
Liang Wenfeng ซีอีโอของ DeepSeek กล่าวว่าเงินทุนไม่เคยเป็นปัญหาสำหรับพวกเขา แม้ว่า V3 จะได้รับการฝึกอบรมโดยใช้ชิป H800 แต่ทีม DeepSeek ยังสามารถแสดงให้เห็นถึงความสามารถด้านการวิจัยและวิศวกรรมที่แข็งแกร่งด้วยทรัพยากรที่จำกัด
Andrej Karpathy ผู้บุกเบิกด้าน AI แสดงความคิดเห็นว่างบประมาณการลงทุนของ DeepSeek นั้น "เป็นเรื่องตลก" แต่ผลลัพธ์สุดท้ายคือ "การวิจัยและวิศวกรรมที่น่าประทับใจอย่างมากภายใต้ข้อจำกัดด้านทรัพยากร"
AGI ได้รับการยกย่องว่าเป็น "จอกศักดิ์สิทธิ์" ของการวิจัย AI ซึ่งมีศักยภาพเหนือกว่ามนุษย์ในการแก้ปัญหาและปฏิบัติงาน ผู้เชี่ยวชาญที่เกี่ยวข้องคาดการณ์ว่าเมื่อเทคโนโลยีเติบโตเต็มที่ ประเทศแรกที่นำ AGI ไปใช้จะมีข้อได้เปรียบทางเศรษฐกิจ วิทยาศาสตร์ และความปลอดภัยอย่างมาก
ความสำเร็จของโมเดล DeepSeek V3 ไม่เพียงแต่พิสูจน์ว่าความก้าวหน้าที่ก้าวล้ำสามารถทำได้ด้วยต้นทุนที่ต่ำ แต่ที่สำคัญกว่านั้น ยังมอบมุมมองและทิศทางใหม่สำหรับการวิจัยและพัฒนา AI ระดับโลก และยังนำประโยชน์มาสู่ประเทศกำลังพัฒนาในการตามทันเทคโนโลยีขั้นสูง ระดับปัญญาประดิษฐ์ได้รับความหวัง ในอนาคตอาจมี "ปาฏิหาริย์" ที่คล้ายกันเกิดขึ้นอีก