รุ่น Deepseek-V3 และ Deepseek-R1 ที่เพิ่งเปิดตัวเมื่อเร็ว ๆ นี้ทำให้เกิดการตอบสนองอย่างมากในด้านปัญญาประดิษฐ์ โดยเฉพาะอย่างยิ่งน้ำหนักแบบจำลองโอเพนซอร์ส Deepseek-R1 และเปิดเผยเทคโนโลยีการฝึกอบรมทั้งหมดซึ่งได้รับความสนใจอย่างกว้างขวางในอุตสาหกรรมและยังได้รับแรงกดดันอย่างมากจาก บริษัท ต่างๆเช่น Meta วิศวกรเมตายังกล่าวต่อสาธารณชนว่าทีมกำลังตื่นตระหนกและพยายามทำซ้ำเทคโนโลยีของ Deepseek
ชุดของรุ่นที่เพิ่งเปิดตัวโดย Deepseek ทำให้เกิดความตกใจในวงกลม AI ทั่วโลก Deepseek-V3 บรรลุประสิทธิภาพสูงในราคาที่ต่ำและเทียบเคียงได้กับโมเดลที่มีการปิดตัวลงในบทวิจารณ์หลายครั้ง นอกจากนี้ยังเป็นโอเพ่นซอร์ส
Deepseek ยังเปิดเผยเทคนิคการฝึกอบรมทั้งหมด R1 ถูกเปรียบเทียบกับโมเดล O1 ของ OpenAI และเทคโนโลยีการเรียนรู้เสริมแรงถูกนำมาใช้อย่างกว้างขวางในขั้นตอนหลังการฝึกอบรม Deepseek กล่าวว่า R1 เปรียบได้กับ O1 ในงานต่าง ๆ เช่นคณิตศาสตร์รหัสการให้เหตุผลภาษาธรรมชาติและราคา API น้อยกว่า 4% ของ O1
Deepseek R1 แข็งแกร่งเกินไป! วิศวกรเมตาตกอยู่ในความหวาดกลัว: การรื้อถอนอย่างบ้าคลั่งในการคัดลอกเมื่อเร็ว ๆ นี้ Teamblind โพสต์ที่ไม่ระบุชื่อจากพนักงานเมตาในชุมชนที่ทำงานที่ไม่ระบุชื่อในต่างประเทศได้รับความนิยมเป็นพิเศษ การเปิดตัว Deepseek V3 ทำให้ Llama 4 ทั้งหมดอยู่ในเกณฑ์มาตรฐานและทีม Meta Generative AI อยู่ในความหวาดกลัว "บริษัท จีนที่ไม่รู้จัก" มีงบประมาณ 5.5 ล้านดอลลาร์ในการฝึกอบรมให้เสร็จสมบูรณ์และตบรุ่นใหญ่ที่มีอยู่ในหน้า
วิศวกรเมตารื้อถอนลึกลงไปและพยายามคัดลอกในขณะที่ผู้บริหารมีความกังวลเกี่ยวกับวิธีการอธิบายค่าใช้จ่ายสูงให้กับผู้บริหารระดับสูง การเกิดขึ้นของ Deepseek R1 ทำให้สถานการณ์แย่ลงและถึงแม้ว่าข้อมูลบางอย่างจะยังไม่สามารถเปิดเผยได้ แต่ก็จะถูกเปิดเผยต่อสาธารณะในไม่ช้าและสถานการณ์อาจจะไม่เอื้ออำนวยมากขึ้น
การแปลโพสต์ที่ไม่ระบุชื่อของพนักงาน Meta มีดังนี้ (แปลโดย Deepseek R1):
Meta Generative AI Department เข้าสู่ภาวะฉุกเฉิน
ทุกอย่างเริ่มต้นด้วย Deepseek V3 - มันทำคะแนนมาตรฐาน LLAMA 4 ดูลงวันที่ทันที สิ่งที่น่าอายยิ่งกว่านั้นคือ "บริษัท จีนที่ไม่รู้จักประสบความสำเร็จเช่นนี้ด้วยงบประมาณการฝึกอบรมเพียง 5 ล้านเหรียญ"
ทีมวิศวกรกำลังรื้อสถาปัตยกรรม Deepseek อย่างเมามันพยายามทำซ้ำรายละเอียดทางเทคนิคทั้งหมด นี่ไม่ใช่การพูดเกินจริงฐานรหัสของเราอยู่ระหว่างการค้นหาสไตล์พรม
ฝ่ายบริหารกำลังจะตายเกี่ยวกับความเป็นเหตุเป็นผลของค่าใช้จ่ายขนาดใหญ่ของกรม เมื่อเงินเดือนประจำปีของ "ผู้นำ" แต่ละคนในแผนก AI Generative เกินค่าใช้จ่ายการฝึกอบรมทั้งหมดของ Deepseek V3 และเรามี "ผู้นำ" หลายสิบคนพวกเขาควรอธิบายให้ผู้บริหารอาวุโสได้อย่างไร
Deepseek R1 ทำให้สถานการณ์จริงจังยิ่งขึ้น แม้ว่าข้อมูลที่เป็นความลับไม่สามารถเปิดเผยได้ แต่ข้อมูลที่เกี่ยวข้องจะถูกเปิดเผยต่อสาธารณะในไม่ช้า
มันควรจะเป็นทีมที่มุ่งเน้นเทคโนโลยีที่มีทักษะ แต่โครงสร้างองค์กรได้ขยายออกไปอย่างจงใจเนื่องจากการไหลบ่าเข้ามาของผู้คนจำนวนมากที่มีอิทธิพล ผลของ Game of Thrones นี้? ในท้ายที่สุดทุกคนก็กลายเป็นผู้แพ้
บทนำสู่รุ่น Deepseek SeriesDeepseek-V3: เป็นแบบจำลองภาษาผู้เชี่ยวชาญไฮบริด (MOE) ที่มีจำนวนพารามิเตอร์ 671b และโทเค็นแต่ละตัวจะเปิดใช้งาน 37B มันใช้ความสนใจแฝงหลายหัว (MLA) และสถาปัตยกรรม DeepseekMoe, ได้รับการฝึกอบรมล่วงหน้าในโทเค็นคุณภาพสูง 14.8 ล้านล้านและหลังจากการปรับแต่งการปรับแต่งและการเรียนรู้การเสริมแรง GPT-4O และ Claude 3.5 รุ่นปิดแหล่งข้อมูลยอดนิยมเช่น Sonnet มีประสิทธิภาพที่เปรียบเทียบได้ ค่าใช้จ่ายในการฝึกอบรมต่ำเพียง 2.788 ล้าน H800 GPU ชั่วโมงประมาณ 5.576 ล้านดอลลาร์สหรัฐและกระบวนการฝึกอบรมมีเสถียรภาพ
DEEPSEEK-R1: รวมถึง DEEPSEEK-R1-ZERO และ DEEPSEEK-R1 ผ่านการฝึกอบรมการเรียนรู้การเสริมแรงขนาดใหญ่ Deepseek-R1-Zero แสดงให้เห็นถึงการตรวจสอบตนเองการไตร่ตรองและความสามารถอื่น ๆ ผ่านการฝึกอบรมการเรียนรู้การเสริมแรงขนาดใหญ่และไม่พึ่งพาการปรับแต่งการปรับแต่ง (SFT) แต่มีปัญหาเช่นคนจน ความสามารถในการอ่านและความสับสนทางภาษา จาก Deepseek-R1 Deepseek-R1 แนะนำการฝึกอบรมหลายขั้นตอนและข้อมูลเริ่มต้นด้วยความเย็นซึ่งแก้ปัญหาบางอย่าง ในเวลาเดียวกันหลายรุ่นที่มีเครื่องชั่งพารามิเตอร์ที่แตกต่างกันได้เปิดขึ้นเพื่อส่งเสริมการพัฒนาชุมชนโอเพ่นซอร์ส
อะไรทำให้ Deepseek พิเศษมาก?ประสิทธิภาพที่ยอดเยี่ยม: Deepseek-V3 และ Deepseek-R1 ทำงานได้ดีในเกณฑ์มาตรฐานที่หลากหลาย ตัวอย่างเช่น Deepseek-V3 ได้ผลลัพธ์ที่ยอดเยี่ยมใน MMLU, Drop และการประเมินอื่น ๆ ; .
นวัตกรรมการฝึกอบรม:
Deepseek-V3 ใช้กลยุทธ์การบาลานซ์แบบโหลดโดยไม่มีการสูญเสียเสริมและเป้าหมายการทำนายหลายท็อก (MTP) เพื่อลดการเสื่อมสภาพของประสิทธิภาพและปรับปรุงประสิทธิภาพของแบบจำลอง
Deepseek-R1-Zero ใช้การฝึกอบรมการเรียนรู้การเสริมแรงอย่างบริสุทธิ์และใช้สัญญาณการให้รางวัลและการลงโทษเพียงอย่างเดียวเพื่อเพิ่มประสิทธิภาพแบบจำลองซึ่งพิสูจน์ให้เห็นว่าการเรียนรู้การเสริมแรงสามารถปรับปรุงความสามารถในการอนุมานของแบบจำลอง ความมั่นคงและความสามารถในการอ่าน
การแบ่งปันโอเพ่นซอร์ส: รุ่น Deepseek Series ยึดติดกับแนวคิดโอเพนซอร์สและน้ำหนักโมเดลโอเพนซอร์สเช่น Deepseek-V3 และ Deepseek-R1 และรุ่นกลั่นขนาดเล็กของพวกเขาช่วยให้ผู้ใช้สามารถฝึกอบรมรุ่นอื่น ๆ ผ่านเทคโนโลยีการกลั่น เทคโนโลยี AI
ข้อได้เปรียบหลายโดเมน: Deepseek-R1 แสดงให้เห็นถึงความสามารถที่ทรงพลังในหลายสาขา และงานสร้าง
ประสิทธิภาพที่มีต้นทุนสูง: API รุ่น Deepseek Series มีราคาไม่แพง ตัวอย่างเช่นราคาอินพุตและเอาท์พุทของ Deepseek-V3 API นั้นต่ำกว่ารุ่นที่คล้ายกันมาก
สถานการณ์ที่ใช้งานได้ DEEPSEEEK-R1งานการประมวลผลภาษาธรรมชาติ: รวมถึงการสร้างข้อความคำถามและคำตอบการแปลเครื่องสรุปข้อความ ฯลฯ ตัวอย่างเช่นในระบบคำถามและคำตอบ DEEPSEEK-R1 สามารถเข้าใจปัญหาและใช้ความสามารถในการให้เหตุผลเพื่อให้คำตอบที่ถูกต้อง
การพัฒนาโค้ด: ช่วยนักพัฒนาเขียนรหัสโปรแกรมแก้ไขข้อบกพร่องและเข้าใจตรรกะรหัส ตัวอย่างเช่นเมื่อนักพัฒนาพบปัญหารหัส Deepseek-R1 สามารถวิเคราะห์รหัสและให้บริการโซลูชันได้
การแก้ปัญหาทางคณิตศาสตร์: แก้ปัญหาทางคณิตศาสตร์ที่ซับซ้อนในการศึกษาทางคณิตศาสตร์การวิจัยทางวิทยาศาสตร์และสถานการณ์อื่น ๆ เช่น Deepseek-R1 มันทำงานได้ดีในคำถามที่เกี่ยวข้องกับการแข่งขัน AIME และสามารถใช้เพื่อช่วยเหลือนักเรียนในการเรียนรู้คณิตศาสตร์และนักวิจัยในการจัดการกับปัญหาทางคณิตศาสตร์
การวิจัยและพัฒนาแบบจำลอง: ให้การอ้างอิงและเครื่องมือสำหรับนักวิจัย AI เพื่อศึกษาการกลั่นแบบจำลองโครงสร้างแบบจำลองที่ดีขึ้นและวิธีการฝึกอบรม นักวิจัยสามารถทำการทดลองตามรูปแบบโอเพนซอร์ส Deepseek เพื่อสำรวจทิศทางเทคโนโลยีใหม่
การตัดสินใจเสริม: ประมวลผลข้อมูลและข้อมูลและให้คำแนะนำในการตัดสินใจในสาขาธุรกิจการเงิน ฯลฯ ตัวอย่างเช่นการวิเคราะห์ข้อมูลตลาดเพื่อให้การอ้างอิงสำหรับ บริษัท ในการกำหนดกลยุทธ์การตลาด
บทช่วยสอนการใช้งานสำหรับนางแบบซีรีส์ Deepseekเยี่ยมชมแพลตฟอร์ม: ผู้ใช้สามารถเข้าสู่เว็บไซต์ทางการ Deepseek (https://www.deepseek.com/) เพื่อเข้าสู่แพลตฟอร์ม
เลือกรุ่น: ในเว็บไซต์อย่างเป็นทางการหรือแอพบทสนทนาเริ่มต้นถูกขับเคลื่อนโดย Deepseek-V3 หากเรียกผ่าน API ให้ตั้งค่าพารามิเตอร์โมเดลที่สอดคล้องกันในรหัสตามข้อกำหนดเช่นการตั้งค่าโมเดล = 'Deepseek-reasoner' เมื่อใช้ Deepseek-R1
งานอินพุต: ป้อนงานที่อธิบายไว้ในภาษาธรรมชาติในส่วนต่อประสานการสนทนาเช่น "การเขียนนวนิยายรัก", "อธิบายฟังก์ชั่นของรหัสนี้", "การแก้สมการทางคณิตศาสตร์" ฯลฯ ตามข้อกำหนดของ API และเพิ่มข้อมูลที่เกี่ยวข้องกับงานที่ผ่านเป็นพารามิเตอร์อินพุต
รับผลลัพธ์: หลังจากโมเดลประมวลผลงานส่งคืนผลลัพธ์ดูข้อความที่สร้างขึ้นตอบคำถาม ฯลฯ บนอินเทอร์เฟซ
บทสรุปโมเดล Deepseek Series ได้รับผลลัพธ์ที่น่าทึ่งในสาขา AI ด้วยประสิทธิภาพที่โดดเด่นวิธีการฝึกอบรมที่เป็นนวัตกรรมการแบ่งปันจิตวิญญาณโอเพนซอร์สและข้อได้เปรียบที่คุ้มค่า
หากคุณมีความสนใจในเทคโนโลยี AI คุณอาจชอบแสดงความคิดเห็นและแบ่งปันความคิดเห็นของคุณเกี่ยวกับซีรีส์ Deepseek ในเวลาเดียวกันเรายังคงให้ความสนใจกับการพัฒนาที่ตามมาของ Deepseek และหวังว่าจะนำความประหลาดใจและความก้าวหน้ามาสู่สนาม AI มากขึ้นส่งเสริมความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยี AI และนำการเปลี่ยนแปลงและโอกาสต่างๆมาสู่ต่างๆ อุตสาหกรรม
การเกิดขึ้นของ Deepseek ได้นำพลังและการแข่งขันใหม่มาสู่สาขาปัญญาประดิษฐ์และจิตวิญญาณโอเพ่นซอร์สนั้นน่ายกย่องมากขึ้น ในอนาคตโมเดล Deepseek Series จะแสดงความสามารถอันทรงพลังของพวกเขาในสาขาเพิ่มเติมรอดูกันเถอะ!