นอกเหนือจาก Gemma2! IBM เปิดตัวโมเดล Granite3.1: รองรับความยาวบริบท 128K

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-25 20:00:02

IBM ประกาศเปิดตัวโมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์สรุ่นใหม่ Granite3.1 โดยมีเป้าหมายเพื่อเป็นผู้นำในด้าน AI ระดับองค์กร Granite3.1 มีจุดเด่นมากมาย รวมถึงขยายความยาวบริบทเป็น 128K โมเดลการฝังที่มีประสิทธิภาพ ความสามารถในการตรวจจับอาการประสาทหลอนในตัว และปรับปรุงประสิทธิภาพโดยรวมอย่างมีนัยสำคัญ จากข้อมูลของ IBM โมเดล Granite8B Instruct ทำงานได้ดีที่สุดในบรรดาโมเดลโอเพ่นซอร์สที่มีขนาดเท่ากัน โดยเหนือกว่าคู่แข่งอย่าง Meta's Llama3.1, Qwen2.5 และ Gemma2 ของ Google การเปิดตัวโมเดลใหม่นี้เกิดขึ้นภายหลังการเปิดตัว Granite 3.0 ในเดือนตุลาคม ซึ่งสะท้อนให้เห็นถึงความทำซ้ำอย่างรวดเร็วและการลงทุนอย่างต่อเนื่องของไอบีเอ็มในด้าน generative AI โดยมีรายได้จากธุรกิจที่เกี่ยวข้องสูงถึง 2 พันล้านดอลลาร์สหรัฐ

IBM เปิดตัวโมเดลภาษาโอเพ่นซอร์สขนาดใหญ่รุ่นใหม่ Granite3.1 อย่างเป็นทางการ โดยมุ่งมั่นที่จะครองตำแหน่งผู้นำในด้าน AI ระดับองค์กร ซีรีส์โมเดลนี้นำเสนอความยาวบริบทที่ขยาย 128K โมเดลแบบฝัง ความสามารถในการตรวจจับอาการประสาทหลอนในตัว และการปรับปรุงประสิทธิภาพที่สำคัญ

IBM อ้างว่าโมเดล Granite8B Instruct ทำงานได้ดีที่สุดในบรรดาคู่แข่งโอเพ่นซอร์สที่มีขนาดเท่ากัน รวมถึง Llama3.1, Qwen2.5 ของ Meta และ Gemma2 ของ Google

การเปิดตัวโมเดล Granite3.1 เกิดขึ้นท่ามกลางการเปิดตัวซีรีส์ Granite3.0 อย่างรวดเร็วของไอบีเอ็ม IBM เปิดเผยว่ารายรับจากธุรกิจที่เกี่ยวข้องกับการสร้าง AI สูงถึง 2 พันล้านดอลลาร์ แนวคิดหลักของเวอร์ชันใหม่คือการรวมฟังก์ชันการทำงานเพิ่มเติมเข้ากับโมเดลขนาดเล็กเพื่อให้สามารถรันได้ง่ายขึ้นและคุ้มค่าสำหรับผู้ใช้ทางธุรกิจ

David Cox รองประธานฝ่ายวิจัยของ IBM กล่าวว่าโมเดล Granite ถูกนำมาใช้กันอย่างแพร่หลายในผลิตภัณฑ์ภายใน บริการให้คำปรึกษา และการบริการลูกค้าของ IBM และยังเปิดตัวในรูปแบบโอเพ่นซอร์สด้วย ดังนั้นจึงจำเป็นต้องเข้าถึงระดับสูงในทุกด้าน การประเมินประสิทธิภาพของโมเดลไม่เพียงแต่ขึ้นอยู่กับความเร็วเท่านั้น แต่ยังขึ้นอยู่กับประสิทธิภาพด้วย ซึ่งช่วยให้ผู้ใช้ประหยัดเวลาในการรับผลลัพธ์

ในแง่ของความยาวบริบท การปรับปรุง Granite3.1 มีความชัดเจนเป็นพิเศษ โดยขยายจากเวอร์ชันแรกของ 4K ไปเป็น 128K ซึ่งมีความสำคัญเป็นพิเศษสำหรับผู้ใช้ AI ระดับองค์กร โดยเฉพาะอย่างยิ่งในแง่ของการเรียกข้อมูล Enhanced Generation (RAG) และ AI ตัวแทนอัจฉริยะ ความยาวบริบทที่ขยายช่วยให้โมเดลสามารถประมวลผลเอกสาร บันทึก และการสนทนาที่ยาวขึ้น ช่วยให้เข้าใจและตอบสนองต่อคำถามที่ซับซ้อนได้ดีขึ้น

IBM ยังได้เปิดตัวชุดโมเดลการฝังเพื่อเร่งกระบวนการแปลงข้อมูลเป็นเวกเตอร์ ในจำนวนนี้ เวลาในการสืบค้นของรุ่น Granite-Embedding-30M-English คือ 0.16 วินาที ซึ่งเร็วกว่าผลิตภัณฑ์ของคู่แข่ง เพื่อให้บรรลุการปรับปรุงประสิทธิภาพของ Granite3.1 นั้น IBM ได้สร้างสรรค์กระบวนการฝึกอบรมแบบหลายขั้นตอนและการใช้ข้อมูลการฝึกอบรมคุณภาพสูง

ในแง่ของการตรวจจับภาพหลอน โมเดล Granite3.1 ได้รวมการป้องกันภาพหลอนไว้ในโมเดล ซึ่งสามารถตรวจจับตัวเองและลดเอาต์พุตที่ผิดพลาดได้ การตรวจจับในตัวนี้จะปรับประสิทธิภาพโดยรวมให้เหมาะสมและลดจำนวนการโทรอนุมาน

ปัจจุบัน โมเดล Granite3.1 เปิดให้ผู้ใช้ระดับองค์กรใช้งานได้ฟรี และให้บริการผ่านบริการ AI ระดับองค์กร Watsonx ของ IBM ในอนาคต IBM วางแผนที่จะรักษาอัตราการอัปเดตอย่างรวดเร็ว และ Granite 3.2 จะเปิดตัวฟังก์ชันหลายรูปแบบในต้นปี 2568

บล็อกอย่างเป็นทางการ: https://www.ibm.com/new/announcements/ibm-granite-3-1-powerful-Performance-long-context-and-more

ไฮไลท์:

IBM เปิดตัวโมเดล Granite3.1 โดยมีเป้าหมายที่จะเป็นผู้นำในตลาดโมเดลภาษาโอเพ่นซอร์สขนาดใหญ่

รุ่นใหม่รองรับความยาวบริบท 128K ซึ่งปรับปรุงความสามารถและประสิทธิภาพการประมวลผลอย่างมาก

ความสามารถในการตรวจจับภาพลวงตาถูกรวมเข้ากับโมเดล ช่วยเพิ่มประสิทธิภาพและความแม่นยำโดยรวม

โดยรวมแล้ว การเปิดตัว Granite3.1 ถือเป็นความก้าวหน้าครั้งสำคัญอีกประการหนึ่งสำหรับ IBM ในด้านโมเดลภาษาโอเพ่นซอร์สขนาดใหญ่ ประสิทธิภาพอันทรงพลังและฟังก์ชันที่หลากหลายจะนำประสบการณ์ AI ที่สะดวกและมีประสิทธิภาพยิ่งขึ้นมาสู่ผู้ใช้ระดับองค์กร การทำซ้ำในอนาคตคุ้มค่ากับการรอคอย