Mistral AI เปิดตัว Pixtral12B แบบโอเพ่นซอร์สขนาดใหญ่รุ่นแรกที่น่าทึ่ง โดยมีขนาดพารามิเตอร์ 12 พันล้านและความสามารถอันทรงพลังในการประมวลผลรูปภาพและข้อความ เทียบได้กับซีรีส์ Claude ของ Anthropic และ GPT-4 ของ OpenAI สิ่งที่น่าทึ่งยิ่งกว่านั้นคือ Mistral AI เปิดเผยน้ำหนักของโมเดลโดยตรงและยังมีการดาวน์โหลดลิงก์แม่เหล็ก ซึ่งช่วยลดเกณฑ์การใช้งานลงอย่างมาก และทำให้นักพัฒนาและนักวิจัยเริ่มต้นได้ง่ายขึ้นอย่างรวดเร็ว ขนาดของ Pixtral12B อยู่ที่ 23.64GB เท่านั้น ซึ่งมีน้ำหนักเบาเมื่อเทียบกับรุ่นหลายรูปแบบ ใช้พลังงานต่ำ ติดตั้งง่าย และสามารถดาวน์โหลดได้ภายในไม่กี่นาทีภายใต้เครือข่ายความเร็วสูง
Mistral AI สร้างความตกตะลึงให้กับโลก AI อีกครั้ง และเปิดตัว Pixtral12B ซึ่งเป็นโมเดลโอเพ่นซอร์สขนาดใหญ่หลายรูปแบบรุ่นแรก โมเดลนี้ซึ่งสามารถประมวลผลรูปภาพและข้อความได้พร้อมกัน ไม่เพียงแต่มีความก้าวหน้าทางเทคโนโลยีเท่านั้น แต่ยังดึงดูดความสนใจอย่างกว้างขวางในเรื่องการเปิดกว้างอีกด้วย Mistral AI เผยแพร่ตุ้มน้ำหนักแบบจำลองโดยตรงทางออนไลน์ และยังมีลิงก์แม่เหล็กที่รอบคอบอีกด้วย
จุดเด่นของ Pixtral12B ไม่ใช่แค่ฟังก์ชั่นอันทรงพลังเท่านั้น แต่ยังรวมถึงการออกแบบที่ประณีตอีกด้วย ขนาดโมเดลรวมเพียง 23.64GB ทำให้เป็นเครื่องเล่นที่มีน้ำหนักเบาในบรรดาโมเดลหลายรูปแบบ ฟีเจอร์นี้ช่วยลดการใช้พลังงานและเกณฑ์การปรับใช้ลงอย่างมาก ช่วยให้นักพัฒนาและนักวิจัยสามารถเริ่มต้นได้อย่างง่ายดายมากขึ้น มีรายงานว่าผู้ใช้ที่มีการเชื่อมต่ออินเทอร์เน็ตความเร็วสูงสามารถดาวน์โหลดให้เสร็จสิ้นได้ภายในเวลาเพียงไม่กี่นาที ซึ่งช่วยปรับปรุงการเข้าถึงของโมเดลได้อย่างมาก
ในฐานะผลงานชิ้นเอกล่าสุดของ Mistral AI นั้น Pixtral12B ได้รับการพัฒนาโดยใช้โมเดลข้อความ Nemo12B และมีพารามิเตอร์ 12 พันล้านตัว ความสามารถของมันเทียบได้กับโมเดลหลายรูปแบบที่มีชื่อเสียง เช่น Claude series ของ Anthropic และ GPT-4 ของ OpenAI และสามารถเข้าใจและตอบคำถามที่เกี่ยวข้องกับรูปภาพที่ซับซ้อนได้หลากหลาย
ในแง่ของข้อกำหนดทางเทคนิค Pixtral12B ก็น่าประทับใจไม่แพ้กัน ด้วยโครงสร้างเครือข่าย 40 เลเยอร์ มิติที่ซ่อนอยู่ 14,336 มิติ หัวความสนใจ 32 หัว และตัวเข้ารหัสภาพเฉพาะ 400M ที่รองรับการประมวลผลภาพความละเอียด 1024x1024
สิ่งที่ควรค่าแก่การกล่าวขวัญก็คือ Pixtral12B ทำงานได้ดีในการทดสอบเกณฑ์มาตรฐานที่เชื่อถือได้หลายรายการ บนแพลตฟอร์มเช่น MMMU, Mathvista, ChartQA และ DocVQA ผลลัพธ์ของมันได้แซงหน้าโมเดล multi-modal ที่มีชื่อเสียงมากมาย รวมถึง Phi-3 และ Qwen-27B ซึ่งพิสูจน์ให้เห็นถึงความแข็งแกร่งอย่างเต็มรูปแบบ
การเคลื่อนไหวของ Mistral AI จะส่งเสริมคลื่นโอเพ่นซอร์สของโมเดลหลายรูปแบบอย่างไม่ต้องสงสัย กระแสตอบรับของชุมชนต่อโมเดลใหม่นี้ล้นหลาม โดยนักพัฒนาและนักวิจัยจำนวนมากกระตือรือร้นที่จะเริ่มสำรวจศักยภาพของ Pixtral12B สิ่งนี้ไม่เพียงสะท้อนถึงความมีชีวิตชีวาของชุมชนโอเพ่นซอร์สเท่านั้น แต่ยังบ่งชี้ว่าเทคโนโลยี AI แบบหลายรูปแบบอาจนำไปสู่นวัตกรรมรอบใหม่
ด้วยการเปิดตัว Pixtral12B เรามีเหตุผลที่จะตั้งตารอที่จะมีแอปพลิเคชั่นที่เป็นนวัตกรรมมากขึ้น ไม่ว่าในด้านความเข้าใจภาพ การวิเคราะห์เอกสาร หรือการให้เหตุผลข้ามรูปแบบ โมเดลนี้อาจนำมาซึ่งความก้าวหน้าที่ก้าวล้ำหน้า การเคลื่อนไหวของ Mistral AI นี้มีส่วนทำให้เทคโนโลยี AI เป็นประชาธิปไตยและแพร่หลายอย่างไม่ต้องสงสัย ให้เรารอดูว่ามันจะปรับรูปแบบของสนาม AI ในอนาคตอย่างไร
ที่อยู่กอด: https://huggingface.co/mistral-community/pixtral-12b-240910
การเปิดตัว Pixtral12B แบบโอเพ่นซอร์สถือเป็นก้าวใหม่ในการพัฒนาเทคโนโลยี AI แบบหลายรูปแบบ การออกแบบที่มีน้ำหนักเบาและประสิทธิภาพอันทรงพลังจะช่วยส่งเสริมความนิยมและการประยุกต์เทคโนโลยี AI อย่างมาก .