ที่งาน FORCE Motive Power Conference เมื่อวันที่ 18 ธันวาคม 2567 Volcano Engine ได้เปิดตัวการอัพเกรดตระกูล beanbag ขนาดใหญ่อย่างครอบคลุม สิ่งที่สะดุดตาที่สุดคือการเปิดตัวโมเดลการทำความเข้าใจด้วยภาพใหม่ โมเดลนี้รองรับการป้อนข้อความและรูปภาพพร้อมกัน มีความสามารถในการจดจำ ทำความเข้าใจ และให้เหตุผลได้ดียิ่งขึ้น และให้บริการแก่ผู้ใช้ในราคาที่แข่งขันได้ การอัปเกรดนี้ไม่เพียงแต่ปรับปรุงขีดความสามารถในการใช้งานของโมเดลขนาดใหญ่ Beanbao ในด้านต่างๆ เท่านั้น แต่ยังแสดงให้เห็นว่าเทคโนโลยีการทำความเข้าใจด้วยภาพได้เข้าสู่ขั้นตอนใหม่ของการพัฒนา โดยนำโซลูชัน AI ที่สะดวกและมีประสิทธิภาพมากขึ้นมาสู่องค์กรและนักพัฒนา
ที่งาน Volcano Engine FORCE Motive Power Conference เมื่อวันที่ 18 ธันวาคม 2024 Volcano Engine ได้ประกาศการอัปเกรดตระกูลโมเดลขนาดใหญ่ Beanbao อย่างครอบคลุม และเปิดตัวโมเดลที่เข้าใจด้วยภาพใหม่ล่าสุด
Tan Dai ประธานบริษัท Volcano Engine กล่าวว่าการใช้งานโทเค็นโดยเฉลี่ยต่อวันในโมเดล Doubao เพิ่มขึ้นอย่างรวดเร็วในช่วงไม่กี่เดือนที่ผ่านมา โดยแตะมากกว่า 4 ล้านล้าน ซึ่งเพิ่มขึ้น 33 เท่าเมื่อเทียบกับเวลาที่เปิดตัวในเดือนพฤษภาคม แนวโน้มที่เพิ่มขึ้นนี้แสดงให้เห็นถึงการใช้บีนแบ็กขนาดใหญ่อย่างกว้างขวางในสถานการณ์การใช้งานที่หลากหลาย
ครั้งนี้ Volcano Engine เปิดตัวโมเดลการทำความเข้าใจด้วยภาพ ช่วยให้ผู้ใช้สามารถป้อนคำถามทั้งข้อความและรูปภาพได้ในเวลาเดียวกัน และโมเดลสามารถเข้าใจได้อย่างครอบคลุมและให้คำตอบที่ถูกต้อง นวัตกรรมนี้จะทำให้กระบวนการพัฒนาแอปพลิเคชันง่ายขึ้นอย่างมาก และกระตุ้นศักยภาพของโมเดลขนาดใหญ่ในสถานการณ์ต่างๆ ได้มากขึ้น
โมเดลการทำความเข้าใจด้วยภาพมีความสามารถในการจดจำเนื้อหาที่แข็งแกร่งขึ้น ไม่เพียงแต่สามารถระบุองค์ประกอบพื้นฐาน เช่น หมวดหมู่วัตถุและรูปร่างในรูปภาพ แต่ยังเข้าใจความสัมพันธ์ระหว่างวัตถุ เค้าโครงเชิงพื้นที่ และความหมายโดยรวมของฉากอีกด้วย เช่น การระบุเงา การระบุความรู้ทางธรรมชาติ เป็นต้น
โมเดลการทำความเข้าใจด้วยภาพมีความสามารถในการทำความเข้าใจและการให้เหตุผลที่แข็งแกร่งขึ้น ไม่เพียงแต่สามารถระบุเนื้อหาได้ดีขึ้น แต่ยังทำการคำนวณเชิงตรรกะที่ซับซ้อนโดยอิงจากข้อมูลข้อความและรูปภาพที่รู้จัก เช่น การใช้เหตุผลเชิงกราฟิกและการให้เหตุผลทางกายภาพ
นอกจากนี้ยังมีความสามารถในการอธิบายภาพที่ละเอียดอ่อนมากขึ้น ซึ่งสามารถอธิบายเนื้อหาของภาพได้ละเอียดมากขึ้นตามข้อมูลภาพ และยังสามารถสร้างรูปแบบวรรณกรรมได้หลากหลาย เช่น การสร้างภาพ การสร้างภาพบทกวี เป็นต้น
โมเดลการทำความเข้าใจด้วยภาพ Doubao แสดงให้เห็นโอกาสในการนำไปใช้อย่างกว้างขวางในหลายสาขา เช่น การศึกษา การท่องเที่ยว และอีคอมเมิร์ซ ตัวอย่างเช่น ในด้านการศึกษา แบบจำลองสามารถช่วยนักเรียนเพิ่มประสิทธิภาพการจัดองค์ประกอบและความรู้ด้านวิทยาศาสตร์ที่เป็นที่นิยม ในด้านการท่องเที่ยว แบบจำลองนี้สามารถให้คำแปลเมนูต่างประเทศแก่นักท่องเที่ยวและคำอธิบายความรู้พื้นฐานทางสถาปัตยกรรมในการตลาดอีคอมเมิร์ซ ซึ่งสามารถช่วยอธิบายร้านค้าได้ ลักษณะผลิตภัณฑ์โดยละเอียด ซึ่งจะช่วยปรับปรุงประสิทธิภาพการโฆษณา
ค่าใช้จ่ายในการใช้แบบจำลองการทำความเข้าใจด้วยภาพนั้นใกล้เคียงกับผู้คนมาก ราคาต่อพันโทเค็นอยู่ที่ 0.003 หยวน ซึ่งต่ำกว่าราคาเฉลี่ยของอุตสาหกรรมถึง 85% ระดับราคานี้ช่วยให้แต่ละดอลลาร์สามารถประมวลผลภาพได้มากถึง 284 720P นับเป็นการเข้าสู่เทคโนโลยีการเข้าใจภาพในยุค "ศตวรรษ" นอกจากนี้ Volcano Engine ยังให้การสนับสนุนการรับส่งข้อมูลเริ่มต้นสูงสุด 15,000 รายการแก่องค์กรและนักพัฒนา เพื่อช่วยให้พวกเขาใช้เทคโนโลยีนี้ได้ดียิ่งขึ้น
ในการประชุมครั้งนี้ Volcano Engine ไม่เพียงแต่เปิดตัวโมเดลการทำความเข้าใจด้วยภาพเท่านั้น แต่ยังได้อัปเกรดโมเดลอื่นๆ หลายรุ่นอีกด้วย ความสามารถในการประมวลผลงานที่ครอบคลุมของ Doubao Universal Model Pro เพิ่มขึ้น 32% เมื่อเทียบกับเดือนพฤษภาคม และยังมีการปรับปรุงที่สำคัญในด้านต่างๆ เช่น การใช้เหตุผล การปฏิบัติตามคำสั่ง การเขียนโค้ด และคณิตศาสตร์ ขณะเดียวกัน โมเดลบีนแบ็กและวิดีโอจะเปิดให้ประชาชนทั่วไปเข้าชมได้ในเดือนมกราคม 2568 และบริษัทต่างๆ สามารถนัดหมายเพื่อใช้งานได้
เพื่อปรับปรุงความสามารถในการรับข้อมูลและการแนะนำการค้นหาขององค์กร Volcano Engine ยังได้เปิดตัวบริการค้นหา AI ระดับโลก เพื่อช่วยให้องค์กรต่างๆ เชื่อมต่อข้อมูลและความต้องการของผู้ใช้ได้ดีขึ้น และอำนวยความสะดวกในการเปลี่ยนแปลงอัจฉริยะของอุตสาหกรรมต่างๆ
ไฮไลท์:
การใช้โทเค็นเฉลี่ยต่อวันของ Doubao Big Model สูงถึง 4 ล้านล้าน เพิ่มขึ้น 33 เท่าเมื่อเทียบกับเดือนพฤษภาคม
โมเดลการทำความเข้าใจด้วยภาพที่เพิ่งเปิดตัวใหม่รองรับการป้อนข้อความและรูปภาพพร้อมกัน และเหมาะสำหรับสาขาต่างๆ เช่น การศึกษา การท่องเที่ยว และอีคอมเมิร์ซ
ต้นทุนการใช้งานต่อโทเค็นพันเหรียญอยู่ที่เพียง 0.003 หยวน ซึ่งต่ำกว่าราคาเฉลี่ยของอุตสาหกรรมอย่างมาก
กล่าวโดยสรุปก็คือ การอัปเกรดโมเดลบีนแบ็กขนาดใหญ่และโมเดลการทำความเข้าใจด้วยภาพใหม่ที่ออกโดย Volcano Engine ในครั้งนี้ แสดงให้เห็นถึงนวัตกรรมที่ต่อเนื่องในด้านปัญญาประดิษฐ์ และความเข้าใจอย่างลึกซึ้งในความต้องการของผู้ใช้ โดยให้การสนับสนุนทางเทคนิคที่แข็งแกร่งสำหรับการเปลี่ยนแปลงอัจฉริยะของอุตสาหกรรมต่างๆ