บรรณาธิการของ Downcodes รายงานว่า Baichuan Intelligence ร่วมมือกับมหาวิทยาลัยเทียนจินเพื่อพัฒนาเฟรมเวิร์กตัวแทนที่เรียกว่า Sibyl System ซึ่งคว้าอันดับหนึ่งในการประเมิน GAIA Leader Board ซึ่งเปิดตัวร่วมกันโดย Meta, Huggingface และ AutoGPT การประเมิน GAIA มุ่งเน้นไปที่การประเมินความสามารถในการดำเนินการของตัวแทนและการออกแบบโซลูชันในงานที่ซับซ้อน โดยจะทดสอบคำถามที่ใกล้เคียงกับสถานการณ์การใช้งานจริงมากขึ้น และก่อให้เกิดความท้าทายที่สูงมากต่อโมเดล AI ความสำเร็จนี้นับเป็นความก้าวหน้าครั้งสำคัญในเทคโนโลยี AI ของจีนในด้านการประมวลผลงานที่ซับซ้อน
Baichuan Intelligence ร่วมมือกับมหาวิทยาลัยเทียนจินเพื่อเปิดตัวเฟรมเวิร์กตัวแทนอัจฉริยะ Sibyl System และคว้าอันดับหนึ่งในคณะกรรมการผู้นำ GAIA GAIA คือแผนการประเมินใหม่ที่เสนอโดย Meta, Huggingface และ AutoGPT ในเดือนพฤศจิกายน 2023 โดยจะประเมินความสามารถและโซลูชันของ Agent เป็นหลักในการดำเนินงานที่ซับซ้อน แผนการประเมินนี้เผยให้เห็นข้อบกพร่องด้านความสามารถของโมเดลที่มีอยู่ และให้แนวทางการปรับปรุงสำหรับการพัฒนาโมเดลและเอเจนต์
คำถามทดสอบของ GAIA นั้นใกล้เคียงกับโลกแห่งความเป็นจริงมากขึ้น และต้องการให้ AI มีเหตุผล ความเข้าใจหลายรูปแบบ (ข้อความ รูปภาพ เสียง/วิดีโอ) การท่องเว็บ และการใช้เครื่องมือ คำถามเหล่านี้ไม่ใช่เรื่องยากสำหรับมนุษย์ที่จะเข้าใจ แต่เป็นสิ่งที่ท้าทายอย่างยิ่งสำหรับโมเดล ตัวอย่างเช่น อัตราความสำเร็จของการทดสอบของ GPT-4 อยู่ที่ 15% เท่านั้น ในขณะที่ผู้ทดลองที่เป็นมนุษย์สามารถทำได้ถึง 92% การแก้ไขปัญหาเหล่านี้มักต้องใช้การเชื่อมโยงตรรกะที่ยาวและใช้เวลานาน ซึ่งเกี่ยวข้องกับขั้นตอนและเครื่องมือหลายขั้นตอน
คุณสมบัติการออกแบบของเฟรมเวิร์ก Sibyl System ประกอบด้วย:
การสร้างการปรับปรุงการค้นหาการแทนที่อินเทอร์เฟซเบราว์เซอร์ที่เหมือนมนุษย์
คำถามและคำตอบเข้ามาแทนที่บทสนทนา โดยใช้ฟังก์ชันคำถามและคำตอบแบบไร้สัญชาติเพื่อทำให้สถาปัตยกรรมระบบง่ายขึ้น
ใช้เครื่องมือทั่วไปเพียงสองอย่าง เว็บเบราว์เซอร์และสภาพแวดล้อม Python เพื่อลดการพึ่งพาเครื่องมือพิเศษ
จาก System1 ถึง System2 มีการใช้กลไก "คณะลูกขุน" เพื่อวิจารณ์ตนเองและแก้ไขผ่านการอภิปรายหลายตัวแทน และใช้ข้อมูลในพื้นที่ทำงานทั่วโลกเพื่อปรับปรุงความแม่นยำของการตอบสนอง
Sibyl System เป็นเฟรมเวิร์ก Agent ที่เรียบง่ายแต่ทรงพลังโดยอิงตามโมเดลภาษาขนาดใหญ่ ซึ่งสามารถแก้ไขปัญหาการให้เหตุผลที่ซับซ้อนได้โดยใช้เครื่องมือจำนวนไม่มากนัก ลดความซับซ้อนของระบบด้วยการแนะนำกลไก Global Workspace และ Multi-Agent รวมถึงช่องทางการรับข้อมูลสากลบนเบราว์เซอร์ ขณะเดียวกันก็ขยายความซับซ้อนในการแก้ปัญหา และตระหนักถึงการเปลี่ยนแปลงของแบบจำลองจากการเปลี่ยนแปลงแบบ "คิดเร็ว" ไปสู่ "คิดช้า" . Sibyl System ยังมีความสามารถในการปรับขนาดที่ดีและการแก้ไขจุดบกพร่องที่ง่ายดาย โดยสามารถแทนที่โมดูล Agent ของรุ่นอื่นๆ และปรับปรุงความสามารถของโมเดลได้อย่างง่ายดาย
รายงานทางเทคนิค: https://arxiv.org/pdf/2407.10718
ความสำเร็จของกรอบงาน Sibyl System ไม่เพียงแต่แสดงให้เห็นถึงความแข็งแกร่งของ Baichuan Intelligence และมหาวิทยาลัยเทียนจินในด้านปัญญาประดิษฐ์เท่านั้น แต่ยังมอบประสบการณ์อันมีค่าและการอ้างอิงสำหรับการออกแบบและพัฒนากรอบงานตัวแทนอัจฉริยะแห่งอนาคต ฉันเชื่อว่าในอนาคตอันใกล้นี้ เราจะได้เห็นแอปพลิเคชั่นที่เป็นนวัตกรรมมากขึ้นตามกรอบงาน Sibyl System ซึ่งส่งเสริมการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ในระดับที่ลึกยิ่งขึ้น