แพลตฟอร์ม Alibaba Cloud Bailian ได้เปิดตัวโมเดลข้อความยาว Qwen2.5-Turbo ล้าน โมเดลนี้ได้รับการพัฒนาโดยทีมงาน Tongyi Qianwen และมีความสามารถในการประมวลผลข้อความที่ยาวเป็นพิเศษสูงสุดถึง 1 ล้านโทเค็น ซึ่งเทียบเท่ากับ 1 ล้านภาษาอังกฤษ คำหรือตัวอักษรจีน 150 หมื่นตัว โมเดลนี้ได้รับผลลัพธ์ที่ยอดเยี่ยมในการดึงข้อความขนาดยาว ชุดการประเมินข้อความขนาดยาว RULER และงานข้อความขนาดยาวที่ใกล้เคียงกับฉากจริง ซึ่งเหนือกว่า GPT-4 ในหลายมิติ นอกจากนี้ยังทำงานได้ดีในการทดสอบเกณฑ์มาตรฐานข้อความสั้น ซึ่งเหนือกว่ารุ่นที่คล้ายกันก่อนหน้านี้อย่างมาก
เมื่อเร็วๆ นี้ Alibaba Cloud Bailian Platform ได้ประกาศเปิดตัวโมเดลข้อความยาว Qwen2.5-Turbo million โมเดล Qwen2.5-Turbo ได้รับการพัฒนาโดยทีมงาน Tongyi Qianwen และรองรับการประมวลผลบริบทที่ยาวเป็นพิเศษสูงสุดถึง 1 ล้านโทเค็น ซึ่ง เท่ากับ 1 ล้านคำในภาษาอังกฤษ หรือ 1.5 ล้านตัวอักษรจีน
โมเดลเวอร์ชันใหม่นี้มีความแม่นยำ 100% ในงานเรียกค้นข้อความแบบยาว และได้คะแนน 93.1 จากชุดการประเมินข้อความแบบยาว RULER ซึ่งเหนือกว่า GPT-4 ในงานข้อความยาวที่ใกล้เคียงกับฉากจริง เช่น LV-Eval และ LongBench-Chat นั้น Qwen2.5-Turbo เหนือกว่า GPT-4o-mini ในมิติส่วนใหญ่ ในการทดสอบเกณฑ์มาตรฐานข้อความสั้น Qwen2.5-Turbo ยังทำงานได้ดีมาก ซึ่งเหนือกว่ารุ่นโอเพ่นซอร์สรุ่นก่อนหน้าอย่างมากด้วยความยาวบริบท 1M โทเค็น
รุ่น Qwen2.5-Turbo มีสถานการณ์การใช้งานที่หลากหลาย รวมถึงความเข้าใจเชิงลึกเกี่ยวกับนวนิยาย ผู้ช่วยเขียนโค้ดขนาดใหญ่ การอ่านเอกสารหลายฉบับ ฯลฯ โดยสามารถประมวลผลนวนิยายได้ 10 เล่ม สุนทรพจน์ 150 ชั่วโมง หรือ 30,000 บรรทัด ของรหัสในคราวเดียว ในแง่ของความเร็วในการให้เหตุผล ทีม Tongyi Qianwen ได้บีบอัดจำนวนการคำนวณประมาณ 12.5 เท่าผ่านกลไกการสนใจแบบกระจัดกระจาย และลดเวลาส่งคืนคำแรกของการประมวลผลบริบทโทเค็น 1 ล้านรายการจาก 4.9 นาทีเหลือ 68 วินาที ทำให้ได้รับความเร็วเพิ่มขึ้น 4.3 เท่า
แพลตฟอร์ม Alibaba Cloud Bailian ช่วยให้ผู้ใช้ทุกคนสามารถเรียก Qwen2.5-Turbo API ได้โดยตรง และมอบของขวัญโทเค็น 10 ล้านโทเค็นในระยะเวลาจำกัด ค่าใช้จ่ายในการใช้งานหนึ่งล้านโทเค็นในภายหลังคือเพียง 0.3 หยวน
ปัจจุบัน แพลตฟอร์ม Alibaba Cloud Bailian ได้เปิดตัวโอเพ่นซอร์สกระแสหลักในประเทศและต่างประเทศมากกว่า 200 รุ่นและโมเดลโอเพ่นซอร์สขนาดใหญ่ รวมถึง Qwen, Llama และ ChatGLM ซึ่งสนับสนุนผู้ใช้สามารถโทร ฝึกอบรม และปรับแต่งหรือสร้างแอปพลิเคชัน RAG ได้โดยตรง
การเกิดขึ้นของรุ่น Qwen2.5-Turbo ถือเป็นความก้าวหน้าครั้งสำคัญในเทคโนโลยีการประมวลผลข้อความแบบยาว โดยมอบเครื่องมือ AI ที่ทรงพลังยิ่งขึ้นสำหรับทุกสาขาอาชีพ กลยุทธ์แบบเปิดของแพลตฟอร์ม Alibaba Cloud Bailian ยังช่วยให้นักพัฒนาจำนวนมากขึ้นสามารถนำเทคโนโลยีขั้นสูงนี้ไปใช้ได้อย่างง่ายดาย และร่วมกันส่งเสริมการพัฒนาในด้านปัญญาประดิษฐ์ ต้นทุนที่ต่ำยังช่วยลดเกณฑ์การใช้งานอีกด้วย