Gemini เวอร์ชันทดลองของ Google DeepMind (Exp1114) ทำงานได้อย่างน่าทึ่งบนแพลตฟอร์ม Chatbot Arena! หลังจากการทดสอบโดยชุมชนด้วยคะแนนโหวตมากกว่า 6,000 เสียง ก็มีประสิทธิภาพเหนือกว่าคู่แข่งในด้านสำคัญหลายประการ โดยเฉพาะอย่างยิ่งคณิตศาสตร์ ข้อความแจ้งที่ซับซ้อน และการเขียนเชิงสร้างสรรค์ ซึ่งแสดงให้เห็นถึงความสามารถโดยรวมที่แข็งแกร่ง บรรณาธิการของ Downcodes จะทำให้คุณเข้าใจในเชิงลึกเกี่ยวกับประสิทธิภาพที่โดดเด่นของ Gemini-Exp-1114 และการตีความของอุตสาหกรรม
Gemini เวอร์ชันทดลองล่าสุดของ Google DeepMind (Exp1114) ได้รับผลลัพธ์ที่น่าประทับใจบนแพลตฟอร์ม Chatbot Arena หลังจากการทดสอบโดยชุมชนนานกว่าหนึ่งสัปดาห์ ข้อมูลที่รวบรวมจากคะแนนโหวตมากกว่า 6,000 ครั้งแสดงให้เห็นว่าโมเดลใหม่นี้เหนือกว่าผลิตภัณฑ์คู่แข่งด้วยข้อได้เปรียบที่สำคัญ และแสดงให้เห็นถึงความแข็งแกร่งที่น่าทึ่งในหลายด้านที่สำคัญ
ในส่วนของคะแนนรวม Gemini-Exp-1114 เสมอกันที่หนึ่งด้วย GPT-4 ล่าสุดด้วยคะแนนดีเยี่ยมกว่า 40 คะแนน แซงหน้ารุ่นตัวอย่าง GPT-4 ชั้นนำก่อนหน้านี้ สิ่งที่น่าทึ่งยิ่งกว่านั้นคือโมเดลนี้ก้าวขึ้นสู่จุดสูงสุดในสาขาหลัก เช่น คณิตศาสตร์ ข้อความโต้ตอบที่ซับซ้อน และการเขียนเชิงสร้างสรรค์ ซึ่งแสดงให้เห็นถึงจุดแข็งที่ครอบคลุมอย่างแข็งแกร่ง
โดยเฉพาะความคืบหน้าของ Gemini-Exp-1114 นั้นน่าประทับใจ:
กระโดดจากอันดับที่ 3 มาเป็นอันดับหนึ่งในการจัดอันดับโดยรวม
การประเมินความสามารถทางคณิตศาสตร์เพิ่มขึ้นจากอันดับ 3 มาเป็นอันดับที่ 1
การประมวลผลพร้อมท์ที่ซับซ้อนเพิ่มขึ้นจากอันดับที่ 4 มาเป็นอันดับที่ 1
ประสิทธิภาพการเขียนเชิงสร้างสรรค์ดีขึ้นจากอันดับที่ 2 เป็นที่ 1
ความสามารถในการประมวลผลภาพยังอยู่ในอันดับต้นๆ อีกด้วย
ระดับการเขียนโปรแกรมได้รับการปรับปรุงจากอันดับที่ 5 เป็นอันดับที่ 3
Google AI Studio ได้เปิดตัวเวอร์ชันใหม่นี้อย่างเป็นทางการให้ผู้ใช้ได้สัมผัส อย่างไรก็ตาม ชุมชนยังได้แสดงความกังวลเกี่ยวกับปัญหาเฉพาะบางอย่าง เช่น ขีดจำกัดโทเค็น 1,000 ยังคงมีอยู่หรือไม่ และวิธีการจัดการกับปัญหาการใช้งานจริง เช่น เอาต์พุตข้อความที่ยาวมาก
นักวิเคราะห์อุตสาหกรรมเชื่อว่าความก้าวหน้าครั้งนี้แสดงให้เห็นว่าการลงทุนระยะยาวของ Google ในด้าน AI กำลังเริ่มเกิดผล สิ่งที่น่าสนใจคือ โมเดลนี้ยังคงรักษาอันดับที่ 4 ในด้านการควบคุมรูปแบบ ซึ่งอาจหมายความว่าทีมพัฒนาได้นำวิธีการหลังการฝึกอบรมแบบใหม่มาใช้เป็นหลัก แทนที่จะทำการเปลี่ยนแปลงโมเดลที่ได้รับการฝึกอบรมล่วงหน้า
ความก้าวหน้าครั้งสำคัญนี้ยังกระตุ้นให้เกิดการอภิปรายเกี่ยวกับโครงสร้างอุตสาหกรรมอีกด้วย OpenAI มักจะเปิดตัวผลิตภัณฑ์ใหม่เมื่อคู่แข่งเผยแพร่การอัปเดตที่สำคัญ แต่คราวนี้ความก้าวหน้าของ Google มีขนาดใหญ่มากจนดึงดูดความสนใจของอุตสาหกรรม บางคนเชื่อว่านี่อาจเป็นสัญญาณบ่งบอกถึงการมาถึงของ Gemini2 และความสามารถในการแข่งขันของ Google ในด้านโมเดลขนาดใหญ่ก็ดีขึ้นอย่างมาก
ประสิทธิภาพที่ยอดเยี่ยมของ Gemini-Exp-1114 ถือเป็นความก้าวหน้าครั้งสำคัญของ Google ในด้านโมเดล AI ขนาดใหญ่ และยังนำความเป็นไปได้มาสู่การพัฒนา AI ในอนาคตอีกด้วย เราหวังว่าจะได้เซอร์ไพรส์มากขึ้นใน Gemini เวอร์ชันต่อๆ ไป!