Google Gemini เวอร์ชัน 2.0 เปิดตัวอย่างเป็นทางการแล้ว: 2.0 Flash รองรับเอาต์พุตหลายรูปแบบแล้ว

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-12-20 16:00:02

Google ได้เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นล่าสุด Gemini 2.0 ซึ่งถือเป็นความก้าวหน้าครั้งสำคัญของ Google ในด้านผู้ช่วยปัญญาประดิษฐ์ทั่วไป Gemini 2.0 นำเสนอการปรับปรุงที่สำคัญในการประมวลผลหลายรูปแบบและการใช้เครื่องมือ ช่วยให้เข้าใจโลกได้อย่างลึกซึ้งยิ่งขึ้นและดำเนินการตามคำสั่งของผู้ใช้ โมเดลนี้ได้รับการพัฒนาโดยใช้ Gemini เวอร์ชัน 1.0 และ 1.5 และนำไปใช้ในผลิตภัณฑ์ต่างๆ ของ Google ซึ่งให้บริการผู้ใช้หลายล้านคนทั่วโลก บทความนี้จะแนะนำโดยละเอียดเกี่ยวกับฟังก์ชันของ Gemini 2.0 และผลกระทบต่อผลิตภัณฑ์ของ Google และระบบนิเวศของนักพัฒนา

Sundar Pichai ซีอีโอของ Google และบริษัทแม่ Alphabet ประกาศว่าบริษัทได้เปิดตัวโมเดลปัญญาประดิษฐ์ล่าสุด Gemini 2.0 ซึ่งถือเป็นก้าวสำคัญสำหรับ Google ในการสร้างผู้ช่วย AI ที่เป็นสากล Gemini 2.0 แสดงให้เห็นถึงความก้าวหน้าที่สำคัญในการประมวลผลอินพุตหลายรูปแบบและการใช้เครื่องมือดั้งเดิม ช่วยให้ตัวแทน AI สามารถเข้าใจโลกรอบตัวพวกเขาอย่างลึกซึ้งยิ่งขึ้น และดำเนินการในนามของผู้ใช้ภายใต้การดูแลของพวกเขา

Gemini2.0 ได้รับการพัฒนาโดยใช้ Gemini1.0 และ 1.5 รุ่นก่อน ซึ่งเป็นครั้งแรกที่มีความสามารถในการประมวลผลหลายรูปแบบแบบเนทีฟ และสามารถเข้าใจข้อมูลได้หลากหลายประเภท รวมถึงข้อความ วิดีโอ รูปภาพ เสียง และโค้ด ปัจจุบัน นักพัฒนาหลายล้านคนใช้ Gemini เพื่อพัฒนา โดยผลักดันให้ Google ปรับโฉมผลิตภัณฑ์ของตน ซึ่งรวมถึงผลิตภัณฑ์ 7 รายการที่ให้บริการผู้ใช้ 2 พันล้านคน และสร้างผลิตภัณฑ์ใหม่ NotebookLM เป็นตัวอย่างของความสามารถแบบ multi-modal และ long-context และเป็นที่ชื่นชอบอย่างกว้างขวาง

微信截图_20241212080452.png

การเปิดตัว Gemini 2.0 ถือเป็นการประกาศการเข้าสู่ยุคตัวแทนใหม่ของ Google โมเดลนี้มีความสามารถในการเอาท์พุตภาพและเสียงแบบเนทีฟ รวมถึงความสามารถในการใช้เครื่องมือแบบเนทีฟ Google ได้เริ่มเปิดให้ใช้งาน Gemini 2.0 สำหรับนักพัฒนาและผู้ทดสอบที่เชื่อถือได้ และวางแผนที่จะรวมเข้ากับผลิตภัณฑ์ต่างๆ อย่างรวดเร็ว โดยเริ่มจาก Gemini และการค้นหา นับจากนี้ไป โมเดลทดลอง Gemini2.0 Flash จะเปิดให้ผู้ใช้ Gemini ทุกคน ในเวลาเดียวกัน Google ยังได้เปิดตัวฟีเจอร์ใหม่ที่เรียกว่า Deep Research ซึ่งใช้การให้เหตุผลขั้นสูงและความสามารถในบริบทที่ยาวเพื่อทำหน้าที่เป็นผู้ช่วยวิจัยในการสำรวจหัวข้อที่ซับซ้อนและรวบรวมรายงานในนามของผู้ใช้ ขณะนี้ฟีเจอร์นี้มีให้บริการใน Gemini Advanced

การค้นหาเป็นหนึ่งในผลิตภัณฑ์ที่ได้รับผลกระทบมากที่สุดจาก AI และขณะนี้ภาพรวม AI ของ Google เข้าถึงผู้คนถึง 1 พันล้านคน ทำให้พวกเขาถามคำถามใหม่ๆ ได้ และกลายเป็นหนึ่งในฟีเจอร์การค้นหายอดนิยมของ Google อย่างรวดเร็ว ในขั้นตอนต่อไป Google จะนำความสามารถในการให้เหตุผลขั้นสูงของ Gemini 2.0 มาสู่ภาพรวมของ AI เพื่อแก้ปัญหาหัวข้อที่ซับซ้อนยิ่งขึ้นและปัญหาหลายขั้นตอน รวมถึงสมการทางคณิตศาสตร์ขั้นสูง การสืบค้นและการเข้ารหัสหลายรูปแบบ การทดสอบแบบจำกัดเริ่มในสัปดาห์นี้ โดยมีการวางแผนการเปิดตัวที่กว้างขึ้นในต้นปีหน้า Google จะยังคงนำภาพรวม AI ไปยังประเทศและภาษาต่างๆ มากขึ้นในปีหน้า

Google ยังแสดงให้เห็นถึงผลลัพธ์ที่ล้ำสมัยในการวิจัยตัวแทนผ่านความสามารถหลายรูปแบบดั้งเดิมของ Gemini 2.0 Gemini 2.0 Flash ปรับปรุงจาก 1.5 Flash ซึ่งเป็นรุ่นที่ได้รับความนิยมมากที่สุดในหมู่นักพัฒนาในปัจจุบัน โดยมีเวลาตอบสนองที่รวดเร็วเช่นเดียวกัน โดยเฉพาะอย่างยิ่ง 2.0 Flash ยังมีประสิทธิภาพเหนือกว่า 1.5 Pro ในเกณฑ์มาตรฐานหลักด้วยความเร็วเป็นสองเท่า Flash 2.0 ยังนำเสนอความสามารถใหม่ๆ นอกเหนือจากการรองรับอินพุตหลายรูปแบบ เช่น รูปภาพ วิดีโอ และเสียงแล้ว ปัจจุบัน Flash 2.0 ยังรองรับเอาต์พุตหลายรูปแบบ เช่น รูปภาพที่สร้างขึ้นเองผสมกับข้อความและเสียงการแปลงข้อความเป็นคำพูด (TTS) หลายภาษาที่ควบคุมได้ นอกจากนี้ยังสามารถเรียกใช้เครื่องมือต่างๆ ได้ เช่น การค้นหาของ Google การเรียกใช้โค้ด และฟังก์ชันที่ผู้ใช้กำหนดโดยบุคคลที่สาม

微信截图_20241212080808.png

ขณะนี้ Gemini 2.0 Flash พร้อมให้นักพัฒนาใช้งานในรูปแบบทดลองแล้ว โดยมีอินพุตและเอาต์พุตข้อความหลายรูปแบบสำหรับนักพัฒนาทุกคนผ่าน Google AI Studio และ Gemini API ของ Vertex AI ในขณะที่การสร้างข้อความเป็นคำพูดและรูปภาพเนทีฟนั้นมีให้สำหรับพันธมิตรที่ทดลองใช้ก่อนเปิดตัว การวางจำหน่ายทั่วไปจะตามมาในเดือนมกราคม พร้อมด้วยขนาดรุ่นเพิ่มเติม

เพื่อช่วยนักพัฒนาสร้างแอปพลิเคชันแบบไดนามิกและโต้ตอบได้ Google ยังได้เปิดตัว API แบบเรียลไทม์หลายรูปแบบใหม่พร้อมความสามารถในการอินพุตเสียงและวิดีโอแบบเรียลไทม์และความสามารถในการใช้เครื่องมือผสมผสานหลายรายการ

ตั้งแต่วันนี้เป็นต้นไป ผู้ใช้ Gemini ทั่วโลกสามารถเข้าถึงเวอร์ชันที่เพิ่มประสิทธิภาพการแชทของการทดลอง 2.0 Flash ได้โดยเลือกในเมนูแบบเลื่อนลงโมเดลบนเดสก์ท็อปและเว็บบนมือถือ และจะสามารถใช้งานได้ในแอปมือถือ Gemini เร็วๆ นี้ ในต้นปีหน้า Google จะขยาย Gemini 2.0 ไปยังผลิตภัณฑ์ต่างๆ ของ Google มากขึ้น

โดยรวมแล้ว การเปิดตัว Gemini 2.0 ถือเป็นอีกก้าวหนึ่งของ Google ในด้านความสามารถด้าน AI และการผสานรวมเครื่องมืออันทรงพลัง จะนำประสบการณ์ที่สมบูรณ์ยิ่งขึ้นมาสู่นักพัฒนาและผู้ใช้ และส่งเสริมการประยุกต์ใช้เทคโนโลยี AI ในสาขาต่างๆ มากขึ้น . การพัฒนาและการประยุกต์ใช้ ในอนาคต Gemini 2.0 จะถูกรวมเข้ากับระบบนิเวศของผลิตภัณฑ์ของ Google เพื่อนำเสนอบริการที่ชาญฉลาดและสะดวกสบายยิ่งขึ้นแก่ผู้ใช้