การเปิดตัว Gemini 2.0 ครั้งใหญ่ของ Google ถือเป็นก้าวสำคัญสำหรับปัญญาประดิษฐ์ในการก้าวเข้าสู่ยุคตัวแทน การอัพเกรดนี้ไม่เพียงแต่ปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญ แต่ยังบรรลุความก้าวหน้าในความสามารถหลายรูปแบบและการใช้เครื่องมือดั้งเดิม Gemini 2.0 รองรับอินพุตหลายรูปแบบ เช่น ข้อความ รูปภาพ วิดีโอ เสียง ฯลฯ และรองรับฟังก์ชันเอาท์พุตหลายรูปแบบ เช่น การสร้างรูปภาพดั้งเดิมและการแปลงข้อความเป็นคำพูดเป็นครั้งแรก โดยมีเป้าหมายเพื่อทำให้ข้อมูลมีประโยชน์มากขึ้น Google วางแผนที่จะรวม Gemini 2.0 เข้ากับระบบนิเวศของผลิตภัณฑ์อย่างรวดเร็ว เช่น Google Search และฟีเจอร์ "การวิจัยเชิงลึก" ที่เพิ่งเปิดตัว เพื่อปรับปรุงประสบการณ์ผู้ใช้ให้ดียิ่งขึ้น
วันนี้ Google ประกาศเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นล่าสุด Gemini 2.0 ซึ่งเป็นโมเดล AI ที่ทรงพลังที่สุดของบริษัทจนถึงปัจจุบัน การอัพเกรดครั้งใหญ่นี้ไม่เพียงแต่ปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญ แต่ยังเป็นก้าวสำคัญสำหรับปัญญาประดิษฐ์ในการก้าวเข้าสู่ยุคตัวแทน
Sundar Pichai ซีอีโอของ Google และ Alphabet กล่าวว่า Gemini 2.0 ประสบความสำเร็จอย่างก้าวกระโดดทั้งในด้านความสามารถหลายรูปแบบและการใช้เครื่องมือแบบเนทีฟ โมเดลใหม่นี้ไม่เพียงแต่สามารถเข้าใจและประมวลผลอินพุตหลายรูปแบบ เช่น ข้อความ รูปภาพ วิดีโอ และเสียง แต่ยังรองรับฟังก์ชันเอาท์พุตหลายรูปแบบ เช่น การสร้างรูปภาพเนทิฟและการอ่านออกเสียงข้อความเป็นครั้งแรก
“หาก Gemini 1.0 เกี่ยวกับการจัดระเบียบและทำความเข้าใจข้อมูล Gemini 2.0 คือการทำให้ข้อมูลมีประโยชน์มากขึ้น” พิชัยกล่าว ปัจจุบันโมเดลดังกล่าวเปิดให้นักพัฒนาและผู้ทดสอบที่เชื่อถือได้
นวัตกรรมทางเทคโนโลยีและการปรับปรุงประสิทธิภาพDemis Hassabis ซีอีโอของ Google DeepMind เปิดเผยว่าการเปิดตัวชุดแรกเป็นเวอร์ชันทดลองของ Gemini 2.0 Flash เวอร์ชันนี้มีการปรับปรุงประสิทธิภาพอย่างมากในขณะที่ยังคงรักษาความหน่วงไว้ต่ำ โดยเฉพาะอย่างยิ่ง 2.0 Flash ยังมีประสิทธิภาพเหนือกว่า 1.5 Pro ในการวัดประสิทธิภาพหลักๆ ด้วยการตอบสนองสองเท่า
โมเดลใหม่ทำงานบนแพลตฟอร์มฮาร์ดแวร์ TPU Trillium รุ่นที่ 6 ของ Google ซึ่งเป็นโครงสร้างพื้นฐานที่รองรับการฝึกอบรมและการอนุมาน Gemini2.0 100% ปัจจุบันแพลตฟอร์มนี้เปิดให้บริการแก่ลูกค้าแล้ว
การใช้งานจริงและการบูรณาการผลิตภัณฑ์Google วางแผนที่จะรวม Gemini 2.0 เข้ากับระบบนิเวศของผลิตภัณฑ์อย่างรวดเร็ว นับจากนี้ไป ผู้ใช้ Gemini ทั่วโลกสามารถเลือกใช้เวอร์ชันทดลอง 2.0 Flash ผ่านทางเวอร์ชันเว็บ และเวอร์ชันแอปพลิเคชันบนมือถือจะเปิดตัวเร็วๆ นี้ นอกจากนี้ ฟีเจอร์ภาพรวม AI ของ Google Search ยังรวมความสามารถในการให้เหตุผลขั้นสูงของ 2.0 เพื่อแก้ไขหัวข้อที่ซับซ้อนยิ่งขึ้นและปัญหาหลายขั้นตอน
เป็นที่น่าสังเกตว่า Google ได้เปิดตัวฟีเจอร์ใหม่ที่เรียกว่า "การวิจัยเชิงลึก" ซึ่งจะพร้อมใช้งานใน Gemini Advanced และสามารถทำหน้าที่เป็นผู้ช่วยวิจัยในการสำรวจหัวข้อที่ซับซ้อนและสร้างรายงานโดยอัตโนมัติ
สำรวจอนาคตของตัวแทน AIในข่าวประชาสัมพันธ์ฉบับนี้ Google ยังได้สาธิตโครงการต้นแบบการวิจัยหลายโครงการที่สร้างขึ้นบน Gemini 2.0:
Project Astra: นี่คือต้นแบบผู้ช่วย AI สากลที่มีความสามารถในการสนทนาหลายภาษา ความสามารถในการใช้เครื่องมือเช่น Google Search, Lens และ Maps และฟังก์ชันหน่วยความจำการสนทนาสูงสุด 10 นาที Project Mariner: นี่คือต้นแบบการโต้ตอบของเบราว์เซอร์ที่สามารถเข้าใจและให้เหตุผลเกี่ยวกับข้อมูลประเภทต่างๆ บนเว็บ และช่วยเหลือผู้ใช้ในการทำงานให้เสร็จสิ้นผ่านส่วนขยาย Chrome บนเกณฑ์มาตรฐาน WebVoyager นั้นได้รับผลลัพธ์ที่ดีที่สุดถึง 83.5% Jules: นี่คือตัวแทนโค้ด AI สำหรับนักพัฒนาที่สามารถรวมเข้ากับเวิร์กโฟลว์ GitHub ได้โดยตรงเพื่อช่วยในการแก้ปัญหาและการดำเนินงาน ความปลอดภัยและการพัฒนาอย่างมีความรับผิดชอบในขณะที่ขับเคลื่อนนวัตกรรมเหล่านี้ Google ให้ความสำคัญเป็นพิเศษกับความสำคัญของความปลอดภัยและการพัฒนาที่มีความรับผิดชอบ บริษัทได้ดำเนินมาตรการหลายประการเพื่อให้มั่นใจถึงการใช้ตัวแทน AI อย่างปลอดภัย:
ทำงานร่วมกับคณะกรรมการความรับผิดชอบและความปลอดภัย (RSC) เพื่อระบุและทำความเข้าใจความเสี่ยงที่อาจเกิดขึ้น ปรับปรุงวิธีการของทีมสีแดงที่ได้รับความช่วยเหลือจาก AI เพื่อเพิ่มความสามารถในการประเมินความเสี่ยงและการบรรเทาผลกระทบ สร้างกลไกการประเมินความปลอดภัยและการฝึกอบรมสำหรับอินพุตและเอาต์พุตหลายรูปแบบ เพิ่มการป้องกันคำสั่งที่เป็นอันตรายในโครงการ แนวโน้มในอนาคตของ Mariner Mechanismการเปิดตัว Gemini 2.0 ถือเป็นก้าวสำคัญในการพัฒนา AI ด้วยการรวมความสามารถหลายรูปแบบขั้นสูงเข้ากับความสามารถของตัวแทน Google แสดงให้เห็นถึงความทะเยอทะยานในการพัฒนาเทคโนโลยี AI เนื่องจากฟีเจอร์ใหม่เหล่านี้ค่อยๆ บูรณาการเข้ากับผลิตภัณฑ์ต่างๆ ผู้ใช้จึงสามารถสัมผัสประสบการณ์บริการผู้ช่วย AI ที่ชาญฉลาดและใช้งานได้จริงมากขึ้น
อย่างไรก็ตาม Google ยังยอมรับด้วยว่าเทคโนโลยีตัวแทน AI ยังอยู่ในช่วงเริ่มต้นและจำเป็นต้องรวบรวมข้อเสนอแนะต่อไปผ่านความร่วมมือกับผู้ทดสอบที่เชื่อถือได้เพื่อปรับปรุงและปรับปรุงเทคโนโลยีอย่างต่อเนื่อง บริษัทมุ่งมั่นที่จะพัฒนาเทคโนโลยี AI อย่างต่อเนื่องในลักษณะที่รับผิดชอบ รับรองความปลอดภัยและมาตรฐานทางจริยธรรม ขณะเดียวกันก็สำรวจความเป็นไปได้ใหม่ๆ
สำหรับข้อมูลเพิ่มเติม โปรดดู: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents
โดยรวมแล้ว การเปิดตัว Gemini 2.0 แสดงให้เห็นถึงความแข็งแกร่งของ Google ในด้านปัญญาประดิษฐ์ และการมองการณ์ไกลสำหรับการพัฒนาในอนาคต นอกจากนี้ยังบ่งชี้ว่าเทคโนโลยีปัญญาประดิษฐ์จะเจาะลึกเข้าไปในชีวิตของผู้คน และนำบริการที่สะดวกสบายและชาญฉลาดยิ่งขึ้นมาให้ผู้คน แต่ในขณะเดียวกัน ปัญหาด้านความปลอดภัยและจริยธรรมยังคงต้องได้รับการดูแลและแก้ไขอย่างต่อเนื่อง