บรรณาธิการของ Downcodes ได้เรียนรู้ว่า Google ใช้ Gemini AI เพื่อปรับปรุงการนำทางของหุ่นยนต์และความสามารถในการปฏิบัติงาน การวิจัยล่าสุดจากทีม DeepMind แสดงให้เห็นว่าฟังก์ชันหน้าต่างบริบทแบบยาวของ Gemini 1.5 Pro ช่วยปรับปรุงการโต้ตอบทางภาษาธรรมชาติระหว่างผู้ใช้กับหุ่นยนต์ RT-2 ได้อย่างมาก ความก้าวหน้าทางเทคโนโลยีนี้ช่วยให้หุ่นยนต์เข้าใจสภาพแวดล้อมด้วยการดูวิดีโอและทำงานที่ซับซ้อน เช่น นำทางผู้ใช้ไปยังปลั๊กไฟเพื่อชาร์จตามคำแนะนำ ซึ่งแสดงให้เห็นถึงศักยภาพมหาศาลของปัญญาประดิษฐ์ในสาขาวิทยาการหุ่นยนต์
Google กำลังฝึกหุ่นยนต์ด้วย Gemini AI เพื่อปรับปรุงการนำทางและการทำงานให้เสร็จสิ้น
ในรายงานการวิจัยฉบับใหม่ ทีม DeepMind Robotics อธิบายรายละเอียดวิธีใช้หน้าต่างบริบทแบบยาวของ Gemini1.5Pro เพื่อให้ผู้ใช้สามารถโต้ตอบกับหุ่นยนต์ RT-2 ได้ง่ายขึ้นโดยใช้คำแนะนำภาษาธรรมชาติ ด้วยการชมวิดีโอทัวร์ในพื้นที่ที่กำหนด นักวิจัยใช้ Gemini1.5Pro เพื่อให้หุ่นยนต์ "ดู" วิดีโอเพื่อทำความเข้าใจสภาพแวดล้อม ช่วยให้หุ่นยนต์สามารถดำเนินการคำสั่งตามสิ่งที่สังเกตได้ เช่น นำทางผู้ใช้ไปสู่พลังงาน เต้าเสียบสำหรับชาร์จ
DeepMind กล่าวว่าหุ่นยนต์ที่ติดตั้ง Gemini ดำเนินการคำสั่งผู้ใช้ได้มากกว่า 50 รายการในพื้นที่ปฏิบัติการมากกว่า 9,000 ตารางฟุต ด้วยอัตราความสำเร็จ 90%
นอกจากนี้ นักวิจัยยังพบว่า Gemini1.5Pro ช่วยให้หุ่นยนต์สามารถวางแผนวิธีการทำตามคำแนะนำ ไม่ใช่แค่การนำทางเท่านั้น ตัวอย่างเช่น เมื่อผู้ใช้ที่มีกระป๋องโค้กจำนวนมากบนโต๊ะถามหุ่นยนต์ว่ามีเครื่องดื่มแก้วโปรดหรือไม่ Gemini จะทำให้หุ่นยนต์รู้ว่าควรไปที่ตู้เย็นเพื่อตรวจสอบ จากนั้นจึงรายงานผลลัพธ์กลับไปยังผู้ใช้ DeepMind กล่าวว่าจะตรวจสอบผลลัพธ์เหล่านี้เพิ่มเติม
แม้ว่าวิดีโอสาธิตที่จัดทำโดย Google จะน่าประทับใจ แต่หุ่นยนต์จะใช้เวลา 10-30 วินาทีในการประมวลผลคำแนะนำเหล่านี้ ตามรายงานการวิจัย แม้ว่าอาจต้องใช้เวลาสักระยะก่อนที่เราจะแบ่งปันบ้านของเรากับหุ่นยนต์ทำแผนที่สิ่งแวดล้อมขั้นสูง แต่อย่างน้อยหุ่นยนต์เหล่านี้อาจสามารถช่วยเราค้นหากุญแจหรือกระเป๋าเงินที่หายไปได้
ไฮไลท์:
Gemini AI ฝึกหุ่นยนต์เพื่อปรับปรุงการนำทางและความสามารถในการทำงานให้เสร็จสิ้น
? Gemini1.5Pro ช่วยให้หุ่นยนต์สามารถดำเนินการคำสั่งภาษาธรรมชาติได้
การศึกษาพบว่าราศีเมถุนช่วยให้หุ่นยนต์สามารถวางแผนและดำเนินการตามคำสั่งนอกเหนือจากการนำทาง
ผลการวิจัยนี้เป็นการประกาศถึงการพัฒนาอย่างรวดเร็วของเทคโนโลยีหุ่นยนต์ในอนาคต การประยุกต์ใช้ Gemini AI จะช่วยเพิ่มระดับความฉลาดของหุ่นยนต์ได้อย่างมาก และช่วยให้หุ่นยนต์สามารถให้บริการชีวิตมนุษย์ได้ดียิ่งขึ้น แม้ว่าจะยังมีปัญหาคอขวดทางเทคนิคอยู่บ้าง แต่ฉันเชื่อว่าในอนาคตอันใกล้นี้ หุ่นยนต์ที่ก้าวหน้ามากขึ้นจะเข้ามาในชีวิตของเราและทำให้เราสะดวกสบายมากขึ้น บรรณาธิการของ Downcodes จะยังคงให้ความสนใจกับการพัฒนาล่าสุดในสาขานี้ต่อไป