Editor Downcodes mengetahui bahwa Google menggunakan Gemini AI untuk meningkatkan navigasi robot dan kemampuan pelaksanaan tugas. Penelitian terbaru dari tim DeepMind menunjukkan bahwa fungsi jendela konteks panjang Gemini 1.5 Pro secara signifikan meningkatkan interaksi bahasa alami antara pengguna dan robot RT-2. Terobosan teknologi ini memungkinkan robot untuk memahami lingkungan dengan menonton video dan menyelesaikan tugas-tugas kompleks seperti mengarahkan pengguna ke soket listrik untuk mengisi daya sesuai instruksi, menunjukkan potensi besar kecerdasan buatan di bidang robotika.
Google sedang melatih robotnya dengan Gemini AI untuk meningkatkan navigasi dan penyelesaian tugas.
Dalam makalah penelitian baru, tim DeepMind Robotics menjelaskan secara rinci cara menggunakan jendela konteks panjang Gemini1.5Pro untuk memudahkan pengguna berinteraksi dengan robot RT-2 menggunakan instruksi bahasa alami. Dengan melakukan tur video di area yang ditentukan, para peneliti menggunakan Gemini1.5Pro untuk membiarkan robot "menonton" video tersebut guna memahami lingkungan, memungkinkan robot untuk melakukan perintah berdasarkan apa yang diamatinya, seperti memandu pengguna ke suatu kekuatan. stopkontak untuk mengisi daya.
DeepMind mengatakan robot yang dilengkapi Gemini berhasil mengeksekusi lebih dari 50 instruksi pengguna di area operasi lebih dari 9.000 kaki persegi, dengan tingkat keberhasilan 90%.
Selain itu, peneliti juga menemukan bahwa Gemini1.5Pro memungkinkan robot merencanakan cara menyelesaikan instruksi, bukan hanya navigasi. Misalnya, ketika pengguna yang memiliki banyak kaleng Coke di mejanya bertanya kepada robot apakah minuman favoritnya tersedia, Gemini memberi tahu robot tersebut bahwa ia harus menuju ke lemari es untuk memeriksa dan kemudian melaporkan hasilnya kembali kepada pengguna. DeepMind mengatakan akan menyelidiki hasil ini lebih lanjut.
Meskipun demonstrasi video yang disediakan oleh Google sangat mengesankan, robot memerlukan waktu 10-30 detik untuk memproses instruksi ini, menurut makalah penelitian. Meskipun mungkin perlu waktu lama sebelum kita berbagi rumah dengan robot pemetaan lingkungan yang lebih canggih, setidaknya robot ini mungkin dapat membantu kita menemukan kunci atau dompet kita yang hilang.
Menyorot:
Gemini AI melatih robot untuk meningkatkan kemampuan navigasi dan penyelesaian tugas
? Gemini1.5Pro memungkinkan robot menjalankan instruksi bahasa alami
Gemini memungkinkan robot untuk merencanakan dan melaksanakan instruksi di luar navigasi, demikian temuan penelitian
Hasil penelitian ini menunjukkan pesatnya perkembangan teknologi robot di masa depan. Penerapan Gemini AI akan sangat meningkatkan tingkat kecerdasan robot dan memungkinkan mereka melayani kehidupan manusia dengan lebih baik. Meskipun masih ada beberapa hambatan teknis, saya yakin dalam waktu dekat, robot yang lebih canggih akan memasuki kehidupan kita dan memberi kita lebih banyak kenyamanan. Redaksi Downcodes akan terus memperhatikan perkembangan terkini di bidang ini.