Editor Downcodes mengetahui bahwa Waymo baru-baru ini mengumumkan perkembangan besar: pengembangan model pelatihan baru EMMA berdasarkan model bahasa besar multimodal (MLLM) Google Gemini untuk pengembangan taksi tanpa pengemudi. EMMA dapat memproses data sensor, menghasilkan lintasan kendaraan otonom di masa depan, dan membantu pengambilan keputusan kendaraan dalam perencanaan jalur dan penghindaran rintangan. Terobosan ini menandai penerapan penting pertama MLLM di bidang mengemudi otonom, dan menunjukkan bahwa skenario penerapan LLM akan berkembang dari robot obrolan, manajemen email, dll. hingga lingkungan jalan baru.
Model EMMA adalah salah satu tanda pertama bahwa para pemimpin dalam bidang mengemudi otonom berencana menggunakan MLLM dalam operasi mereka, menunjukkan bahwa LLM ini dapat melampaui penggunaannya saat ini sebagai chatbots, pengelola email, dan pembuat gambar dan menemukan jalan mereka ke dalam lingkungan yang benar-benar baru. dari jalan. Temukan aplikasinya.
Tim peneliti Waymo mengatakan MLLM seperti Gemini menawarkan solusi menarik untuk sistem self-driving karena dua alasan: Chatbot adalah “generalis” yang terlatih dalam sejumlah besar data yang diambil dari internet dan “dapat memberikan informasi di luar 'pengetahuan dunia' yang kaya tentang sistem self-driving. konten yang terkandung dalam log mengemudi biasa"; mereka menunjukkan kemampuan penalaran yang "luar biasa" melalui teknik seperti "penalaran rantai pemikiran", yang meniru penalaran manusia dengan memecah tugas-tugas kompleks menjadi serangkaian langkah-langkah logis.
Model EMMA Waymo berkinerja baik dalam prediksi lintasan, deteksi objek, dan pemahaman peta jalan, namun juga memiliki keterbatasan, seperti ketidakmampuan untuk mengintegrasikan input sensor 3D dari lidar atau radar, dan kemampuan untuk memproses hanya sejumlah kecil bingkai gambar pada saat yang bersamaan. suatu waktu. Ada juga risiko dalam menggunakan MLLM untuk melatih taksi self-driving. Misalnya, model tersebut mungkin berhalusinasi atau tidak dapat menyelesaikan tugas-tugas sederhana.
. Oleh karena itu, Waymo mengatakan penelitian lebih lanjut diperlukan untuk mengurangi masalah ini dan mengembangkan lebih lanjut arsitektur model self-driving yang canggih.
Meskipun model EMMA Waymo memiliki beberapa keterbatasan, terobosan teknologinya di bidang mengemudi otonom masih mengesankan. Di masa depan, dengan pengembangan dan peningkatan teknologi yang berkelanjutan, saya yakin teknologi mengemudi otonom berbasis MLLM akan memberi kita pengalaman perjalanan yang lebih aman dan nyaman. Editor Downcodes akan terus memperhatikan perkembangan tindak lanjut Waymo, jadi pantau terus!