talk2bev Download - talk2bev Source Code Download

talk2bev

شفرة المصدر الأخرى

1.0.0

تنزيل

Talk2bev: خرائط عرض عيون الطيور المعززة باللغة

صفحة المشروع | Arxiv | فيديو

Vikrant Dewangan* ¹ , Tushar Choudhary* ¹ , Shivam Chandhok* ² , Shubham Priyadarshan ¹ , Anushka Jain ¹ , Arun K. Singh ³ , Siddharth Srivastava ⁴ , Krishna Murthy Jatavallabhula $^ Dagger $ ⁵ ، ك. مادهافا كريشنا $^ Dagger $ ¹

¹ المعهد الدولي لتكنولوجيا المعلومات ، حيدر أباد ، ² جامعة كولومبيا البريطانية ، ³ جامعة تارتو ⁴ شتورتور INC ⁵ MIT-CSAIL

*يدل على مساواة المساهمة ، $^ Dagger $ يدل على المساواة في تقديم المشورة

ICRA 2024

المنهجية. mp4

خلاصة

نقدم Talk2Bev ، واجهة نموذج لغة كبيرة (LVLM) لخرائط عرض الطيور (BEV) (BEV) شائعة الاستخدام في القيادة المستقلة.

بينما ركزت أنظمة الإدراك الحالية لسيناريوهات القيادة المستقلة إلى حد كبير على مجموعة محددة مسبقًا من فئات الكائنات وسيناريوهات القيادة ، فإن Talk2Bev يلغي الحاجة إلى تدريب محدد بيف ، ويعتمد بدلاً من ذلك على LVLMs التي تم تدريبها مسبقًا. يمكّن ذلك نظامًا واحدًا من تلبية مجموعة متنوعة من مهام القيادة المستقلة التي تشمل التفكير البصري والمكاني ، والتنبؤ بنوايا الجهات الفاعلة في حركة المرور ، وصنع القرار على أساس العظة البصرية.

نقوم بتقييم Talk2bev على نطاق واسع على عدد كبير من مهام فهم المشهد التي تعتمد على القدرة على تفسير استعلامات اللغة الطبيعية الحرة ، وفي تأسيس هذه الاستعلامات إلى السياق البصري المضمّن في خريطة BEV المحسنة للغة. لتمكين مزيد من البحث في LVLMs لسيناريوهات القيادة المستقلة ، نقوم بتطوير ونطلق محرك Talk2Bev-bench ، وهو مؤشر يمر 1000 سيناريوهات BEV ذات الإنسان ، مع أكثر من 20،000 سؤال واستجابات الحقيقة الأرضية من مجموعة بيانات Nuscenes.

إعداد البيانات

يرجى تنزيل مجموعة بيانات Nuscenes V1.0-Trainval. تتكون مجموعة البيانات الخاصة بنا من جزأين-Calk2Bev-Base و Talk2Bev-Captions ، تتكون من القاعدة (المحاصيل ، صور المنظور ، Centroids منطقة بيف) وتسميات المحاصيل على التوالي.

روابط تنزيل

نحن نقدم رابطين لمجموعة بيانات Talk2Bev ( Talk2Bev-Mini (التسميات التوضيحية فقط) و Talk2bev-Full ) أدناه. يتم استضافة مجموعة البيانات على Google Drive. يرجى تنزيل مجموعة البيانات واستخراج الملفات إلى مجلد data .

اسم	قاعدة	التسميات التوضيحية	مقعد	وصلة
Talk2bev- mini	✓	✗	✗	وصلة
Talk2bev- ممتلئ	✗	✗	✗	تودو

إذا كنت ترغب في إنشاء مجموعة البيانات من نقطة الصفر ، فيرجى اتباع العملية هنا. تم وصف تنسيق كل من أجزاء البيانات بالتنسيق.

تقييم

يحدث التقييم على Talk2Bev عبر طريقتين - MCQs (من Talk2Bev -Bench) والمشغلين المكانيين. نستخدم GPT-4 لتقييمنا. يرجى اتباع التعليمات في GPT-4 وتهيئة مفتاح API والمؤسسة في نظام التشغيل ENV الخاص بك.

ORGANIZATION= < your-organization >
API_KEY= < your-api-key >

التقييم - MCQS

للحصول على دقة MCQs ، يرجى تشغيل الأمر التالي:

 cd evaluation
python eval_mcq.py

هذا سيؤدي إلى دقة MCQS.

تقييم المشغلين المكانيين

للحصول على خطأ المسافة ، IOU للحصول على MCQs ، يرجى تشغيل الأمر التالي:

 cd evaluation
python eval_spops.py

Click2Chat

نسمح أيضًا بمحادثة مجانية مع BEV. يرجى اتباع التعليمات في Click2Chat للدردشة مع BEV.

Talk2bev-beck

ليصدر

تودو

خط أنابيب تقييم المشغلين المكانيين
أضف روابط إلى محاصيل BEV-إصدار Talk2Bev-Full
إطلاق Talk2bev-beck

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-26
الحجم 77.03MB
من Github

تطبيقات ذات صلة

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
SmartTube

2024-12-14
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
MySchedule.py

شفرة المصدر الأخرى

Updates to the fetching of week codes
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل