ดาวน์โหลด talk2bev - ดาวน์โหลดซอร์สโค้ด talk2bev

talk2bev

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

TALK2BEV: แผนที่มุมมองของนกที่ปรับปรุงภาษา

หน้าโครงการ | arxiv วิดีโอ

Vikrant Dewangan* ¹ , Tushar Choudhary* ¹ , Shivam Chandhok* ² , Shubham Priyadarshan ¹ , Anushka Jain ¹ , Arun K. Singh ³ , Siddharth Srivastava ⁴ , Krishna Murthy Jatavallabhula $^ dagger $ ⁵ , K. Madhava Krishna $^ dagger $ ¹

¹ สถาบันเทคโนโลยีสารสนเทศระหว่างประเทศไฮเดอราบัด, ² มหาวิทยาลัยบริติชโคลัมเบีย, ³ มหาวิทยาลัยทาร์ตู ⁴ Tensortour Inc ⁵ MIT-CSAIL

*หมายถึงการมีส่วนร่วมที่เท่าเทียมกัน $^ dagger $ หมายถึงคำแนะนำที่เท่าเทียมกัน

ICRA 2024

Methodology.mp4

เชิงนามธรรม

เราแนะนำ Talk2Bev ซึ่งเป็นอินเทอร์เฟซแบบจำลองการมองเห็นขนาดใหญ่ (LVLM) สำหรับแผนที่มุมมองนก (BEV) แผนที่ที่ใช้กันทั่วไปในการขับขี่แบบอิสระ

ในขณะที่ระบบการรับรู้ที่มีอยู่สำหรับสถานการณ์การขับขี่แบบอิสระได้มุ่งเน้นไปที่ชุดของหมวดหมู่วัตถุที่กำหนดไว้ล่วงหน้า (ปิด) และสถานการณ์การขับขี่ แต่ Talk2Bev ไม่จำเป็นต้องฝึกอบรมโดยเฉพาะ สิ่งนี้ช่วยให้ระบบเดียวสามารถตอบสนองความหลากหลายของงานการขับขี่แบบอิสระที่ครอบคลุมการใช้เหตุผลทางสายตาและเชิงพื้นที่ทำนายความตั้งใจของนักแสดงการจราจรและการตัดสินใจตามตัวชี้นำภาพ

เราประเมิน Talk2Bev อย่างกว้างขวางเกี่ยวกับงานการทำความเข้าใจฉากจำนวนมากที่ต้องอาศัยทั้งความสามารถในการตีความแบบสอบถามภาษาธรรมชาติจากการสอบถามและในการตอบคำถามเหล่านี้ไปยังบริบทของภาพที่ฝังอยู่ในแผนที่ BEV ที่ปรับปรุงภาษา เพื่อเปิดใช้งานการวิจัยเพิ่มเติมใน LVLMS สำหรับสถานการณ์การขับขี่แบบอัตโนมัติเราพัฒนาและปล่อย TALK2BEV-BENCH ซึ่งเป็นเกณฑ์มาตรฐานที่ผ่านมา 1,000 สถานการณ์ BEV ที่ได้รับการรับรองจากมนุษย์ 1,000 คนโดยมีคำถามมากกว่า 20,000 ข้อ

การเตรียมข้อมูล

โปรดดาวน์โหลดชุดข้อมูล Nuscenes v1.0-Trainval ชุดข้อมูลของเราประกอบด้วย 2 ส่วน-talk2bev-base และ talk2bev-captions ซึ่งประกอบด้วยฐาน (พืชภาพมุมมองเซนทรอยด์พื้นที่ Bev) และคำอธิบายภาพพืชตามลำดับ

ดาวน์โหลดลิงค์

เราให้บริการ 2 ลิงก์ไปยังชุดข้อมูล Talk2Bev ( Talk2Bev-Mini (คำบรรยายเท่านั้น) และ Talk2Bev-Full ) มีให้ด้านล่าง ชุดข้อมูลโฮสต์บน Google Drive โปรดดาวน์โหลดชุดข้อมูลและแยกไฟล์ไปยังโฟลเดอร์ data

ชื่อ	ฐาน	คำบรรยายภาพ	ม้านั่ง	การเชื่อมโยง
talk2bev- mini				การเชื่อมโยง
talk2bev- เต็ม				สิ่งที่ต้องทำ

หากคุณต้องการสร้างชุดข้อมูลตั้งแต่เริ่มต้นโปรดติดตามกระบวนการที่นี่ รูปแบบสำหรับแต่ละชิ้นส่วนข้อมูลอธิบายไว้ในรูปแบบ

การประเมิน

การประเมินผล Talk2Bev เกิดขึ้นผ่าน 2 วิธี - MCQS (จาก Talk2Bev -Bench) และผู้ให้บริการเชิงพื้นที่ เราใช้ GPT-4 สำหรับการประเมินผลของเรา โปรดทำตามคำแนะนำใน GPT-4 และเริ่มต้นคีย์ API และองค์กรใน OS Env ของคุณ

ORGANIZATION= < your-organization >
API_KEY= < your-api-key >

การประเมิน - MCQS

หากต้องการรับความแม่นยำสำหรับ MCQs โปรดเรียกใช้คำสั่งต่อไปนี้:

 cd evaluation
python eval_mcq.py

สิ่งนี้จะให้ความแม่นยำสำหรับ MCQS

การประเมินผู้ประกอบการเชิงพื้นที่

หากต้องการรับข้อผิดพลาดทางไกล IOU สำหรับ MCQs โปรดเรียกใช้คำสั่งต่อไปนี้:

 cd evaluation
python eval_spops.py

click2chat

นอกจากนี้เรายังอนุญาตให้มีการสนทนาแบบฟรีกับ Bev โปรดทำตามคำแนะนำใน click2chat เพื่อแชทกับ Bev

talk2bev-bench

ที่จะได้รับการปล่อยตัว

สิ่งที่ต้องทำ

ผู้ประกอบการเชิงพื้นที่
เพิ่มลิงค์ไปยัง BEV Crops-Release Talk2Bev-full
ปล่อย TALK2BEV-BENCH

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-26
ขนาด 77.03MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
SmartTube

2024-12-14
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
MySchedule.py

ซอร์สโค้ดอื่น ๆ

Updates to the fetching of week codes
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด