ดาวน์โหลด ViLaIn - ดาวน์โหลดซอร์สโค้ด ViLaIn

ViLaIn

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

[เว็บไซต์] [กระดาษ] [รหัส]

วิลาอิน

การดำเนินการอย่างเป็นทางการของ Vision-Language Interpreter (ViLaIn) ดูเอกสารของเราสำหรับรายละเอียดเพิ่มเติม

ความต้องการ

การใช้งานนี้ต้องใช้ Python>=3.10 และ torch>=2.0.0 หากต้องการติดตั้ง PyTorch โปรดปฏิบัติตามคำแนะนำใน https://pytorch.org/
ติดตั้งแบบรวดเร็วและ VAL ตามคำแนะนำในการสร้าง หลังจากการติดตั้ง ให้คัดลอกไบนารี validate ภายใต้ไดเร็กทอรี downward
ติดตั้ง Grounding DINO ตามคำแนะนำ

ชุดข้อมูล ProDG

data มีไฟล์ PDDL การสังเกต และคำแนะนำสำหรับสามโดเมน ซึ่งเราระบุถึงชุดข้อมูล ProDG ในรายงาน ไดเร็กทอรีนี้ยังมีกล่องขอบเขตที่มีคำอธิบายประกอบใน annotated_bboxes โครงสร้างไดเรกทอรีเป็นดังนี้:

 data
 └─domains
    └─domain.pddl                   (A PDDL domain file)
    └─problems                      (PDDL problem files)
       └─problem*.pddl
    └─observations                  (Observations for the initial state)
       └─problem*.jpg
    └─instructions                  (Linguistic instructions)
       └─problem*.txt
    └─annotated_bboxes              (Annotated bounding boxes)
       └─problem*.json

ผลลัพธ์

results/reported_results มีปัญหา PDDL ที่สร้างขึ้นและพบแผนการที่รายงานในรายงาน ในไดเร็กทอรีนั้น ยังมีไดเร็กทอรีย่อยสามไดเร็กทอรีสำหรับแต่ละโดเมน:

plain : ผลลัพธ์ที่ไม่มีการแจ้งแก้ไขใหม่
refine_once : ผลลัพธ์โดยใช้การแก้ไขซ้ำสำหรับปัญหา plain
refine_twice : ผลลัพธ์โดยการใช้การเตือนการแก้ไขสำหรับปัญหาใน refine_once

เริ่มต้นใช้งาน

การตรวจจับวัตถุและสร้างคำบรรยาย

หากต้องการตรวจจับวัตถุที่มีกรอบล้อมรอบและสร้างคำบรรยาย ให้รัน:

 export domain=cooking
export grounding_dino_dir=./GroundingDINO
export result_dir=./results/temp/${domain}

python scripts/main.py 
    --data_dir "./data/${domain}" 
    --result_dir ${result_dir} 
    --grounding_dino_dir ${grounding_dino_dir} 
    --predict_bboxes

ขั้นตอนนี้ควรทำก่อนที่จะสร้างปัญหา PDDL

การสร้างปัญหา PDDL และการค้นหาแผน

เมื่อต้องการสร้างปัญหา PDDL ตามกล่องขอบเขตและคำอธิบายภาพที่คาดการณ์ไว้ และค้นหาแผน ให้รัน:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2
export num_examples=3

python scripts/main.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --num_examples ${num_examples} 
    --gen_step "plain" 
    --generate_problem 
    --find_plan

การประเมินปัญหา PDDL ที่สร้างขึ้นและแผนงานที่พบ

ในการประเมินปัญหา PDDL ที่สร้างขึ้นและตรวจสอบความถูกต้องของแผนที่พบ ให้รัน:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2

python scripts/evaluate.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --gen_step "plain"

การปรับแต่งปัญหา PDDL ที่สร้างขึ้น

หากต้องการแก้ไขปัญหา PDDL ที่สร้างขึ้นโดยการแก้ไขพร้อมท์ใหม่ ให้รัน:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2

python scripts/main.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --gen_step "refine_once" 
    --prev_gen_step "plain" 
    --refine_problem 
    --use_cot 
    --find_plan

การอ้างอิง

 @misc{shirai2023visionlanguage,
      title={Vision-Language Interpreter for Robot Task Planning}, 
      author={Keisuke Shirai and Cristian C. Beltran-Hernandez and Masashi Hamaya and Atsushi Hashimoto and Shohei Tanaka and Kento Kawaharazuka and Kazutoshi Tanaka and Yoshitaka Ushiku and Shinsuke Mori},
      year={2023},
      eprint={2311.00967},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2024-12-28
ขนาด 2.19MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด