Unduhan ViLaIn - Unduhan kode sumber ViLaIn

ViLaIn

Kode sumber lainnya

1.0.0

Unduh

[Situs Web] [Makalah] [Kode]

VilaIn

Implementasi resmi dari Vision-Language Interpreter (ViLaIn). Lihat makalah kami untuk lebih jelasnya.

Persyaratan

Implementasi ini memerlukan Python>=3.10 dan torch>=2.0.0 . Untuk menginstal PyTorch, ikuti petunjuk di https://pytorch.org/.
Instal fast-downward dan VAL dengan mengikuti instruksi build. Setelah instalasi, salin biner validate di bawah direktori downward .
Pasang Grounding DINO dengan mengikuti petunjuknya.

Kumpulan data ProDG

data berisi file PDDL, observasi, dan instruksi untuk tiga domain, yang kami tandai sebagai kumpulan data ProDG di makalah. Direktori ini juga berisi kotak pembatas beranotasi di annotated_bboxes . Struktur direktorinya adalah sebagai berikut:

 data
 └─domains
    └─domain.pddl                   (A PDDL domain file)
    └─problems                      (PDDL problem files)
       └─problem*.pddl
    └─observations                  (Observations for the initial state)
       └─problem*.jpg
    └─instructions                  (Linguistic instructions)
       └─problem*.txt
    └─annotated_bboxes              (Annotated bounding boxes)
       └─problem*.json

Hasil

results/reported_results berisi masalah PDDL yang dihasilkan dan rencana yang ditemukan dilaporkan di koran. Di direktori tersebut juga terdapat tiga subdirektori untuk setiap domain:

plain : hasil tanpa peringatan korektif
refine_once : hasil dengan menerapkan perbaikan ulang untuk masalah yang plain
refine_twice : hasil dengan menerapkan perbaikan ulang untuk masalah di refine_once

Memulai

Mendeteksi Objek dan Menghasilkan Teks

Untuk mendeteksi objek dengan kotak pembatas dan menghasilkan keterangan, jalankan:

 export domain=cooking
export grounding_dino_dir=./GroundingDINO
export result_dir=./results/temp/${domain}

python scripts/main.py 
    --data_dir "./data/${domain}" 
    --result_dir ${result_dir} 
    --grounding_dino_dir ${grounding_dino_dir} 
    --predict_bboxes

Langkah ini harus dilakukan sebelum timbulnya masalah PDDL.

Menghasilkan Masalah PDDL dan Menemukan Rencana

Untuk menghasilkan masalah PDDL berdasarkan prediksi kotak pembatas dan keterangan serta menemukan rencana, jalankan:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2
export num_examples=3

python scripts/main.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --num_examples ${num_examples} 
    --gen_step "plain" 
    --generate_problem 
    --find_plan

Mengevaluasi Masalah PDDL yang Dihasilkan dan Rencana yang Ditemukan

Untuk mengevaluasi masalah PDDL yang dihasilkan dan memvalidasi rencana yang ditemukan, jalankan:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2

python scripts/evaluate.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --gen_step "plain"

Menyempurnakan Masalah PDDL yang Dihasilkan

Untuk memperbaiki masalah PDDL yang dihasilkan dengan koreksi ulang, jalankan:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2

python scripts/main.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --gen_step "refine_once" 
    --prev_gen_step "plain" 
    --refine_problem 
    --use_cot 
    --find_plan

Kutipan

 @misc{shirai2023visionlanguage,
      title={Vision-Language Interpreter for Robot Task Planning}, 
      author={Keisuke Shirai and Cristian C. Beltran-Hernandez and Masashi Hamaya and Atsushi Hashimoto and Shohei Tanaka and Kento Kawaharazuka and Kazutoshi Tanaka and Yoshitaka Ushiku and Shinsuke Mori},
      year={2023},
      eprint={2311.00967},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2024-12-28
ukuran 2.19MB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua