Download ViLaIn - Download do código-fonte ViLaIn

ViLaIn

Outro código-fonte

1.0.0

Baixar

[Site] [Artigo] [Código]

ViLaIn

Uma implementação oficial do Vision-Language Interpreter (ViLaIn). Veja nosso artigo para mais detalhes.

Requisitos

Esta implementação requer Python>=3.10 e torch>=2.0.0 . Para instalar o PyTorch, siga as instruções em https://pytorch.org/.
Instale fast-downward e VAL seguindo as instruções de construção. Após a instalação, copie o binário validate no diretório downward .
Instale o Aterramento DINO seguindo as instruções.

O conjunto de dados ProDG

data contém arquivos PDDL, observações e instruções para três domínios, que denotamos como conjunto de dados ProDG no artigo. Este diretório também contém caixas delimitadoras anotadas em annotated_bboxes . A estrutura do diretório é a seguinte:

 data
 └─domains
    └─domain.pddl                   (A PDDL domain file)
    └─problems                      (PDDL problem files)
       └─problem*.pddl
    └─observations                  (Observations for the initial state)
       └─problem*.jpg
    └─instructions                  (Linguistic instructions)
       └─problem*.txt
    └─annotated_bboxes              (Annotated bounding boxes)
       └─problem*.json

Resultados

results/reported_results contém os problemas PDDL gerados e os planos encontrados relatados no artigo. No diretório, também existem três subdiretórios para cada domínio:

plain : os resultados sem nova solicitação corretiva
refine_once : os resultados aplicando nova solicitação corretiva para os problemas plain
refine_twice : os resultados aplicando nova solicitação corretiva para os problemas em refine_once

Começando

Detectando objetos e gerando legendas

Para detectar objetos com caixas delimitadoras e gerar legendas, execute:

 export domain=cooking
export grounding_dino_dir=./GroundingDINO
export result_dir=./results/temp/${domain}

python scripts/main.py 
    --data_dir "./data/${domain}" 
    --result_dir ${result_dir} 
    --grounding_dino_dir ${grounding_dino_dir} 
    --predict_bboxes

Esta etapa deve ser realizada antes da geração do problema PDDL.

Gerando Problemas PDDL e Encontrando Planos

Para gerar problemas PDDL com base nas caixas delimitadoras e legendas previstas e encontrar planos, execute:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2
export num_examples=3

python scripts/main.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --num_examples ${num_examples} 
    --gen_step "plain" 
    --generate_problem 
    --find_plan

Avaliando problemas PDDL gerados e planos encontrados

Para avaliar os problemas PDDL gerados e validar os planos encontrados, execute:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2

python scripts/evaluate.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --gen_step "plain"

Refinando Problemas PDDL Gerados

Para refinar os problemas de PDDL gerados por meio de nova solicitação corretiva, execute:

 export domain=cooking
export downward_dir=./downward
export result_dir=./results/temp/${domain}
export num_repeat=2

python scripts/main.py 
    --downward_dir ${downward_dir} 
    --data_dir "./data/${domain}" 
    --result_dir "${result_dir}" 
    --num_repeat ${num_repeat} 
    --gen_step "refine_once" 
    --prev_gen_step "plain" 
    --refine_problem 
    --use_cot 
    --find_plan

Citação

 @misc{shirai2023visionlanguage,
      title={Vision-Language Interpreter for Robot Task Planning}, 
      author={Keisuke Shirai and Cristian C. Beltran-Hernandez and Masashi Hamaya and Atsushi Hashimoto and Shohei Tanaka and Kento Kawaharazuka and Kazutoshi Tanaka and Yoshitaka Ushiku and Shinsuke Mori},
      year={2023},
      eprint={2311.00967},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2024-12-28
tamanho 2.19MB
Vindo de Github

Aplicativos Relacionados

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos