Download Thought Cloning - Download do código-fonte Thought Cloning

Thought Cloning

Código-Fonte de IA

1.0.0

Baixar

[NeurIPS '23 Spotlight] Clonagem de pensamento: aprendendo a pensar enquanto age, imitando o pensamento humano

Imagem

Este repositório fornece a implementação oficial de Clonagem de Pensamento: Aprendendo a Pensar enquanto Agia Imitando o Pensamento Humano. A clonagem de pensamento (TC) é uma nova estrutura de aprendizagem por imitação que aprimora a capacidade do agente, a segurança da IA e a interpretabilidade, treinando agentes para pensar como humanos . Este repositório implementa TC em um domínio gridworld 2D parcialmente observável simulado BabyAI com um conjunto de dados de pensamento humano sintético. Verifique também o tópico do tweet de introdução.

Instalação

Criando Ambiente

Crie ambiente com python-venv ou conda. Um exemplo com python-venv é mostrado aqui:

 python3 -m venv thoughtcloning
source thoughtcloning/bin/activate

Requisitos principais

Pitão >= 3.6
PyTorch >= 1.7.1
Ginásio OpenAI == 0.9.6
NumPy == 1.19.5
academia-minirrede == 1.0.0
bloco

Este repositório foi testado com Python 3.9.10 e PyTorch 1.7.1+cu110. O código pode não ser compatível com versões superiores de gym, numpy ou gym-minigrid.

Instalação

Instale o PyTorch 1.7.1+ seguindo o tutorial oficial do PyTorch.
Clone este repositório e instale as outras dependências com pip3

 git clone https://github.com/ShengranHu/Thought-Cloning.git
cd Thought-Cloning
pip3 install --upgrade pip
pip3 install --editable .

Nota: execute pip3 install --editable . novamente se o diretório do projeto for alterado posteriormente.

Configurando caminho

Altere o diretório de saída em storage_dir em /babyai/utils/__init__.py. Defina path-to-thought-cloning como o caminho do seu projeto de clonagem de pensamento.

Reproduza os resultados no papel

O conjunto de dados sintéticos de pensamento humano em BossLevel , pesos de modelos de TC treinados e ambientes coletados para testar o desempenho fora de distribuição estão disponíveis no Google Drive.

Reproduzir conjunto de dados de pensamento sintético

Para reproduzir um conjunto de dados de pensamento sintético, você pode usar o script scripts/make_agent_demos.py com o seguinte comando:

 scripts/make_agent_demos.py --episodes <NUM_OF_EPISODES> --env <ENV_NAME> --noise-rate 0.01

Treinamento de clonagem de pensamento

Para reproduzir os principais resultados de desempenho apresentados na Figura 3 do nosso artigo, utilize o seguinte comando:

 scripts/train_tc.py --env BabyAI-BossLevel-v0 --demos <DEMO_NAME> --memory-dim=2048 --recurrence=80 --batch-size=180 --instr-arch=attgru --instr-dim=256 --val-interval 2 --log-interval 2 --lr 5e-4 --epochs 160 --epoch-length 51200 --seed 0 --val-seed 2023 --model <NAME_OF_MODEL> --sg-coef 2 --warm-start --stop-tf 10

Para cada experimento, você pode alterar o argumento group_name para agrupar o log e modelar a saída em uma pasta específica.

Avaliação zero-shot em ambientes fora de distribuição

Para reproduzir os resultados da avaliação zero shot apresentados na Figura 4 (a) do nosso artigo, use o seguinte comando:

 scripts/evaluate_levels.py --env BabyAI-BossLevel-v0 --model <NAME_OF_MODEL> --testing-levels-path <PATH_TO_TESTING_LEVELS_PICKLE>

Links relacionados

Nossa implementação é baseada em BabyAI 1.1 (linha de base de domínio e aprendizado de imitação), dan-visdial (codificador de transformador de componente de nível superior) e visdial-rl (decodificador RNN de componente de nível superior).

Citação

Se você achar este projeto útil, considere citar:

 @article{hu2023ThoughtCloning,
  title={{Thought Cloning}: Learning to think while acting by imitating human thinking},
  author={Hu, Shengran and Clune, Jeff},
  journal={Advances in Neural Information Processing Systems},
  volume={36},
  year={2023}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-01-28
tamanho 170.84KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Fuga de primeira classe: a linha do pensamento

2022-08-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos