Descarga Thought Cloning - Descarga del código fuente Thought Cloning

Thought Cloning

Código Fuente de IA

1.0.0

Descargar

[NeurIPS '23 Spotlight] Clonación del pensamiento: aprender a pensar mientras actúa imitando el pensamiento humano

Imagen

Este repositorio proporciona la implementación oficial de Thought Cloning: aprender a pensar mientras actúa imitando el pensamiento humano. Thought Cloning (TC) es un novedoso marco de aprendizaje por imitación que mejora la capacidad de los agentes, la seguridad de la IA y la interpretabilidad al entrenar a los agentes para que piensen como humanos . Este repositorio implementa TC en un dominio BabyAI de gridworld 2D parcialmente observable simulado con un conjunto de datos sintéticos de pensamiento humano. Consulte también el hilo del tweet de introducción.

Instalación

Creando ambiente

Cree un entorno con python-venv o conda. Aquí se muestra un ejemplo con python-venv:

 python3 -m venv thoughtcloning
source thoughtcloning/bin/activate

Requisitos clave

Pitón >= 3.6
PyTorch >= 1.7.1
Gimnasio OpenAI == 0.9.6
NumPy == 1.19.5
gimnasio-minigrid == 1.0.0
bloque

Este repositorio ha sido probado con Python 3.9.10 y PyTorch 1.7.1+cu110. Es posible que el código no sea compatible con una versión superior de gym, numpy o gym-minigrid.

Instalación

Instale PyTorch 1.7.1+ siguiendo el tutorial oficial de PyTorch.
Clona este repositorio e instala las otras dependencias con pip3

 git clone https://github.com/ShengranHu/Thought-Cloning.git
cd Thought-Cloning
pip3 install --upgrade pip
pip3 install --editable .

Nota: ejecute pip3 install --editable . nuevamente si el directorio del proyecto se cambia posteriormente.

Configuración de ruta

Cambie el directorio de salida en storage_dir en /babyai/utils/__init__.py. Establezca path-to-thought-cloning en la ruta de su proyecto de clonación de pensamientos.

Reproducir los resultados en el documento.

El conjunto de datos sintéticos de pensamiento humano en BossLevel , los pesos del modelo TC entrenado y los entornos recopilados para probar el rendimiento fuera de distribución están disponibles en Google Drive.

Reproducir un conjunto de datos de pensamiento sintético

Para reproducir un conjunto de datos de pensamiento sintético, puede utilizar el script scripts/make_agent_demos.py con el siguiente comando:

 scripts/make_agent_demos.py --episodes <NUM_OF_EPISODES> --env <ENV_NAME> --noise-rate 0.01

Entrenamiento de clonación de pensamientos

Para reproducir los principales resultados de rendimiento presentados en la Fig. 3 de nuestro artículo, utilice el siguiente comando:

 scripts/train_tc.py --env BabyAI-BossLevel-v0 --demos <DEMO_NAME> --memory-dim=2048 --recurrence=80 --batch-size=180 --instr-arch=attgru --instr-dim=256 --val-interval 2 --log-interval 2 --lr 5e-4 --epochs 160 --epoch-length 51200 --seed 0 --val-seed 2023 --model <NAME_OF_MODEL> --sg-coef 2 --warm-start --stop-tf 10

Para cada experimento, puede cambiar el argumento group_name para agrupar el registro y la salida del modelo en una carpeta específica.

Evaluación de tiro cero en entornos fuera de distribución

Para reproducir los resultados de la evaluación de disparo cero presentados en la Fig. 4 (a) de nuestro artículo, utilice el siguiente comando:

 scripts/evaluate_levels.py --env BabyAI-BossLevel-v0 --model <NAME_OF_MODEL> --testing-levels-path <PATH_TO_TESTING_LEVELS_PICKLE>

Enlaces relacionados

Nuestra implementación se basa en BabyAI 1.1 (dominio y línea base de aprendizaje de imitación), dan-visdial (codificador de transformador de componentes de nivel superior) y visdial-rl (decodificador RNN de componentes de nivel superior).

Citación

Si encuentra útil este proyecto, considere citar:

 @article{hu2023ThoughtCloning,
  title={{Thought Cloning}: Learning to think while acting by imitating human thinking},
  author={Hu, Shengran and Clune, Jeff},
  journal={Advances in Neural Information Processing Systems},
  volume={36},
  year={2023}
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-01-28
tamaño 170.84KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Escape de primera clase: el tren del pensamiento

2022-08-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo