Téléchargement Thought Cloning - Téléchargement du code source Thought Cloning

Thought Cloning

Code Source AI

1.0.0

Télécharger

[Pleins feux sur NeurIPS '23] Clonage de la pensée : apprendre à penser tout en agissant en imitant la pensée humaine

Ce référentiel fournit l'implémentation officielle de Thought Cloning : Apprendre à penser en agissant en imitant la pensée humaine. Le clonage de pensée (TC) est un nouveau cadre d'apprentissage par imitation qui améliore les capacités des agents, la sécurité de l'IA et l'interprétabilité en entraînant les agents à penser comme des humains . Ce référentiel implémente TC sur un domaine de grille 2D partiellement observable simulé BabyAI avec un ensemble de données synthétiques sur la pensée humaine. Consultez également le fil de tweet d’introduction.

Installation

Créer un environnement

Créez un environnement avec python-venv ou conda. Un exemple avec python-venv est présenté ici :

 python3 -m venv thoughtcloning
source thoughtcloning/bin/activate

Exigences clés

Python >= 3.6
PyTorch >= 1.7.1
Salle de sport OpenAI == 0.9.6
NumPy == 1.19.5
gymnase-mini-réseau == 1.0.0
bloc

Ce référentiel a été testé avec Python 3.9.10 et PyTorch 1.7.1+cu110. Le code peut ne pas être compatible avec la version supérieure de gym, numpy ou gym-minigrid.

Installation

Installez PyTorch 1.7.1+ en suivant le tutoriel officiel de PyTorch.
Clonez ce référentiel et installez les autres dépendances avec pip3

 git clone https://github.com/ShengranHu/Thought-Cloning.git
cd Thought-Cloning
pip3 install --upgrade pip
pip3 install --editable .

Remarque : exécutez pip3 install --editable . encore une fois si le répertoire du projet est modifié par la suite.

Configuration du chemin

Modifiez le répertoire de sortie dans storage_dir dans /babyai/utils/__init__.py. Définissez path-to-thought-cloning sur le chemin de votre projet de clonage de pensée.

Reproduire les résultats dans le papier

L'ensemble de données synthétiques sur la pensée humaine sur BossLevel , les poids du modèle TC formés et les environnements collectés pour tester les performances hors distribution sont disponibles dans Google Drive.

Reproduire un ensemble de données de pensée synthétique

Pour reproduire un ensemble de données de pensée synthétique, vous pouvez utiliser le script scripts/make_agent_demos.py avec la commande suivante :

 scripts/make_agent_demos.py --episodes <NUM_OF_EPISODES> --env <ENV_NAME> --noise-rate 0.01

Formation sur le clonage de pensée

Pour reproduire les principaux résultats de performances présentés dans la figure 3 de notre article, utilisez la commande suivante :

 scripts/train_tc.py --env BabyAI-BossLevel-v0 --demos <DEMO_NAME> --memory-dim=2048 --recurrence=80 --batch-size=180 --instr-arch=attgru --instr-dim=256 --val-interval 2 --log-interval 2 --lr 5e-4 --epochs 160 --epoch-length 51200 --seed 0 --val-seed 2023 --model <NAME_OF_MODEL> --sg-coef 2 --warm-start --stop-tf 10

Pour chaque expérience, vous pouvez modifier l'argument group_name en groupant le journal et la sortie du modèle dans un dossier spécifique.

Évaluation Zero-shot sur les environnements hors distribution

Pour reproduire les résultats de l'évaluation zéro-shot présentés sur la figure 4 (a) de notre article, utilisez la commande suivante :

 scripts/evaluate_levels.py --env BabyAI-BossLevel-v0 --model <NAME_OF_MODEL> --testing-levels-path <PATH_TO_TESTING_LEVELS_PICKLE>

Liens connexes

Notre implémentation est basée sur BabyAI 1.1 (base de référence pour le domaine et l'apprentissage par imitation), dan-visdial (encodeur de transformateur de composants de niveau supérieur) et visdial-rl (décodeur RNN de composants de niveau supérieur).

Citation

Si vous trouvez ce projet utile, pensez à citer :

 @article{hu2023ThoughtCloning,
  title={{Thought Cloning}: Learning to think while acting by imitating human thinking},
  author={Hu, Shengran and Clune, Jeff},
  journal={Advances in Neural Information Processing Systems},
  volume={36},
  year={2023}
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-01-28
taille 170.84KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Évasion en première classe : le fil de la pensée

2022-08-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout