ดาวน์โหลด Thought Cloning - ดาวน์โหลดซอร์สโค้ด Thought Cloning

Thought Cloning

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

[NeurIPS '23 Spotlight] การโคลนนิ่งความคิด: เรียนรู้ที่จะคิดขณะทำโดยเลียนแบบการคิดของมนุษย์

ภาพ

พื้นที่เก็บข้อมูลนี้จัดให้มีการใช้งานอย่างเป็นทางการสำหรับ Thought Cloning: การเรียนรู้ที่จะคิดขณะกระทำโดยการเลียนแบบการคิดของมนุษย์ Thought Cloning (TC) เป็นเฟรมเวิร์กการเรียนรู้การเลียนแบบแบบใหม่ที่ช่วยเพิ่มความสามารถของตัวแทน ความปลอดภัยของ AI และการตีความโดยการฝึกอบรมตัวแทนให้ คิดเหมือนมนุษย์ พื้นที่เก็บข้อมูลนี้ใช้ TC บนโดเมน BabyAI โดเมน gridworld 2D ที่สังเกตได้บางส่วนที่จำลองได้ พร้อมด้วยชุดข้อมูลความคิดของมนุษย์สังเคราะห์ ตรวจสอบกระทู้ทวีตแนะนำด้วย

การติดตั้ง

การสร้างสิ่งแวดล้อม

สร้างสภาพแวดล้อมด้วย python-venv หรือ conda ตัวอย่างด้วย python-venv แสดงไว้ที่นี่:

 python3 -m venv thoughtcloning
source thoughtcloning/bin/activate

ข้อกำหนดที่สำคัญ

หลาม >= 3.6
ไพทอร์ช >= 1.7.1
OpenAI ยิม == 0.9.6
NumPy == 1.19.5
ยิมมินิกริด == 1.0.0
กลุ่ม

พื้นที่เก็บข้อมูลนี้ได้รับการทดสอบกับ Python 3.9.10 และ PyTorch 1.7.1+cu110 รหัสนี้อาจเข้ากันไม่ได้กับ gym, numpy หรือ gym-minigrid เวอร์ชันที่สูงกว่า

การติดตั้ง

ติดตั้ง PyTorch 1.7.1+ ตามบทช่วยสอนอย่างเป็นทางการของ PyTorch
โคลนที่เก็บนี้และติดตั้งการขึ้นต่อกันอื่น ๆ ด้วย pip3

 git clone https://github.com/ShengranHu/Thought-Cloning.git
cd Thought-Cloning
pip3 install --upgrade pip
pip3 install --editable .

หมายเหตุ: รัน pip3 install --editable . อีกครั้งหากไดเรกทอรีโครงการมีการเปลี่ยนแปลงในภายหลัง

การกำหนดค่าเส้นทาง

เปลี่ยนไดเร็กทอรีเอาต์พุตใน storage_dir ใน /babyai/utils/__init__.py ตั้งค่า path-to-thought-cloning เป็นเส้นทางของโครงการ Thought Cloning ของคุณ

ทำซ้ำผลลัพธ์ในกระดาษ

ชุดข้อมูลความคิดของมนุษย์สังเคราะห์บน BossLevel น้ำหนักโมเดล TC ที่ได้รับการฝึกอบรม และสภาพแวดล้อมที่รวบรวมไว้เพื่อทดสอบประสิทธิภาพที่ไม่กระจายมีอยู่ใน Google Drive

สร้างชุดข้อมูลความคิดสังเคราะห์ขึ้นมาใหม่

หากต้องการสร้างชุดข้อมูลความคิดสังเคราะห์ขึ้นมาใหม่ คุณสามารถใช้สคริปต์ scripts/make_agent_demos.py ด้วยคำสั่งต่อไปนี้:

 scripts/make_agent_demos.py --episodes <NUM_OF_EPISODES> --env <ENV_NAME> --noise-rate 0.01

การฝึกอบรมการโคลนนิ่งความคิด

หากต้องการทำซ้ำผลลัพธ์ประสิทธิภาพหลักที่แสดงในรูปที่ 3 ของรายงานของเรา ให้ใช้คำสั่งต่อไปนี้:

 scripts/train_tc.py --env BabyAI-BossLevel-v0 --demos <DEMO_NAME> --memory-dim=2048 --recurrence=80 --batch-size=180 --instr-arch=attgru --instr-dim=256 --val-interval 2 --log-interval 2 --lr 5e-4 --epochs 160 --epoch-length 51200 --seed 0 --val-seed 2023 --model <NAME_OF_MODEL> --sg-coef 2 --warm-start --stop-tf 10

สำหรับการทดลองแต่ละครั้ง คุณสามารถเปลี่ยนอาร์กิวเมนต์ group_name ให้เป็นบันทึกกลุ่มและเอาต์พุตโมเดลลงในโฟลเดอร์เฉพาะได้

การประเมินแบบ Zero-shot ในสภาพแวดล้อมที่ไม่กระจาย

หากต้องการสร้างผลลัพธ์การประเมินแบบ Zero-shot ที่แสดงในรูปที่ 4(a) ของรายงานของเรา ให้ใช้คำสั่งต่อไปนี้:

 scripts/evaluate_levels.py --env BabyAI-BossLevel-v0 --model <NAME_OF_MODEL> --testing-levels-path <PATH_TO_TESTING_LEVELS_PICKLE>

ลิงค์ที่เกี่ยวข้อง

การใช้งานของเราขึ้นอยู่กับ BabyAI 1.1 (พื้นฐานโดเมนและการเรียนรู้การเลียนแบบ), dan-visdial (ตัวเข้ารหัส Component Transformer ระดับบน) และ visdial-rl (ตัวถอดรหัส Component RNN ระดับบน)

การอ้างอิง

หากคุณพบว่าโครงการนี้มีประโยชน์ โปรดพิจารณาการอ้างอิง:

 @article{hu2023ThoughtCloning,
  title={{Thought Cloning}: Learning to think while acting by imitating human thinking},
  author={Hu, Shengran and Clune, Jeff},
  journal={Advances in Neural Information Processing Systems},
  volume={36},
  year={2023}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-01-28
ขนาด 170.84KB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
การหลบหนีชั้นหนึ่ง: รถไฟแห่งความคิด

2022-08-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด