สภาพแวดล้อมการเรียนรู้ที่เขียนด้วยภาษา C++ และ Lua สำหรับการสร้างโลกกริด
DeepMind Lab2D คือระบบสำหรับการสร้างสภาพแวดล้อม 2 มิติสำหรับการเรียนรู้ของเครื่อง เป้าหมายหลักของระบบคือความสะดวกในการใช้งานและประสิทธิภาพ: สภาพแวดล้อมคือ "โลกกริด" ซึ่งกำหนดด้วยการผสมผสานระหว่างแผนที่แบบข้อความธรรมดาสำหรับเค้าโครงของโลก และโค้ด Lua สำหรับพฤติกรรมของมัน เอเจนต์การเรียนรู้ของเครื่องโต้ตอบกับสภาพแวดล้อมเหล่านี้ผ่านหนึ่งในสอง API, Python dm_env
API หรือ C API แบบกำหนดเอง (ซึ่งใช้โดย DeepMind Lab เช่นกัน) รองรับตัวแทนหลายราย
หากคุณใช้ DeepMind Lab2D ในการวิจัยและต้องการอ้างอิง เราขอแนะนำให้คุณอ้างอิงเอกสารไวท์เปเปอร์ที่แนบมาด้วย
DeepMind Lab2d พร้อมใช้งานบน PyPI และสามารถติดตั้งได้โดยใช้:
pip install dmlab2d
dmlab2d
ได้รับการเผยแพร่ในรูปแบบล้อที่สร้างไว้ล่วงหน้าสำหรับ Linux และ macOS หากไม่มีวงล้อที่เหมาะสมสำหรับแพลตฟอร์มของคุณ คุณจะต้องสร้างมันจากแหล่งที่มา ดู install.sh
สำหรับสคริปต์การติดตั้งตัวอย่างที่สามารถปรับให้เข้ากับการตั้งค่าของคุณได้
เราจัดเตรียมตัวอย่างเอเจนต์ "สุ่ม" ใน python/random_agent
ซึ่งดำเนินการแบบสุ่ม ซึ่งสามารถใช้เป็นฐานในการสร้างตัวแทนของคุณเอง และเป็นเครื่องมือง่ายๆ ในการดูตัวอย่างสภาพแวดล้อม
bazel run -c opt dmlab2d/random_agent -- --level_name=clean_up
DeepMind Lab2D ขึ้นอยู่กับไลบรารีซอฟต์แวร์ภายนอกจำนวนหนึ่ง ซึ่งเราจัดส่งด้วยวิธีต่างๆ หลายวิธี:
ไลบรารี dm_env
, eigen
, luajit
, lua5.1
, lua5.2
, luajit
, png
และ zlib
มีการอ้างอิงเป็นแหล่ง Bazel ภายนอก และมีไฟล์ Bazel BUILD เตรียมไว้ให้ โค้ดที่ต้องพึ่งพานั้นควรจะสามารถพกพาได้พอสมควร และกฎ BUILD ที่เราจัดส่งนั้นเฉพาะกับ Linux x86 และ MacOS (x86 และ arm64) หากต้องการสร้างบนแพลตฟอร์มอื่น คุณจะต้องแก้ไขไฟล์ BUILD เหล่านั้น
"API การเรียนรู้การเสริมกำลังทั่วไป" รวมอยู่ใน //third_party/rl_api
จำเป็นต้องมีห้องสมุดเพิ่มเติมหลายแห่ง แต่ไม่ได้จัดส่งในรูปแบบใดๆ จะต้องมีอยู่ในระบบของคุณ:
Python 3.8
ขึ้นไปพร้อม NumPy
, PyGame
และ packaging
กฎการสร้างใช้การตั้งค่าคอมไพเลอร์บางอย่างที่เฉพาะเจาะจงสำหรับ GCC/Clang หากคอมไพเลอร์ของคุณไม่รู้จักแฟล็กบางตัว (โดยทั่วไปจะเป็นการระงับคำเตือนเฉพาะ) คุณอาจต้องแก้ไขแฟล็กเหล่านั้น
นี่ไม่ใช่ผลิตภัณฑ์อย่างเป็นทางการของ Google