ดาวน์โหลด vqvae - ดาวน์โหลดซอร์สโค้ด vqvae

vqvae

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

Vector quantized variational autoencoder

นี่คือการใช้งาน pytorch ของเวกเตอร์ quantized variational autoencoder (https://arxiv.org/abs/1711.00937)

คุณสามารถค้นหาการใช้งานดั้งเดิมของผู้แต่งใน TensorFlow ได้ที่นี่ด้วยตัวอย่างที่คุณสามารถเรียกใช้ในสมุดบันทึก Jupyter

การติดตั้งการอ้างอิง

ในการติดตั้งการพึ่งพาให้สร้าง conda หรือสภาพแวดล้อมเสมือนจริงด้วย Python 3 จากนั้นเรียกใช้ pip install -r requirements.txt

เรียกใช้ vq vae

ในการเรียกใช้ vq-vae เพียงเรียกใช้ python3 main.py ตรวจสอบให้แน่ใจว่าได้รวมการตั้งค่าสถานะ -save หากคุณต้องการบันทึกโมเดลของคุณ คุณยังสามารถเพิ่มพารามิเตอร์ในบรรทัดคำสั่ง ค่าเริ่มต้นระบุไว้ด้านล่าง:

 parser . add_argument ( "--batch_size" , type = int , default = 32 )
parser . add_argument ( "--n_updates" , type = int , default = 5000 )
parser . add_argument ( "--n_hiddens" , type = int , default = 128 )
parser . add_argument ( "--n_residual_hiddens" , type = int , default = 32 )
parser . add_argument ( "--n_residual_layers" , type = int , default = 2 )
parser . add_argument ( "--embedding_dim" , type = int , default = 64 )
parser . add_argument ( "--n_embeddings" , type = int , default = 512 )
parser . add_argument ( "--beta" , type = float , default = .25 )
parser . add_argument ( "--learning_rate" , type = float , default = 3e-4 )
parser . add_argument ( "--log_interval" , type = int , default = 50 )

แบบจำลอง

VQ VAE มีส่วนประกอบโมเดลพื้นฐานดังต่อไปนี้:

คลาส Encoder ที่กำหนดแผนที่ x -> z_e
คลาส VectorQuantizer z_e -> z_q แปลงเอาต์พุตตัวเข้
คลาส Decoder ที่กำหนดแผนที่ z_q -> x_hat และสร้างภาพต้นฉบับขึ้นใหม่

คลาส ENCODER / DECODER เป็นสแต็คแบบ convolutional และผกผันซึ่งรวมถึงบล็อกที่เหลือในสถาปัตยกรรมของพวกเขาดูกระดาษ Resnet แบบจำลองที่เหลือถูกกำหนดโดยคลาส ResidualLayer และคลาส ResidualStack

ส่วนประกอบเหล่านี้ถูกจัดระเบียบในโครงสร้างโฟลเดอร์ต่อไปนี้:

 models/
    - decoder.py -> Decoder
    - encoder.py -> Encoder
    - quantizer.py -> VectorQuantizer
    - residual.py -> ResidualLayer, ResidualStack
    - vqvae.py -> VQVAE

Pixelcnn - การสุ่มตัวอย่างจากพื้นที่แฝงของ VQ VAE

ในการสุ่มตัวอย่างจากพื้นที่แฝงเราพอดีกับพิกเซลเหนือค่าพิกเซลแฝง z_ij เคล็ดลับที่นี่คือการรับรู้ว่า VQ VAE แมปรูปภาพไปยังพื้นที่แฝงที่มีโครงสร้างเดียวกับภาพ 1 ช่อง ตัวอย่างเช่นหากคุณเรียกใช้พารามิเตอร์ VQ VAE เริ่มต้นคุณจะได้รับภาพแผนที่ RGB ของรูปร่าง (32,32,3) ไปยังพื้นที่แฝงที่มีรูปร่าง (8,8,1) ซึ่งเทียบเท่ากับภาพ 8x8 สีเทา ดังนั้นคุณสามารถใช้ Pixelcnn เพื่อให้พอดีกับการกระจายผ่านค่า "พิกเซล" ของพื้นที่แฝง 8x8 1 ช่องทาง

ในการฝึกอบรม Pixelcnn ในการเป็นตัวแทนแฝงคุณต้องทำตามขั้นตอนเหล่านี้ก่อน:

ฝึกอบรม vq vae ในชุดข้อมูลที่คุณเลือก
ใช้พารามิเตอร์ VQ VAE ที่บันทึกไว้เพื่อเข้ารหัสชุดข้อมูลของคุณและบันทึกการแสดงพื้นที่แฝงแบบไม่ต่อเนื่องด้วย np.save API ใน quantizer.py นี่คือตัวแปร min_encoding_indices
ระบุพา ธ ไปยังชุดข้อมูลพื้นที่แฝงที่บันทึกไว้ของคุณในฟังก์ชัน utils.load_latent_block
เรียกใช้สคริปต์ Pixelcnn

ในการเรียกใช้ pixelcnn เพียงพิมพ์

python pixelcnn/gated_pixelcnn.py

เช่นเดียวกับพารามิเตอร์ใด ๆ (ดูคำสั่ง ArgParse) ชุดข้อมูลเริ่มต้นคือ LATENT_BLOCK ซึ่งจะใช้ได้เฉพาะในกรณีที่คุณได้ฝึกอบรม VQ VAE ของคุณและบันทึกการเป็นตัวแทนแฝง

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-17
ขนาด 157.54KB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
viptools for eslam

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
MySchedule.py

ซอร์สโค้ดอื่น ๆ

Updates to the fetching of week codes
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด