นี่คือพื้นที่เก็บข้อมูลอย่างเป็นทางการสำหรับกระดาษ "การสร้าง ambigram โดยรูปแบบการแพร่กระจาย" บทความนี้ได้รับการยอมรับที่ ICDAR 2023
【 อัปเดต 】
2023/07/20: Ambifusion2 เปิดอยู่ วิธีนี้สามารถสร้าง ambigrams กับคู่รูปภาพใด ๆ โดยการระบุสองแจ้งเป็นคู่
tl; dr
ambigramability
ในการวัดวัตถุประสงค์ของความง่ายในการสร้าง ambigrams สำหรับแต่ละตัวอักษรแต่ละคู่ Ambigrams คือการออกแบบตัวอักษรกราฟิกที่สามารถอ่านได้ไม่เพียง แต่จากทิศทางดั้งเดิม แต่ยังมาจากทิศทางที่หมุน (โดยเฉพาะกับ 180 องศา) การออกแบบ ambigrams เป็นเรื่องยากแม้สำหรับผู้เชี่ยวชาญของมนุษย์เพราะการรักษาความสามารถในการอ่านคู่ของพวกเขาจากทั้งสองทิศทางมักจะยาก บทความนี้เสนอรูปแบบการสร้าง ambigram ในฐานะโมดูลรุ่นเราใช้แบบจำลองการแพร่กระจายซึ่งเพิ่งถูกใช้เพื่อสร้างภาพภาพถ่ายคุณภาพสูง โดยการระบุคลาสจดหมายคู่หนึ่งเช่น 'A' และ 'B' โมเดลที่เสนอจะสร้างภาพ ambigram ต่าง ๆ ซึ่งสามารถอ่านเป็น 'a' จากทิศทางดั้งเดิมและ 'B' จากทิศทางหมุน 180 องศา การวิเคราะห์เชิงปริมาณและเชิงคุณภาพของผลการทดลองแสดงให้เห็นว่าแบบจำลองที่เสนอสามารถสร้าง ambigrams คุณภาพสูงและหลากหลาย นอกจากนี้เรายังกำหนดความสามารถในการสร้างความสามารถในการวัดวัตถุประสงค์ของความง่ายในการสร้าง ambigrams สำหรับแต่ละตัวอักษรแต่ละคู่ ตัวอย่างเช่นคู่ของ 'A' และ 'V' แสดงความสามารถในการสร้างภาพรวมที่สูง (นั่นคือมันเป็นเรื่องง่ายที่จะสร้าง ambigrams ของพวกเขา) และคู่ของ 'D' และ 'K' แสดงความสามารถที่ต่ำกว่า ความสามารถในการสร้างความสามารถในการสร้างคำแนะนำต่าง ๆ ของการสร้าง Ambigram ไม่เพียง แต่สำหรับคอมพิวเตอร์ แต่ยังรวมถึงผู้เชี่ยวชาญของมนุษย์ด้วย
วิธีที่เราเสนอสร้าง ambigrams เช่นตัวอย่างต่อไปนี้
หมายเลขวงเล็บคือคะแนนความสามารถในการสร้างความสามารถ (↑) ของคู่ตัวอักษร สามแถวบนเป็นคู่คลาสที่ค่อนข้างง่าย (ที่มีคะแนนความสามารถในการสร้างความสามารถในการสร้างความสามารถสูงกว่า) และสามส่วนล่างไม่ได้
เราทดสอบรหัสทั้งหมดใน Python: 3.8.10
คุณสามารถดาวน์โหลดไลบรารีภายนอกด้วย pip
ดังต่อไปนี้
pip install torch==1.11.0+cu113 torchvision==0.12.0+cu113 torchaudio==0.11.0 --extra-index-url https://download.pytorch.org/whl/cu113
pip install -r requirements.txt
คุณยังสามารถดาวน์โหลดน้ำหนักที่ได้รับการฝึกอบรมล่วงหน้า แทนที่ไฟล์ pseud-weights ทั้งหมด weight_name.txt
ด้วยไฟล์ Weights จริงที่ดาวน์โหลดมา
python demo.py
127.0.0.1:11111
ด้วยเว็บเบราว์เซอร์ของคุณ TestConfigs
ใน ambigram_random_sample.py
python ambigram_random_sample.py
TestConfigs
ใน calc_ambigramability.py
python calc_ambigramability.py
TrainConfigs
ใน configs/trainargs.py
หากคุณต้องการคุณสามารถเปลี่ยน DA_ambigram_configs.yaml
(รายละเอียดถูกกล่าวถึงที่วินาที 3.2 ในกระดาษ) ## Run on single gpu
python ambigram_train.py
## Run on multiple gpus
mpiexec -n [NUM_GPUs] python ambigram_train.py
หมายเหตุ [1]: หากคุณต้องการสร้าง ambigrams โดยใช้ classifier-free guidance
คุณต้องฝึกทั้งแบบจำลองแบบมีเงื่อนไขและแบบไม่มีเงื่อนไขแยกต่างหาก
@article{shirakawa2023ambigram,
title={Ambigram Generation by A Diffusion Model},
author={Shirakawa, Takahiro and Uchida, Seiichi},
booktitle={2023 17th international conference on document analysis and recognition (ICDAR)},
year={2023}
}