ชุดข้อมูล Quick Draw คือคอลเลกชันภาพวาด 50 ล้านภาพใน 345 หมวดหมู่ ซึ่งสนับสนุนโดยผู้เล่นเกม Quick, Draw! ภาพวาดถูกจับเป็นเวกเตอร์ที่มีการประทับเวลา ติดแท็กด้วยข้อมูลเมตา รวมถึงสิ่งที่ผู้เล่นถูกขอให้วาด และประเทศที่ผู้เล่นอาศัยอยู่ คุณสามารถเรียกดูภาพวาดที่ได้รับการยอมรับได้ที่ Quickdraw.withgoogle.com/data
เรากำลังแชร์สิ่งเหล่านี้ที่นี่เพื่อให้นักพัฒนา นักวิจัย และศิลปินได้สำรวจ ศึกษา และเรียนรู้ หากคุณสร้างบางสิ่งด้วยชุดข้อมูลนี้ โปรดแจ้งให้เราทราบทางอีเมลหรือที่ AI Experiments
นอกจากนี้เรายังได้เปิดตัวบทช่วยสอนและแบบจำลองสำหรับการฝึกตัวแยกประเภทการวาดภาพของคุณเองบน tensorflow.org
โปรดทราบว่าแม้ว่าคอลเลกชันภาพวาดนี้จะได้รับการตรวจสอบเป็นรายบุคคล แต่อาจมีเนื้อหาที่ไม่เหมาะสม
ชุดข้อมูลดิบที่ผ่านการกลั่นกรอง
ชุดข้อมูลที่ประมวลผลล่วงหน้า
รับข้อมูล
โปรเจ็กต์ที่ใช้ชุดข้อมูล
การเปลี่ยนแปลง
ใบอนุญาต
ข้อมูลดิบมีอยู่ในไฟล์ ndjson
แยกตามหมวดหมู่ ในรูปแบบต่อไปนี้:
สำคัญ | พิมพ์ | คำอธิบาย |
---|---|---|
คีย์_ไอดี | จำนวนเต็ม 64 บิตที่ไม่ได้ลงนาม | ตัวระบุที่ไม่ซ้ำสำหรับภาพวาดทั้งหมด |
คำ | เชือก | หมวดหมู่ที่ผู้เล่นได้รับแจ้งให้จั่ว |
ได้รับการยอมรับ | บูลีน | ไม่ว่าจะเป็นคำที่เกมได้รับการยอมรับ |
การประทับเวลา | วันที่และเวลา | เมื่อภาพวาดถูกสร้างขึ้น |
รหัสประเทศ | เชือก | รหัสประเทศตัวอักษรสองตัว (ISO 3166-1 alpha-2) ของที่ตั้งของผู้เล่น |
การวาดภาพ | เชือก | อาร์เรย์ JSON ที่แสดงการวาดเวกเตอร์ |
แต่ละบรรทัดมีหนึ่งภาพวาด นี่คือตัวอย่างของภาพวาดเดี่ยว:
{ "key_id": "5891796615823360" "word" "จมูก" "countrycode" "AE" "ประทับเวลา": 2017-03-01 20:41:36.70725 UTC","recognized":true,"กำลังวาด":[[[129,128,129,129,130,130,131,132,132,133,133,133,133,...]]] -
รูปแบบของอาเรย์การวาดเป็นดังนี้:
- [ // จังหวะแรก [x0, x1, x2, x3, ...],[y0, y1, y2, y3, ...],[t0, t1, t2, t3, ...] - [ // จังหวะที่สอง[x0, x1, x2, x3, ...],[y0, y1, y2, y3, ...],[t0, t1, t2, t3, ...] - ... // จังหวะเพิ่มเติม]
โดยที่ x
และ y
คือพิกัดพิกเซล และ t
คือเวลาเป็นมิลลิวินาทีนับตั้งแต่จุดแรก x
และ y
เป็นมูลค่าจริง ในขณะที่ t
เป็นจำนวนเต็ม ภาพวาดดิบสามารถมีกรอบขอบเขตและจำนวนจุดที่แตกต่างกันอย่างมาก เนื่องจากอุปกรณ์ที่แตกต่างกันที่ใช้ในการแสดงผลและการป้อนข้อมูล
เราได้ประมวลผลล่วงหน้าและแยกชุดข้อมูลออกเป็นไฟล์และรูปแบบต่างๆ เพื่อให้ดาวน์โหลดและสำรวจได้เร็วและง่ายขึ้น
.ndjson
) เราได้ทำให้เวกเตอร์ง่ายขึ้น ลบข้อมูลเวลา และจัดตำแหน่งและปรับขนาดข้อมูลให้อยู่ในขอบเขต 256x256 ข้อมูลจะถูกส่งออกในรูปแบบ ndjson
โดยมีข้อมูลเมตาเดียวกันกับรูปแบบ Raw กระบวนการทำให้ง่ายขึ้นคือ:
จัดแนวภาพวาดไปที่มุมซ้ายบนเพื่อให้มีค่าต่ำสุดเป็น 0
ปรับขนาดภาพวาดให้เท่ากันเพื่อให้มีค่าสูงสุด 255
สุ่มตัวอย่างลายเส้นทั้งหมดอีกครั้งโดยเว้นระยะห่าง 1 พิกเซล
ลดความซับซ้อนของสโตรกทั้งหมดโดยใช้อัลกอริธึม Ramer–Douglas–Peucker ที่มีค่าเอปไซลอน 2.0
มีตัวอย่างใน example/nodejs/siimpled-parser.js ที่แสดงวิธีอ่านไฟล์ ndjson ใน NodeJS
นอกจากนี้ เอกสาร example/nodejs/ndjson.md ให้รายละเอียดชุดเครื่องมือบรรทัดคำสั่งที่สามารถช่วยสำรวจชุดย่อยของไฟล์ที่ค่อนข้างใหญ่เหล่านี้ได้
.bin
)ภาพวาดและข้อมูลเมตาที่เรียบง่ายยังมีให้ใช้งานในรูปแบบไบนารีที่กำหนดเองเพื่อการบีบอัดและการโหลดที่มีประสิทธิภาพ
มีตัวอย่างใน example/binary_file_parser.py ที่แสดงวิธีการโหลดไฟล์ไบนารี่ใน Python
นอกจากนี้ยังมีตัวอย่างใน example/nodejs/binary-parser.js ที่แสดงวิธีอ่านไฟล์ไบนารีใน NodeJS
.npy
) ภาพวาดแบบง่ายทั้งหมดได้รับการเรนเดอร์เป็นบิตแมประดับสีเทา 28x28 ในรูปแบบ numpy .npy
สามารถโหลดไฟล์ได้ด้วย np.load()
รูปภาพเหล่านี้สร้างขึ้นจากข้อมูลแบบง่าย แต่จัดชิดตรงกลางของกรอบขอบของภาพวาดแทนที่จะเป็นมุมซ้ายบน ดูข้อมูลโค้ดที่ใช้ในการสร้างได้ที่นี่
ชุดข้อมูลนี้มีอยู่ใน Google Cloud Storage เป็นไฟล์ ndjson
แยกตามหมวดหมู่ ดูรายการไฟล์ใน Cloud หรืออ่านเพิ่มเติมเกี่ยวกับการเข้าถึงชุดข้อมูลสาธารณะโดยใช้วิธีอื่น ตัวอย่างเช่น หากต้องการดาวน์โหลดภาพวาดแบบง่ายทั้งหมดอย่างง่ายดาย วิธีหนึ่งคือการรันคำสั่ง gsutil -m cp 'gs://quickdraw_dataset/full/simplified/*.ndjson' .
ไฟล์ Raw ( .ndjson
)
ไฟล์ภาพวาดแบบง่าย ( .ndjson
)
ไฟล์ไบนารี ( .bin
)
ไฟล์บิตแมปจำนวนมาก ( .npy
)
ข้อมูลนี้ยังใช้สำหรับการฝึกโมเดล Sketch-RNN อีกด้วย การใช้งานโอเพนซอร์ส TensorFlow ของโมเดลนี้มีอยู่ใน Magenta Project (ลิงก์ไปยัง GitHub repo) คุณยังสามารถอ่านเพิ่มเติมเกี่ยวกับโมเดลนี้ได้ในบล็อกโพสต์ของ Google Research ข้อมูลจะถูกจัดเก็บไว้ในไฟล์ .npz
ที่ถูกบีบอัด ในรูปแบบที่เหมาะสมสำหรับอินพุตในโครงข่ายประสาทที่เกิดซ้ำ
ในชุดข้อมูลนี้ ตัวอย่าง 75K (การฝึกอบรม 70K, การตรวจสอบความถูกต้อง 2.5K, การทดสอบ 2.5K) ได้รับการสุ่มเลือกจากแต่ละหมวดหมู่ ประมวลผลด้วยการลดความซับซ้อนของบรรทัด RDP ด้วยพารามิเตอร์ epsilon
ที่ 2.0 แต่ละหมวดหมู่จะถูกจัดเก็บไว้ในไฟล์ .npz
ของตัวเอง เช่น cat.npz
นอกจากนี้เรายังให้ข้อมูลที่ครบถ้วนสำหรับแต่ละหมวดหมู่ หากคุณต้องการใช้ตัวอย่างการฝึกอบรมมากกว่า 70,000 ตัวอย่าง สิ่งเหล่านี้ถูกจัดเก็บไว้พร้อมกับส่วนขยาย .full.npz
ไฟล์ .npz จำนวนมาก
หมายเหตุ: สำหรับ Python3 ให้โหลดไฟล์ npz
โดยใช้ np.load(data_filepath, encoding='latin1', allow_pickle=True)
คำแนะนำสำหรับการแปลงไฟล์ Raw ndjson
เป็นรูปแบบ npz
มีอยู่ในสมุดบันทึกนี้
ต่อไปนี้คือโปรเจ็กต์และการทดลองบางส่วนที่ใช้หรือนำเสนอชุดข้อมูลในรูปแบบที่น่าสนใจ มีอะไรจะเพิ่มไหม? แจ้งให้เราทราบ!
โครงการสร้างสรรค์และศิลปะ
ภาพตัดปะจดหมายโดย Deborah Schmidt
การทดลองการติดตามใบหน้าโดย นีล เมนโดซา
ใบหน้าของมนุษยชาติโดย Tortue
QuickDraw ที่ไม่มีที่สิ้นสุดโดย kynd.info
Misfire.io โดย แมทธิว คอลลีเยอร์
วาดสิ่งนี้โดย Dan Macnish
สุนทรพจน์การเขียนลวก ๆ โดย Xinyue Yang
ภาพประกอบโดย Ling Chen
ฝันถึงแกะไฟฟ้า โดย ดร.เออร์เนสโต ดิแอซ-อาวิเลส
การวิเคราะห์ข้อมูล
คุณจะวาดวงกลมได้อย่างไร? โดยควอตซ์
ฟอร์มา ฟลูเอนส์ โดย เมาโร มาร์ติโน, เฮนดริก สโตรเบลต์ และโอเว่น คอร์เนค
ใช้เวลานานแค่ไหนในการวาดสุนัข (ด่วน)? โดย จิม วัลแลนดิงแฮม
ค้นหาภาพวาดนกฟลามิงโกที่ไม่ดีด้วยโครงข่ายประสาทเทียมโดย Colin Morris
Facets Dive x ด่วน วาด! โดย People + AI Research Initiative (PAIR), Google
การสำรวจและแสดงภาพชุดข้อมูลแบบเปิดทั่วโลกโดย Google Research
การเรียนรู้ของเครื่องเพื่อการแสดงภาพ - พูดคุย / บทความโดย Ian Johnson
เอกสาร
การแสดงภาพร่างด้วยระบบประสาทโดย David Ha, Douglas Eck, ICLR 2018 รหัส
Sketchmate: การแฮชแบบลึกสำหรับการดึงภาพร่างมนุษย์ล้านระดับโดย Peng Xu และคณะ, CVPR 2018
หม้อแปลงหลายกราฟสำหรับการรู้จำภาพร่างด้วยมือเปล่าโดย Peng Xu, Chaitanya K Joshi, Xavier Bresson, ArXiv 2019 รหัส
การเรียนรู้การเป็นตัวแทนภายใต้การดูแลตนเองเชิงลึกสำหรับภาพร่างด้วยมือเปล่าโดย Peng Xu et al., ArXiv 2020 รหัส
SketchTransfer: งานใหม่ที่ท้าทายสำหรับการสำรวจรายละเอียด-ความไม่แปรผันและนามธรรมที่เรียนรู้โดย Deep Networks โดย Alex Lamb, Sherjil Ozair, Vikas Verma, David Ha, WACV 2020
การเรียนรู้เชิงลึกสำหรับภาพร่างด้วยมือเปล่า: แบบสำรวจโดย Peng Xu, ArXiv 2020
โมเดลการจดจำร่างนวนิยายที่อิงตามโครงข่ายประสาทเทียมแบบ Convolutional โดย Abdullah Talha Kabakus การประชุมนานาชาติครั้งที่ 2 ว่าด้วยปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ การเพิ่มประสิทธิภาพและแอปพลิเคชันหุ่นยนต์ หน้า 101-106 2020
คำแนะนำและบทช่วยสอน
บทช่วยสอน TensorFlow สำหรับการจำแนกประเภทการวาดภาพ
ฝึกฝนโมเดลใน tf.keras ด้วย Colab และรันในเบราว์เซอร์ด้วย TensorFlow.js โดย Zaid Alyafeai
รหัสและเครื่องมือ
เร็วเข้า วาด! ส่วนประกอบโพลีเมอร์และข้อมูล API โดย Nick Jonas
ด่วน วาดเพื่อการประมวลผล โดย Cody Ben Lewis
เร็วเข้า วาด! แบบจำลองการทำนายโดย Keisuke Irie
เครื่องมือสุ่มตัวอย่างโดย Learning Statistics นั้นยอดเยี่ยมมาก
การเรนเดอร์ SVG ในตัวอย่าง d3.js โดย Ian Johnson (อ่านเพิ่มเติมเกี่ยวกับกระบวนการที่นี่)
การจำแนกประเภท Sketch-RNN โดย Payal Bajaj
Quickdraw.js โดย โทมัส วาเกนนาร์
~ Doodler ~ โดยกฤษณะศรีโซมปาลลี
Quickdraw Python API โดย Martin O'Hanlon
QuickDraw แบบเรียลไทม์โดย Akshay Bahadur
การประมวลผล DataFlow โดย Guillem Xercavins
ปลั๊กอิน QuickDrawGH Rhino โดย James Dalessandro
QuickDrawBattle โดย Andri Soone
25 พฤษภาคม 2017: อัปเดตชุดข้อมูล Sketch-RNN QuickDraw สร้างชุดเสริม . .full.npz
ข้อมูลนี้จัดทำโดย Google, Inc. ภายใต้ใบอนุญาต Creative Commons Attribution 4.0 International
ตารางต่อไปนี้จำเป็นสำหรับชุดข้อมูลนี้ที่จะต้องจัดทำดัชนีโดยเครื่องมือค้นหา เช่น Google Dataset Search
คุณสมบัติ | ค่า | ||||||
---|---|---|---|---|---|---|---|
ชื่อ | The Quick, Draw! Dataset | ||||||
ชื่อสำรอง | Quick Draw Dataset | ||||||
ชื่อสำรอง | quickdraw-dataset | ||||||
URL | https://github.com/googlecreativelab/quickdraw-dataset | ||||||
เหมือนกัน | https://github.com/googlecreativelab/quickdraw-dataset | ||||||
คำอธิบาย | The Quick Draw Dataset is a collection of 50 million drawings across 345 categories, contributed by players of the game "Quick, Draw!". The drawings were captured as timestamped vectors, tagged with metadata including what the player was asked to draw and in which country the player was located.n n Example drawings: ![preview](https://raw.githubusercontent.com/googlecreativelab/quickdraw-dataset/master/preview.jpg) | ||||||
ผู้ให้บริการ |
| ||||||
ใบอนุญาต |
|