แม้จะมีทุกสิ่งที่เกิดขึ้นในโลกในปีนี้ เรายังมีโอกาสเห็นงานวิจัยที่น่าทึ่งมากมายออกมา โดยเฉพาะในด้านปัญญาประดิษฐ์และการมองเห็นคอมพิวเตอร์ที่แม่นยำยิ่งขึ้น นอกจากนี้ ในปีนี้ยังมีประเด็นสำคัญหลายประเด็นที่ได้รับการเน้นย้ำ เช่น ด้านจริยธรรม อคติที่สำคัญ และอื่นๆ อีกมากมาย ปัญญาประดิษฐ์และความเข้าใจของเราเกี่ยวกับสมองมนุษย์ และความเชื่อมโยงกับ AI มีการพัฒนาอย่างต่อเนื่อง ซึ่งแสดงให้เห็นการใช้งานที่น่าหวังในอนาคตอันใกล้นี้ ซึ่งฉันจะกล่าวถึงอย่างแน่นอน
นี่คืองานวิจัย 10 อันดับแรกของฉันที่น่าสนใจที่สุดแห่งปีในด้านคอมพิวเตอร์วิทัศน์ ในกรณีที่คุณพลาดบทความใดไป โดยพื้นฐานแล้ว มันเป็นรายการความก้าวหน้าล่าสุดใน AI และ CV ที่คัดสรรมาอย่างดี พร้อมด้วยคำอธิบายวิดีโอที่ชัดเจน ลิงก์ไปยังบทความเชิงลึกเพิ่มเติม และโค้ด (ถ้ามี) ขอให้สนุกกับการอ่าน และแจ้งให้เราทราบหากฉันพลาดเอกสารสำคัญใดๆ ในความคิดเห็น หรือติดต่อฉันโดยตรงบน LinkedIn!
การอ้างอิงฉบับสมบูรณ์ของรายงานแต่ละฉบับจะแสดงอยู่ที่ส่วนท้ายของที่เก็บข้อมูลนี้
ผู้ดูแล - louisfb01
โปรดส่งข้อความถึงฉันเกี่ยวกับเอกสารดีๆ ที่ฉันพลาดที่จะเพิ่มลงในพื้นที่เก็บข้อมูลนี้ที่ [email protected]
แท็กฉันบน Twitter @Whats_AI หรือ LinkedIn @Louis (AI คืออะไร) Bouchard หากคุณแบ่งปันรายชื่อ!
รายการที่รวบรวมความก้าวหน้าล่าสุดใน AI ตามวันที่เผยแพร่พร้อมคำอธิบายวิดีโอที่ชัดเจน ลิงก์ไปยังบทความเชิงลึกเพิ่มเติม และโค้ด
2020: หนึ่งปีที่เต็มไปด้วยเอกสาร AI ที่น่าทึ่ง - บทวิจารณ์
คุณเคยสงสัยหรือไม่ว่ามหาสมุทรจะเป็นอย่างไรหากไม่มีน้ำ ลบภาพใต้น้ำที่เป็นโทนสีฟ้าเขียวออกและยังคงมีสีสันที่แท้จริงของแนวปะการังอยู่ การใช้คอมพิวเตอร์วิทัศน์และอัลกอริธึมการเรียนรู้ของเครื่องจักร นักวิจัยจากมหาวิทยาลัย Haifa สามารถบรรลุผลสำเร็จได้อย่างแน่นอน!
นักวิจัยจาก IST ออสเตรีย และ MIT ประสบความสำเร็จในการฝึกรถยนต์ไร้คนขับโดยใช้ระบบปัญญาประดิษฐ์ใหม่ที่ใช้สมองของสัตว์ตัวเล็กๆ เช่น พยาธิเส้นด้าย พวกเขาบรรลุเป้าหมายดังกล่าวด้วยเซลล์ประสาทเพียงไม่กี่ตัวที่สามารถควบคุมรถยนต์ที่ขับเคลื่อนด้วยตนเองได้ เมื่อเทียบกับเซลล์ประสาทนับล้านที่ต้องการโดยเครือข่ายประสาทเชิงลึกยอดนิยม เช่น Inceptions, Resnets หรือ VGG เครือข่ายของพวกเขาสามารถควบคุมรถยนต์ได้อย่างสมบูรณ์โดยใช้พารามิเตอร์เพียง 75,000 ตัว ซึ่งประกอบด้วยเซลล์ประสาทควบคุม 19 ตัว แทนที่จะเป็นล้าน!
วิธีการใหม่นี้สามารถสร้างฉาก 3 มิติที่สมบูรณ์และมีความสามารถในการกำหนดแสงของฉากได้ ทั้งหมดนี้มีค่าใช้จ่ายในการคำนวณที่จำกัดมากและผลลัพธ์ที่น่าทึ่งเมื่อเทียบกับแนวทางก่อนหน้านี้
เวอร์ชันที่ 4 นี้เพิ่งเปิดตัวในเดือนเมษายน 2020 โดย Alexey Bochkovsky และคณะ ในบทความ "YOLOv4: ความเร็วที่เหมาะสมและความแม่นยำของการตรวจจับวัตถุ" เป้าหมายหลักของอัลกอริธึมนี้คือการสร้างเครื่องตรวจจับวัตถุที่รวดเร็วเป็นพิเศษและมีคุณภาพสูงในแง่ของความแม่นยำ
อัลกอริธึมใหม่นี้แปลงภาพที่พร่ามัวให้เป็นภาพที่มีความละเอียดสูง! มันสามารถถ่ายภาพความละเอียดต่ำสุด 16x16 แล้วแปลงเป็นใบหน้ามนุษย์ที่มีความคมชัดสูง 1080p! คุณไม่เชื่อฉันเหรอ? ถ้าอย่างนั้นคุณก็ทำแบบเดียวกับฉันได้และลองด้วยตัวเองภายในเวลาไม่ถึงนาที! แต่ก่อนอื่นเรามาดูกันว่าพวกเขาทำสิ่งนั้นได้อย่างไร
AI ที่ดี เช่นเดียวกับที่ใช้ใน Gmail สามารถสร้างข้อความที่สอดคล้องกันและจบวลีของคุณได้ อันนี้ใช้หลักการเดียวกันเพื่อทำให้ภาพสมบูรณ์! ทั้งหมดนี้เสร็จสิ้นในการฝึกอบรมแบบไม่มีผู้ดูแลและไม่จำเป็นต้องมีป้ายกำกับเลย!
ตอนนี้คุณสามารถสร้างภาพใบหน้าคุณภาพสูงจากการร่างแบบหยาบหรือแบบร่างที่ไม่สมบูรณ์โดยไม่ต้องมีทักษะการวาดภาพเลยโดยใช้เทคนิคการแปลภาพเป็นภาพใหม่นี้! หากทักษะการวาดภาพของคุณแย่พอๆ กับของฉัน คุณสามารถปรับได้ว่าดวงตา ปาก และจมูกจะส่งผลต่อภาพสุดท้ายมากน้อยเพียงใด! เรามาดูกันว่ามันใช้งานได้จริงหรือไม่และพวกเขาทำได้อย่างไร
AI นี้สร้างแบบจำลองความละเอียดสูงแบบ 3 มิติของผู้คนจากภาพ 2 มิติ! ต้องการเพียงภาพเดียวของคุณเพื่อสร้างอวตาร 3 มิติที่ดูเหมือนคุณ แม้ว่าจะมองจากด้านหลังก็ตาม!
รางวัล ECCV 2020 Best Paper Award ตกเป็นของทีม Princeton พวกเขาได้พัฒนาโมเดลที่สามารถฝึกได้ตั้งแต่ต้นทางถึงปลายทางใหม่สำหรับการไหลแบบออปติก วิธีการของพวกเขาเหนือกว่าความแม่นยำของสถาปัตยกรรมล้ำสมัยในชุดข้อมูลหลายชุดและมีประสิทธิภาพมากกว่ามาก พวกเขายังทำให้โค้ดนี้พร้อมใช้งานสำหรับทุกคนบน Github อีกด้วย!
AI นี้สามารถเติมเต็มพิกเซลที่หายไปด้านหลังวัตถุที่กำลังเคลื่อนที่ที่ถูกลบออกไป และสร้างวิดีโอทั้งหมดขึ้นมาใหม่ด้วยความแม่นยำและความเบลอที่น้อยกว่าแนวทางที่ล้ำสมัยในปัจจุบัน!
ลองนึกภาพการมีภาพเก่าๆ ที่ถูกพับไว้ และแม้กระทั่งภาพที่ฉีกขาดของคุณยายของคุณตอนที่เธออายุ 18 ปี ในรูปแบบความละเอียดสูงโดยไม่มีส่วนใดๆ เลย สิ่งนี้เรียกว่าการฟื้นฟูภาพถ่ายเก่า และบทความนี้เพิ่งเปิดช่องทางใหม่เพื่อแก้ไขปัญหานี้โดยใช้แนวทางการเรียนรู้เชิงลึก
การปูเสื่อโดยมนุษย์เป็นงานที่น่าสนใจอย่างยิ่ง โดยมีเป้าหมายเพื่อค้นหามนุษย์ในภาพและลบพื้นหลังออกจากภาพ เป็นเรื่องยากที่จะบรรลุผลสำเร็จเนื่องจากความซับซ้อนของงาน โดยต้องหาบุคคลหรือผู้ที่มีรูปทรงที่สมบูรณ์แบบ ในโพสต์นี้ ฉันทบทวนเทคนิคที่ดีที่สุดที่ใช้ในช่วงหลายปีที่ผ่านมาและวิธีการใหม่ที่เผยแพร่เมื่อวันที่ 29 พฤศจิกายน 2020 เทคนิคหลายอย่างกำลังใช้อัลกอริธึมการมองเห็นคอมพิวเตอร์ขั้นพื้นฐานเพื่อให้บรรลุภารกิจนี้ เช่น อัลกอริธึม GrabCut ซึ่งเร็วมาก แต่ไม่ใช่ แม่นยำมาก
DeOldify เป็นเทคนิคในการปรับสีและฟื้นฟูภาพขาวดำเก่าๆ หรือแม้แต่ฟุตเทจภาพยนตร์ ได้รับการพัฒนาและยังคงได้รับการอัปเดตโดย Jason Antic เพียงคนเดียว ขณะนี้เป็นวิธีที่ทันสมัยในการปรับสีภาพขาวดำ และทุกอย่างเป็นแบบโอเพ่นซอร์ส แต่เราจะกลับมาพูดถึงเรื่องนี้ในอีกสักครู่
แท็กฉันบน Twitter @Whats_AI หรือ LinkedIn @Louis (AI คืออะไร) Bouchard หากคุณแบ่งปันรายชื่อ!
[1] อัคคายนัก, เดอร์ยา และ ไทรบิตซ์, ทาลี (2019) Sea-Thru: วิธีการกำจัดน้ำออกจากภาพใต้น้ำ ค.ศ. 1682–1691. 10.1109/CVPR.2019.00178.
(2) Lechner, M., Hasani, R., Amini, A. และคณะ นโยบายวงจรประสาทช่วยให้สามารถตรวจสอบได้อิสระ แนท มัค อินเทล 2, 642–652 (2020) https://doi.org/10.1038/s42256-020-00237-3
(3) PP Srinivasan, B. Deng, X. Zhang, M. Tancik, B. Mildenhall และ JT Barron, "เส้นประสาท: ช่องการสะท้อนแสงและการมองเห็นของระบบประสาทสำหรับการปรับแสงใหม่และการสังเคราะห์มุมมอง" ใน arXiv, 2020
[4] เอ. โบชคอฟสกี, ซี.-วาย. Wang และ H.-YM Liao, Yolov4: ความเร็วและความแม่นยำที่เหมาะสมที่สุดของการตรวจจับวัตถุ 2020 arXiv:2004.10934 [cs.CV]
[5] S. Menon, A. Damian, S. Hu, N. Ravi และ C. Rudin, Pulse: การอัปแซมปลิงภาพถ่ายที่ดูแลด้วยตนเองผ่านการสำรวจอวกาศแฝงของแบบจำลองกำเนิด ปี 2020 arXiv:2003.03808 [cs.CV]
[6] M. Chen, A. Radford, R. Child, J. Wu, H. Jun, D. Luan และ I. Sutskever, "การฝึกอบรมเบื้องต้นจากพิกเซล" ในการประชุมนานาชาติเรื่องการเรียนรู้ของเครื่องครั้งที่ 37 HD III และ A. Singh, Eds., ser. การดำเนินการวิจัยการเรียนรู้ของเครื่อง ฉบับที่ 119, เสมือน: PMLR, 13–18 ก.ค. 2020, หน้า 1691–1703 [ออนไลน์].
[7] ส.-ย. Chen, W. Su, L. Gao, S. Xia และ H. Fu, "DeepFace Drawing: การสร้างภาพใบหน้าเชิงลึกจากภาพร่าง" ธุรกรรม ACM บนกราฟิก (การดำเนินการของ ACM SIGGRAPH2020), เล่ม 1 39, ไม่ใช่. 4, 72:1–72:16, 2020. พร้อมใช้งาน:http://proceedings.mlr.press/v119/chen20s.html
[8] S. Saito, T. Simon, J. Saragih และ H. Joo, Pifuhd: ฟังก์ชันโดยนัยที่จัดพิกเซลหลายระดับสำหรับการแปลงเป็นดิจิทัลของมนุษย์แบบ 3 มิติที่มีความละเอียดสูง ปี 2020 arXiv:2004.00452 [cs.CV]
[9] Z. Teed และ J. Deng, Raft: การแปลงฟิลด์ทุกคู่ที่เกิดซ้ำสำหรับการไหลของแสง, 2020 arXiv:2003.12039 [cs.CV]
[10] Y. Zeng, J. Fu และ H. Chao, การเรียนรู้การเปลี่ยนแปลงเชิงพื้นที่-ชั่วขณะร่วมกันสำหรับการวาดภาพในวิดีโอ, 2020 arXiv:2007.10247 [cs.CV]
[โบนัส 1] Z. Wan, B. Zhang, D. Chen, P. Zhang, D. Chen, J. Liao และ F. Wen การฟื้นฟูภาพถ่ายเก่าผ่านการแปลห้วงอวกาศลึก 2020 arXiv:2009.07047 [cs. ประวัติย่อ]
[โบนัส 2] Z. Ke, K. Li, Y. Zhou, Q. Wu, X. Mao, Q. Yan และ RW Lau "หน้าจอสีเขียวจำเป็นจริงๆ สำหรับการจัดวางแนวตั้งแบบเรียลไทม์หรือไม่" ArXiv ฉบับที่ เอบีเอส/2011.11961, 2020.
[โบนัส 3] Jason Antic ผู้สร้าง DeOldify, https://github.com/jantic/DeOldify