儘管今年世界上發生了一切,我們仍然有機會看到許多令人驚嘆的研究成果。尤其是在人工智慧領域,更準確地說是電腦視覺領域。此外,今年也強調了許多重要方面,例如道德方面、重要偏見等等。人工智慧以及我們對人腦及其與人工智慧的連結的理解正在不斷發展,在不久的將來展現出有前景的應用,我一定會介紹這些應用。
以下是我今年電腦視覺領域最有趣的 10 篇研究論文,以防您錯過其中任何一篇。簡而言之,它基本上是人工智慧和電腦視覺領域最新突破的精選列表,並帶有清晰的視頻解釋、更深入的文章連結和程式碼(如果適用)。祝您閱讀愉快,如果我錯過了評論中的任何重要論文,請告訴我,或直接在 LinkedIn 上與我聯繫!
本存儲庫的末尾列出了每篇論文的完整參考文獻。
維護者 - louisfb01
請隨時透過 [email protected] 向我發送任何我錯過添加到此存儲庫的優秀論文
如果您分享該列表,請在 Twitter @Whats_AI 或 LinkedIn @Louis (What's AI) Bouchard 上標記我!
按發布日期列出的人工智慧最新突破的精選列表,並附有清晰的影片說明、更深入的文章連結和程式碼。
2020:充滿令人驚嘆的人工智慧論文的一年——回顧
您有沒有想過如果沒有水,海洋會是什麼樣子?好吧,使用電腦視覺和機器學習演算法,海法大學的研究人員能夠實現這一目標!
奧地利 IST 和麻省理工學院的研究人員利用基於線蟲等微小動物大腦的新型人工智慧系統,成功訓練了一輛自動駕駛汽車。與 Inception、Resnet 或 VGG 等流行的深度神經網路所需的數百萬個神經元相比,他們只用幾個神經元就能控制自動駕駛汽車。他們的網路僅使用由 19 個控制神經元組成的 75,000 個參數(而不是數百萬個參數)就能完全控制汽車!
這種新方法能夠產生完整的3維場景,並具有決定場景照明的能力。與以前的方法相比,所有這些都具有非常有限的計算成本和驚人的結果。
第 4 個版本最近由 Alexey Bochkovsky 等人於 2020 年 4 月推出。在論文“YOLOv4:目標檢測的最佳速度和準確性”中。該演算法的主要目標是製作一個具有高品質精度的超快速物體偵測器。
這種新演算法將模糊影像轉換為高解析度影像!它可以拍攝超低解析度的16x16影像並將其變成1080p高清人臉!你不相信我嗎?然後你就可以像我一樣,在不到一分鐘的時間內親自嘗試!但首先,讓我們看看他們是如何做到的。
一個好的人工智慧,例如 Gmail 中使用的人工智慧,可以產生連貫的文字並完成你的短語。這個使用相同的原理來完成圖像!所有這些都是在無人監督的訓練中完成的,根本不需要標籤!
現在,您可以使用這種新的圖像到圖像轉換技術,以零繪圖技能從粗糙甚至不完整的草圖生成高品質的臉部圖像!如果你的繪畫技巧和我一樣差,你甚至可以調整眼睛、嘴巴和鼻子對最終影像的影響程度!讓我們看看它是否真的有效以及他們是如何做到的。
該 AI 可根據 2D 影像生成人物的 3D 高解析度重建!它只需要您的一張圖像就可以產生一個看起來就像您一樣的 3D 頭像,甚至從背面看也是如此!
ECCV 2020 最佳論文獎頒給普林斯頓團隊。他們開發了一種新的端到端可訓練光流模型。他們的方法在多個資料集上擊敗了最先進的架構的準確性,並且效率更高。他們甚至在 Github 上向所有人提供了代碼!
這種人工智慧可以填充移除的移動物體後面的缺失像素,並以比目前最先進的方法更高的準確性和更少的模糊度重建整個影片!
想像一下,您的祖母 18 歲時的舊的、折疊的、甚至撕破的照片都是高清的,而且零偽影。這稱為舊照片修復,本文剛剛開闢了一條利用深度學習方法解決此問題的全新途徑。
人體摳圖是一項非常有趣的任務,目標是找到圖片中的任何人並從中刪除背景。由於任務的複雜性,必須找到具有完美輪廓的一個或多個人,這確實很難實現。在這篇文章中,我回顧了多年來使用的最佳技術以及2020 年11 月29 日發布的一種新穎方法。快,但不是非常精確。
DeOldify 是一種對舊黑白影像甚至電影片段進行著色和恢復的技術。它是由 Jason Antic 一人開發並仍在更新。現在它是對黑白圖像進行著色的最先進的方法,並且所有內容都是開源的,但我們稍後會再討論這一點。
如果您分享該列表,請在 Twitter @Whats_AI 或 LinkedIn @Louis (What's AI) Bouchard 上標記我!
[1] Akkaynak、Derya 和 Treibitz、Tali。 (2019)。 Sea-Thru:一種從水下影像中去除水的方法。 1682–1691。 10.1109/CVPR.2019.00178。
[2] Lechner, M.、Hasani, R.、Amini, A. 等人。神經迴路策略實現可審計的自主性。納特·馬赫情報 2, 642–652 (2020)。 https://doi.org/10.1038/s42256-020-00237-3
[3] PP Srinivasan、B. Deng、X. Zhu、M. Tancik、B. Mildenhall 和 JT Barron,“Nerv:用於重新照明和視圖合成的神經反射率和可見性場”,arXiv,2020 年。
[4] A. Bochkovskiy,C.-Y。 Wang 和 H.-YM Liao,Yolov4:目標偵測的最佳速度和準確性,2020。
[5] S. Menon、A. Damian、S. Hu、N. Ravi 和 C. Rudin,Pulse:透過生成模型的潛在空間探索進行自監督照片上採樣,2020。
[6] M. Chen、A. Radford、R. Child、J. Wu、H. Jun、D. Luan 和 I. Sutskever,“像素生成預訓練”,第 37 屆國際機器學習會議論文集, HD III和A. Singh,編輯,序號。機器學習研究論文集,卷。 119,虛擬:PMLR,2020 年 7 月 13-18 日,第 1691-1703 頁。 [線上的]。
[7]S.-Y。 Chen、W. Su、L. Gau、S. Xia 和 H. Fu,“DeepFaceDrawing:從草圖深度生成人臉圖像”,ACM Transactions on Graphics(ACM SIGGRAPH2020 論文集),卷。 39,沒有。 2020 年 4 月 72 日:1–72:16。
[8] S. Saito、T. Simon、J. Saragih 和 H. Joo、Pifuhd:用於高分辨率 3D 人體數位化的多層像素對齊隱式函數,2020。
[9] Z. Teed 和 J. Deng,Raft:光流的循環全對場變換,2020。
[10] Y. Zeng、J. Fu 和 H. Chao,學習視訊修復的聯合時空變換,2020。
[獎勵 1] Z. Wan、B. Zhang、D. Chen、P. Zhu、D. Chen、J. Liao 和 F. Wen,透過深層潛在空間翻譯修復舊照片,2020。 ]。
【附贈2】Z. Ke、K. Li、Y. Zhou、Q. Wu、X. Mao、Q. Yan、RW Lau,“實時人像摳圖真的需要綠幕嗎?” ArXiv,卷。絕對/2011.11961,2020。
[獎勵 3]Jason Antic,DeOldify 的創建者,https://github.com/jantic/DeOldify