尽管今年世界上发生了一切,我们仍然有机会看到许多令人惊叹的研究成果。尤其是在人工智能领域,更准确地说是计算机视觉领域。此外,今年还强调了许多重要方面,例如道德方面、重要偏见等等。人工智能以及我们对人脑及其与人工智能的联系的理解正在不断发展,在不久的将来展现出有前景的应用,我一定会介绍这些应用。
以下是我今年计算机视觉领域最有趣的 10 篇研究论文,以防您错过其中任何一篇。简而言之,它基本上是人工智能和计算机视觉领域最新突破的精选列表,并带有清晰的视频解释、更深入的文章链接和代码(如果适用)。祝您阅读愉快,如果我错过了评论中的任何重要论文,请告诉我,或者直接在 LinkedIn 上与我联系!
本存储库的末尾列出了每篇论文的完整参考文献。
维护者 - louisfb01
请随时通过 [email protected] 向我发送任何我错过添加到此存储库的优秀论文
如果您分享该列表,请在 Twitter @Whats_AI 或 LinkedIn @Louis (What's AI) Bouchard 上标记我!
按发布日期列出的人工智能最新突破的精选列表,并附有清晰的视频说明、更深入的文章链接和代码。
2020:充满令人惊叹的人工智能论文的一年——回顾
您有没有想过如果没有水,海洋会是什么样子?去掉水下图片的蓝绿色调,仍然保留珊瑚礁的真实颜色?好吧,使用计算机视觉和机器学习算法,海法大学的研究人员能够实现这一目标!
奥地利 IST 和麻省理工学院的研究人员利用基于线虫等微小动物大脑的新型人工智能系统,成功训练了一辆自动驾驶汽车。与 Inception、Resnet 或 VGG 等流行的深度神经网络所需的数百万个神经元相比,他们仅用几个神经元就能控制自动驾驶汽车。他们的网络仅使用由 19 个控制神经元组成的 75,000 个参数(而不是数百万个参数)就能完全控制汽车!
这种新方法能够生成完整的3维场景,并具有决定场景照明的能力。与以前的方法相比,所有这些都具有非常有限的计算成本和惊人的结果。
第 4 个版本最近由 Alexey Bochkovsky 等人于 2020 年 4 月推出。在论文“YOLOv4:目标检测的最佳速度和准确性”中。该算法的主要目标是制作一个具有高质量精度的超快速物体检测器。
这种新算法将模糊图像转换为高分辨率图像!它可以拍摄超低分辨率的16x16图像并将其变成1080p高清人脸!你不相信我吗?然后你就可以像我一样,在不到一分钟的时间内亲自尝试一下!但首先,让我们看看他们是如何做到的。
一个好的人工智能,比如 Gmail 中使用的人工智能,可以生成连贯的文本并完成你的短语。这个使用相同的原理来完成图像!所有这些都是在无人监督的训练中完成的,根本不需要标签!
现在,您可以使用这种新的图像到图像转换技术,以零绘图技能从粗糙甚至不完整的草图生成高质量的面部图像!如果你的绘画技巧和我一样差,你甚至可以调整眼睛、嘴巴和鼻子对最终图像的影响程度!让我们看看它是否真的有效以及他们是如何做到的。
该 AI 可根据 2D 图像生成人物的 3D 高分辨率重建!它只需要您的一张图像就可以生成一个看起来就像您一样的 3D 头像,甚至从背面看也是如此!
ECCV 2020 最佳论文奖授予普林斯顿团队。他们开发了一种新的端到端可训练光流模型。他们的方法在多个数据集上击败了最先进的架构的准确性,并且效率更高。他们甚至在 Github 上向所有人提供了代码!
这种人工智能可以填充移除的移动物体后面的缺失像素,并以比当前最先进的方法更高的准确性和更少的模糊度重建整个视频!
想象一下,您的祖母 18 岁时的旧的、折叠的、甚至撕破的照片都是高清的,而且零伪影。这称为旧照片修复,本文刚刚开辟了一条利用深度学习方法解决此问题的全新途径。
人体抠图是一项非常有趣的任务,其目标是找到图片中的任何人并从中删除背景。由于任务的复杂性,必须找到具有完美轮廓的一个或多个人,这确实很难实现。在这篇文章中,我回顾了多年来使用的最佳技术以及 2020 年 11 月 29 日发布的一种新颖方法。许多技术都使用基本的计算机视觉算法来实现此任务,例如 GrabCut 算法,它非常快,但不是非常精确。
DeOldify 是一种对旧黑白图像甚至电影片段进行着色和恢复的技术。它是由 Jason Antic 一人开发并仍在更新。它现在是对黑白图像进行着色的最先进的方法,并且所有内容都是开源的,但我们稍后会再讨论这一点。
如果您分享该列表,请在 Twitter @Whats_AI 或 LinkedIn @Louis (What's AI) Bouchard 上标记我!
[1] Akkaynak、Derya 和 Treibitz、Tali。 (2019)。 Sea-Thru:一种从水下图像中去除水的方法。 1682–1691。 10.1109/CVPR.2019.00178。
[2] Lechner, M.、Hasani, R.、Amini, A. 等人。神经回路策略实现可审计的自主性。纳特·马赫情报 2, 642–652 (2020)。 https://doi.org/10.1038/s42256-020-00237-3
[3] PP Srinivasan、B. Deng、X. Zhu、M. Tancik、B. Mildenhall 和 JT Barron,“Nerv:用于重新照明和视图合成的神经反射率和可见性场”,arXiv,2020 年。
[4] A. Bochkovskiy,C.-Y。 Wang 和 H.-YM Liao,Yolov4:目标检测的最佳速度和准确性,2020。arXiv:2004.10934 [cs.CV]。
[5] S. Menon、A. Damian、S. Hu、N. Ravi 和 C. Rudin,Pulse:通过生成模型的潜在空间探索进行自监督照片上采样,2020。arXiv:2003.03808 [cs.CV]。
[6] M. Chen、A. Radford、R. Child、J. Wu、H. Jun、D. Luan 和 I. Sutskever,“像素生成预训练”,第 37 届国际机器学习会议论文集, HD III 和 A. Singh,编辑,序列号。机器学习研究论文集,卷。 119,虚拟:PMLR,2020 年 7 月 13-18 日,第 1691-1703 页。 [在线的]。
[7]S.-Y。 Chen、W. Su、L. Gau、S. Xia 和 H. Fu,“DeepFaceDrawing:从草图深度生成人脸图像”,ACM Transactions on Graphics(ACM SIGGRAPH2020 论文集),卷。 39,没有。 2020 年 4 月 72 日:1–72:16。可查阅:http://proceedings.mlr.press/v119/chen20s.html。
[8] S. Saito、T. Simon、J. Saragih 和 H. Joo、Pifuhd:用于高分辨率 3D 人体数字化的多级像素对齐隐式函数,2020。arXiv:2004.00452 [cs.CV]。
[9] Z. Teed 和 J. Deng,Raft:光流的循环全对场变换,2020。arXiv:2003.12039 [cs.CV]。
[10] Y. Zeng、J. Fu 和 H. Chao,学习视频修复的联合时空变换,2020。arXiv:2007.10247 [cs.CV]。
[奖励 1] Z. Wan、B. Zhang、D. Chen、P. Zhu、D. Chen、J. Liao 和 F. Wen,通过深层潜在空间翻译修复旧照片,2020。arXiv:2009.07047 [cs。简历]。
【附赠2】Z. Ke、K. Li、Y. Zhou、Q. Wu、X. Mao、Q. Yan、RW Lau,“实时人像抠图真的需要绿幕吗?” ArXiv,卷。绝对/2011.11961,2020。
[奖励 3]Jason Antic,DeOldify 的创建者,https://github.com/jantic/DeOldify