올해 세계에서 일어난 모든 일에도 불구하고 우리는 여전히 놀라운 연구가 많이 나오는 것을 볼 기회를 가졌습니다. 특히 인공지능, 더 정확하게는 컴퓨터 비전 분야에서요. 올해에는 윤리적 측면, 중요한 편견 등과 같은 많은 중요한 측면이 강조되었습니다. 인공 지능과 인간 두뇌에 대한 우리의 이해 및 AI와의 연관성은 지속적으로 발전하고 있으며 머지않아 유망한 응용 분야를 보여주고 있습니다. 이에 대해서는 제가 확실히 다루겠습니다.
컴퓨터 비전 분야에서 올해 가장 흥미로운 연구 논문 상위 10개를 놓친 경우를 대비해 여기 있습니다. 간단히 말해서 이는 기본적으로 명확한 비디오 설명, 보다 심층적인 기사에 대한 링크 및 코드(해당되는 경우)가 포함된 AI 및 CV의 최신 혁신에 대한 선별된 목록입니다. 재미있게 읽어 보시고, 중요한 문서를 놓친 경우 댓글로 알려주시거나 LinkedIn에서 직접 연락해 주세요!
각 논문에 대한 전체 참고자료는 이 저장소의 끝에 나열되어 있습니다.
유지관리자 - louisfb01
이 저장소에 추가하고 싶지 않은 훌륭한 논문이 있으면 [email protected]으로 나에게 메시지를 보내주세요.
목록을 공유하려면 Twitter @Whats_AI 또는 LinkedIn @Louis(What's AI) Bouchard에 저를 태그해 주세요!
명확한 비디오 설명, 보다 심층적인 기사에 대한 링크 및 코드와 함께 출시 날짜별로 AI의 최신 혁신을 선별한 목록입니다.
2020년: 놀라운 AI 논문으로 가득한 한 해 - 리뷰
물이 없으면 바다가 어떤 모습일지 궁금해 본 적이 있나요? 수중 사진의 청록색 색조를 제거해도 여전히 산호초의 실제 색상을 그대로 유지하고 있나요? 글쎄, 하이파 대학의 연구원들은 컴퓨터 비전과 기계 학습 알고리즘을 사용하여 정확히 그것을 달성할 수 있었습니다!
IST 오스트리아와 MIT의 연구원들은 실벌레와 같은 작은 동물의 뇌를 기반으로 한 새로운 인공 지능 시스템을 사용하여 자율 주행 자동차를 훈련시키는 데 성공했습니다. 그들은 Inceptions, Resnets 또는 VGG와 같은 인기 있는 심층 신경망에 필요한 수백만 개의 뉴런에 비해 단 몇 개의 뉴런만으로 자율주행차를 제어할 수 있는 것을 달성했습니다. 그들의 네트워크는 수백만 개가 아닌 19개의 제어 뉴런으로 구성된 75,000개의 매개변수만을 사용하여 자동차를 완벽하게 제어할 수 있었습니다!
이 새로운 방법은 완전한 3차원 장면을 생성할 수 있으며 장면의 조명을 결정할 수 있는 기능을 갖추고 있습니다. 이전 접근 방식에 비해 매우 제한된 계산 비용과 놀라운 결과로 이 모든 작업을 수행할 수 있습니다.
이 4번째 버전은 최근 Alexey Bochkovsky et al.에 의해 2020년 4월에 소개되었습니다. "YOLOv4: 최적의 속도 및 객체 감지 정확도" 논문에서. 이 알고리즘의 주요 목표는 정확성 측면에서 고품질의 초고속 물체 감지기를 만드는 것이었습니다.
이 새로운 알고리즘은 흐릿한 이미지를 고해상도 이미지로 변환합니다! 초저해상도 16x16 이미지를 가져와서 1080p 고화질 사람 얼굴로 바꿀 수 있습니다! 당신은 나를 믿지 않습니까? 그렇다면 당신도 나처럼 1분 안에 직접 시도해 볼 수 있습니다! 하지만 먼저 그들이 어떻게 그렇게 했는지 살펴보겠습니다.
Gmail에서 사용되는 것과 같은 좋은 AI는 일관된 텍스트를 생성하고 문구를 완성할 수 있습니다. 이것은 이미지를 완성하기 위해 동일한 원리를 사용합니다! 라벨이 전혀 필요하지 않은 비지도 학습으로 모든 작업이 완료되었습니다!
이제 이 새로운 이미지 대 이미지 변환 기술을 사용하면 그리기 기술이 전혀 없어도 대략적이거나 불완전한 스케치에서 고품질 얼굴 이미지를 생성할 수 있습니다! 나만큼 그림 실력이 좋지 않다면 눈, 입, 코가 최종 이미지에 얼마나 영향을 미칠지 조정할 수도 있습니다! 그것이 실제로 작동하는지, 그리고 그들이 어떻게 했는지 봅시다.
이 AI는 2D 이미지에서 사람의 3D 고해상도 재구성을 생성합니다! 뒤에서도 당신과 꼭 닮은 3D 아바타를 생성하려면 당신의 이미지 한 장만 있으면 됩니다!
ECCV 2020 최우수 논문상은 프린스턴 팀에게 돌아갑니다. 그들은 광학 흐름을 위한 새로운 종단 간 훈련 가능한 모델을 개발했습니다. 그들의 방법은 여러 데이터 세트에서 최첨단 아키텍처의 정확도를 능가하며 훨씬 더 효율적입니다. 심지어 Github에서 모든 사람이 코드를 사용할 수 있도록 만들었습니다!
이 AI는 제거된 움직이는 물체 뒤의 누락된 픽셀을 채우고 현재의 최첨단 접근 방식보다 훨씬 더 정확하고 흐릿함을 줄여 전체 비디오를 재구성할 수 있습니다!
할머니가 18세였을 때 낡고, 접히고, 심지어 찢어진 사진을 고화질로 가지고 있고 인공물이 하나도 없다고 상상해 보십시오. 이를 오래된 사진 복원이라고 하며 이 문서는 딥러닝 접근 방식을 사용하여 이 문제를 해결할 수 있는 완전히 새로운 길을 열었습니다.
휴먼 매트(Human Matting)는 사진에서 사람을 찾아 배경을 제거하는 것이 목표인 매우 흥미로운 작업입니다. 완벽한 윤곽을 가진 사람을 찾아야 하는 작업의 복잡성으로 인해 달성하기가 정말 어렵습니다. 이 게시물에서는 수년간 사용된 최고의 기술과 2020년 11월 29일에 게시된 새로운 접근 방식을 검토합니다. 많은 기술은 이 작업을 달성하기 위해 매우 빠르지만 속도가 느리지만 GrabCut 알고리즘과 같은 기본적인 컴퓨터 비전 알고리즘을 사용하고 있습니다. 매우 정확합니다.
DeOldify는 오래된 흑백 이미지 또는 영화 장면을 색상화하고 복원하는 기술입니다. 이 앱은 Jason Antic 단 한 사람에 의해 개발되었으며 여전히 업데이트되고 있습니다. 이제 흑백 이미지를 색상화하는 최첨단 방법이 되었으며 모든 것이 오픈 소스로 제공되지만 이에 대해서는 잠시 후에 다시 살펴보겠습니다.
목록을 공유하려면 Twitter @Whats_AI 또는 LinkedIn @Louis(What's AI) Bouchard에 저를 태그해 주세요!
[1] Akkaynak, Derya & Treibitz, Tali. (2019). Sea-Thru: 수중 영상에서 물을 제거하는 방법. 1682년부터 1691년까지. 10.1109/CVPR.2019.00178.
[2] Lechner, M., Hasani, R., Amini, A. 외. 감사 가능한 자율성을 활성화하는 신경 회로 정책. Nat Mach Inteltell 2, 642–652(2020). https://doi.org/10.1038/s42256-020-00237-3
[3] PP Srinivasan, B. Deng, X. Zhang, M. Tancik, B. Mildenhall 및 JT Barron, "Nerv: 재조명 및 뷰 합성을 위한 신경 반사 및 가시성 필드", arXiv, 2020.
[4] A. Bochkovskiy, C.-Y. Wang, and H.-YM Liao, Yolov4: 물체 감지의 최적 속도 및 정확도, 2020. arXiv:2004.10934 [cs.CV].
[5] S. Menon, A. Damian, S. Hu, N. Ravi 및 C. Rudin, Pulse: 생성 모델의 잠재 공간 탐색을 통한 자가 감독 사진 업샘플링, 2020. arXiv:2003.03808 [cs.CV].
[6] M. Chen, A. Radford, R. Child, J. Wu, H. Jun, D. Luan 및 I. Sutskever, "픽셀을 통한 생성적 사전 훈련", 제37회 기계 학습 국제 컨퍼런스 진행, HD III 및 A. Singh, Eds., ser. 기계 학습 연구 논문집, vol. 119, 가상: PMLR, 2020년 7월 13~18일, 1691~1703페이지. [온라인].
[7] S.-Y. Chen, W. Su, L. Gao, S. Xia 및 H. Fu, "DeepFace Drawing: 스케치에서 얼굴 이미지 심층 생성," ACM Transactions on Graphics(ACM SIGGRAPH2020 회보), vol. 39, 아니. 4, 72:1–72:16, 2020. 이용 가능: http://proceedings.mlr.press/v119/chen20s.html.
[8] S. Saito, T. Simon, J. Saragih 및 H. Joo, Pifuhd: 고해상도 3D 인간 디지털화를 위한 다중 레벨 픽셀 정렬 암시적 함수, 2020. arXiv:2004.00452 [cs.CV].
[9] Z. Teed 및 J. Deng, Raft: 광학 흐름에 대한 반복적인 모든 쌍 필드 변환, 2020. arXiv:2003.12039 [cs.CV].
[10] Y. Zeng, J. Fu, H. Chao, 비디오 인페인팅을 위한 공동 시공간 변환 학습, 2020. arXiv:2007.10247 [cs.CV].
[보너스 1] Z. Wan, B. Zhang, D. Chen, P. Zhang, D. Chen, J. Liao 및 F. Wen, 심층 잠재 공간 변환을 통한 오래된 사진 복원, 2020. arXiv:2009.07047 [cs. 이력서].
[보너스 2] Z. Ke, K. Li, Y. Zhou, Q. Wu, X. Mao, Q. Yan, RW Lau, "실시간 인물 사진 매트에 그린 스크린이 정말 필요한가요?" ArXiv, vol. ABS/2011.11961, 2020.
[보너스 3] DeOldify의 제작자 Jason Antic, https://github.com/jantic/DeOldify