Bahkan dengan semua yang terjadi di dunia tahun ini, kita masih memiliki kesempatan untuk melihat banyak penelitian menakjubkan yang dihasilkan. Terutama di bidang kecerdasan buatan dan lebih tepatnya computer vision. Terlebih lagi, banyak aspek penting yang disorot tahun ini, seperti aspek etika, bias penting, dan masih banyak lagi. Kecerdasan buatan dan pemahaman kita tentang otak manusia serta kaitannya dengan AI terus berkembang, menunjukkan penerapan yang menjanjikan dalam waktu dekat, yang pasti akan saya bahas.
Berikut adalah 10 makalah penelitian paling menarik tahun ini dalam bidang visi komputer, jika Anda melewatkannya. Singkatnya, ini pada dasarnya adalah daftar terobosan terbaru dalam AI dan CV dengan penjelasan video yang jelas, tautan ke artikel yang lebih mendalam, dan kode (jika ada). Selamat membaca, dan beri tahu saya jika saya melewatkan makalah penting di komentar, atau dengan menghubungi saya langsung di LinkedIn!
Referensi lengkap untuk masing-masing makalah tercantum di akhir repositori ini.
Pengelola - louisfb01
Jangan ragu untuk mengirimi saya surat kabar bagus apa pun yang saya lewatkan untuk ditambahkan ke repositori ini di [email protected]
Tandai saya di Twitter @Whats_AI atau LinkedIn @Louis (Apa itu AI) Bouchard jika Anda membagikan daftarnya!
Daftar terobosan terbaru dalam AI berdasarkan tanggal rilis dengan penjelasan video yang jelas, tautan ke artikel yang lebih mendalam, dan kode.
2020: Setahun Penuh Makalah AI yang Menakjubkan- Sebuah Tinjauan
Pernahkah Anda bertanya-tanya bagaimana jadinya lautan tanpa air. Hilangkan warna biru-hijau pada gambar bawah air, dan tetap dapatkan warna terumbu karang yang sebenarnya? Nah, dengan menggunakan algoritma visi komputer dan pembelajaran mesin, para peneliti dari Universitas Haifa mampu mencapai hal tersebut!
Para peneliti dari IST Austria dan MIT telah berhasil melatih mobil self-driving menggunakan sistem kecerdasan buatan baru yang didasarkan pada otak hewan kecil, seperti cacing kremi. Mereka mencapai hal tersebut dengan hanya beberapa neuron yang mampu mengendalikan mobil self-driving, dibandingkan dengan jutaan neuron yang dibutuhkan oleh jaringan saraf dalam yang populer seperti Inceptions, Resnets, atau VGG. Jaringan mereka mampu mengendalikan mobil sepenuhnya hanya dengan menggunakan 75.000 parameter, yang terdiri dari 19 neuron kontrol, bukan jutaan!
Metode baru ini mampu menghasilkan pemandangan 3 dimensi yang lengkap dan memiliki kemampuan untuk menentukan pencahayaan pemandangan. Semua ini dengan biaya komputasi yang sangat terbatas dan hasil yang luar biasa dibandingkan pendekatan sebelumnya.
Versi ke-4 ini baru saja diperkenalkan pada bulan April 2020 oleh Alexei Bochkovsky dkk. dalam makalah "YOLOv4: Kecepatan Optimal dan Akurasi Deteksi Objek". Tujuan utama dari algoritma ini adalah untuk membuat pendeteksi objek super cepat dengan kualitas tinggi dalam hal akurasi.
Algoritme baru ini mengubah gambar buram menjadi gambar beresolusi tinggi! Ini dapat mengambil gambar 16x16 resolusi super rendah dan mengubahnya menjadi wajah manusia definisi tinggi 1080p! Anda tidak percaya padaku? Maka Anda dapat melakukan seperti saya dan mencobanya sendiri dalam waktu kurang dari satu menit! Tapi pertama-tama, mari kita lihat bagaimana mereka melakukannya.
AI yang bagus, seperti yang digunakan di Gmail, dapat menghasilkan teks yang koheren dan menyelesaikan frasa Anda. Yang ini menggunakan prinsip yang sama untuk melengkapi sebuah gambar! Semua dilakukan dalam pelatihan tanpa pengawasan tanpa memerlukan label sama sekali!
Sekarang Anda dapat menghasilkan gambar wajah berkualitas tinggi dari sketsa kasar atau bahkan tidak lengkap tanpa keterampilan menggambar menggunakan teknik penerjemahan gambar-ke-gambar baru ini! Jika kemampuan menggambar Anda sama buruknya dengan saya, Anda bahkan dapat menyesuaikan seberapa besar pengaruh mata, mulut, dan hidung pada gambar akhir! Mari kita lihat apakah ini benar-benar berhasil dan bagaimana mereka melakukannya.
AI ini Menghasilkan rekonstruksi orang beresolusi tinggi 3D dari gambar 2D! Hanya diperlukan satu gambar diri Anda untuk menghasilkan avatar 3D yang terlihat seperti Anda, bahkan dari belakang!
Penghargaan Makalah Terbaik ECCV 2020 diberikan kepada Tim Princeton. Mereka mengembangkan model baru yang dapat dilatih secara end-to-end untuk aliran optik. Metode mereka mengalahkan akurasi arsitektur canggih di berbagai kumpulan data dan jauh lebih efisien. Mereka bahkan menyediakan kode untuk semua orang di Github mereka!
AI ini dapat mengisi piksel yang hilang di balik objek bergerak yang dihapus dan merekonstruksi keseluruhan video dengan lebih akurat dan lebih sedikit keburaman dibandingkan pendekatan canggih saat ini!
Bayangkan memiliki foto nenek Anda yang lama, terlipat, dan bahkan robek ketika dia berusia 18 tahun dalam definisi tinggi tanpa artefak. Ini disebut restorasi foto lama dan makalah ini membuka jalan baru untuk mengatasi masalah ini menggunakan pendekatan pembelajaran mendalam.
Anyaman manusia adalah tugas yang sangat menarik yang tujuannya adalah menemukan manusia mana pun dalam gambar dan menghilangkan latar belakangnya. Hal ini sangat sulit dicapai karena rumitnya tugas, harus mencari orang atau orang dengan kontur yang sempurna. Dalam postingan ini, saya mengulas teknik terbaik yang digunakan selama bertahun-tahun dan pendekatan baru yang diterbitkan pada 29 November 2020. Banyak teknik yang menggunakan algoritma visi komputer dasar untuk mencapai tugas ini, seperti algoritma GrabCut, yang sangat cepat, tetapi tidak sangat tepat.
DeOldify adalah teknik untuk mewarnai dan mengembalikan gambar hitam putih atau bahkan cuplikan film lama. Ini dikembangkan dan masih diperbarui hanya oleh satu orang Jason Antic. Sekarang merupakan cara tercanggih untuk mewarnai gambar hitam putih, dan semuanya bersumber terbuka, tetapi kita akan membahasnya sebentar lagi.
Tandai saya di Twitter @Whats_AI atau LinkedIn @Louis (Apa itu AI) Bouchard jika Anda membagikan daftarnya!
[1] Akkaynak, Derya & Treibitz, Tali. (2019). Sea-Thru: Metode Menghilangkan Air dari Gambar Bawah Air. 1682–1691. 10.1109/CVPR.2019.00178.
[2] Lechner, M., Hasani, R., Amini, A. dkk. Kebijakan sirkuit saraf memungkinkan otonomi yang dapat diaudit. Nat Mach Intell 2, 642–652 (2020). https://doi.org/10.1038/s42256-020-00237-3
[3] PP Srinivasan, B. Deng, X. Zhang, M. Tancik, B. Mildenhall, dan JT Barron, "Nerv: Bidang reflektansi dan visibilitas saraf untuk penerangan ulang dan sintesis tampilan," di arXiv, 2020.
[4] A. Bochkovskiy, C.-Y. Wang, dan H.-YM Liao, Yolov4: Kecepatan dan akurasi optimal dalam pendeteksian objek, 2020. arXiv:2004.10934 [cs.CV].
[5] S. Menon, A. Damian, S. Hu, N. Ravi, dan C. Rudin, Pulse: Pengambilan sampel foto yang diawasi sendiri melalui eksplorasi ruang angkasa laten model generatif, 2020. arXiv:2003.03808 [cs.CV].
[6] M. Chen, A. Radford, R. Child, J. Wu, H. Jun, D. Luan, dan I. Sutskever, "Pelatihan awal generatif dari piksel," dalam Prosiding Konferensi Internasional ke-37 tentang Pembelajaran Mesin, HD III dan A. Singh, Eds., ser. Prosiding Penelitian Pembelajaran Mesin, vol. 119, Virtual: PMLR, 13–18 Juli 2020, hlm.1691–1703. [On line].
[7] S.-Y. Chen, W. Su, L. Gao, S. Xia, dan H. Fu, "DeepFaceDrawing: Pembuatan gambar wajah yang mendalam dari sketsa," ACM Transactions on Graphics (Prosiding ACM SIGGRAPH2020), vol. 39, tidak. 4, 72:1–72:16, 2020. Tersedia:http://proceedings.mlr.press/v119/chen20s.html.
[8] S. Saito, T. Simon, J. Saragih, dan H. Joo, Pifuhd: Fungsi implisit perataan piksel multi-level untuk digitalisasi manusia 3d resolusi tinggi, 2020. arXiv:2004.00452 [cs.CV].
[9] Z. Teed dan J. Deng, Raft: Transformasi medan semua pasangan berulang untuk aliran optik, 2020. arXiv:2003.12039 [cs.CV].
[10] Y. Zeng, J. Fu, dan H. Chao, Mempelajari transformasi spasial-temporal gabungan untuk video dalam lukisan, 2020. arXiv:2007.10247 [cs.CV].
[Bonus 1] Z. Wan, B. Zhang, D. Chen, P. Zhang, D. Chen, J. Liao, dan F. Wen, Restorasi foto lama melalui terjemahan ruang laten yang dalam, 2020. arXiv:2009.07047 [cs. CV].
[Bonus 2] Z. Ke, K. Li, Y. Zhou, Q. Wu, X. Mao, Q. Yan, dan RW Lau, "Apakah layar hijau benar-benar diperlukan untuk matting potret real-time?" ArXiv, jilid. abs/2011.11961, 2020.
[Bonus 3] Jason Antic, Pencipta DeOldify, https://github.com/jantic/DeOldify