Даже несмотря на все события, произошедшие в мире в этом году, у нас все еще была возможность увидеть множество удивительных исследований. Особенно в сфере искусственного интеллекта, а точнее компьютерного зрения. Более того, в этом году были освещены многие важные аспекты, такие как этические аспекты, важные предубеждения и многое другое. Искусственный интеллект и наше понимание человеческого мозга и его связи с ИИ постоянно развиваются, показывая многообещающие применения в ближайшем будущем, о которых я обязательно расскажу.
Вот мой топ-10 самых интересных исследовательских работ года в области компьютерного зрения, если вы пропустили какую-либо из них. Короче говоря, это, по сути, тщательно подобранный список последних достижений в области искусственного интеллекта и CV с четким видеообъяснением, ссылкой на более подробную статью и кодом (если применимо). Наслаждайтесь чтением и дайте мне знать, если я пропустил какие-либо важные статьи, в комментариях или связавшись со мной напрямую в LinkedIn!
Полная ссылка на каждую статью приведена в конце этого репозитория.
Сопровождающий - louisfb01
Не стесняйтесь присылать мне любые замечательные статьи, которые я пропустил, чтобы добавить в этот репозиторий, на [email protected].
Отметьте меня в Твиттере @Whats_AI или LinkedIn @Louis (What's AI) Бушар, если поделитесь этим списком!
Тщательно подобранный список последних достижений в области искусственного интеллекта по датам выпуска с четким видеообъяснением, ссылкой на более подробную статью и кодом.
2020: год, полный удивительных статей по искусственному интеллекту – обзор
Вы когда-нибудь задумывались, как бы выглядел океан без воды? Уберите этот сине-зеленый оттенок с подводных фотографий и сохраните истинные цвета кораллового рифа? Что ж, используя компьютерное зрение и алгоритмы машинного обучения, исследователи из Хайфского университета смогли добиться именно этого!
Исследователи из IST Austria и MIT успешно обучили беспилотный автомобиль с помощью новой системы искусственного интеллекта, основанной на мозге крошечных животных, таких как острицы. Они достигли этого, используя лишь несколько нейронов, способных управлять беспилотным автомобилем, по сравнению с миллионами нейронов, необходимых популярным глубоким нейронным сетям, таким как Inceptions, Resnets или VGG. Их сеть смогла полностью управлять автомобилем, используя всего 75 000 параметров, состоящих из 19 управляющих нейронов, а не из миллионов!
Этот новый метод позволяет создавать полную трехмерную сцену и определять освещение сцены. И все это с очень ограниченными вычислительными затратами и потрясающими результатами по сравнению с предыдущими подходами.
Эта 4-я версия была недавно представлена в апреле 2020 года Алексеем Бочковским и др. в статье «YOLOv4: Оптимальная скорость и точность обнаружения объектов». Основной целью этого алгоритма было создание сверхбыстрого детектора объектов с высоким качеством с точки зрения точности.
Этот новый алгоритм преобразует размытое изображение в изображение с высоким разрешением! Он может взять изображение 16x16 со сверхнизким разрешением и превратить его в человеческое лицо высокой четкости 1080p! Ты мне не веришь? Тогда вы сможете сделать так же, как я, и попробовать это на себе менее чем за минуту! Но сначала давайте посмотрим, как они это сделали.
Хороший ИИ, такой как тот, что используется в Gmail, может сгенерировать связный текст и закончить фразу. Здесь используются те же принципы для завершения образа! Все это делается в рамках обучения без присмотра, без каких-либо ярлыков!
Теперь вы можете создавать высококачественные изображения лиц из грубых или даже неполных эскизов, не имея навыков рисования, используя эту новую технику перевода изображений в изображения! Если ваши навыки рисования такие же плохие, как у меня, вы даже можете настроить, насколько глаза, рот и нос будут влиять на окончательное изображение! Давайте посмотрим, действительно ли это работает и как они это сделали.
Этот искусственный интеллект генерирует 3D-реконструкции людей с высоким разрешением на основе 2D-изображений! Чтобы создать 3D-аватар, который будет выглядеть так же, как вы, даже со спины, достаточно одного вашего изображения!
Награда ECCV 2020 за лучшую работу достается команде Принстона. Они разработали новую сквозную обучаемую модель оптического потока. Их метод превосходит точность современных архитектур при работе с несколькими наборами данных и намного более эффективен. Они даже сделали код доступным для всех на своем Github!
Этот ИИ может заполнить недостающие пиксели за удаленным движущимся объектом и восстановить все видео с гораздо большей точностью и меньшей размытостью, чем современные подходы!
Представьте себе, что у вас есть старые, сложенные и даже порванные фотографии вашей бабушки, когда ей было 18 лет, в высоком разрешении и без артефактов. Это называется реставрацией старых фотографий, и эта статья открыла совершенно новый путь решения этой проблемы с использованием подхода глубокого обучения.
Человеческое матирование — чрезвычайно интересная задача, цель которой — найти на картинке любого человека и удалить с него фон. Этого действительно сложно достичь из-за сложности задачи — найти человека или людей с идеальным контуром. В этом посте я рассматриваю лучшие методы, использовавшиеся за последние годы, а также новый подход, опубликованный 29 ноября 2020 года. Многие методы используют базовые алгоритмы компьютерного зрения для решения этой задачи, например алгоритм GrabCut, который чрезвычайно быстр, но не очень точный.
DeOldify — это метод раскрашивания и восстановления старых черно-белых изображений или даже видеоматериалов. Он был разработан и до сих пор обновляется только одним человеком — Джейсоном Антиком. Сейчас это современный способ раскрашивания черно-белых изображений, и все находится в открытом доступе, но мы вернемся к этому чуть позже.
Отметьте меня в Твиттере @Whats_AI или LinkedIn @Louis (What's AI) Бушар, если поделитесь этим списком!
[1] Аккайнак, Дерья и Трейбитц, Тали. (2019). Sea-Thru: метод удаления воды с подводных изображений. 1682–1691. 10.1109/ЦВПР.2019.00178.
[2] Лехнер М., Хасани Р., Амини А. и др. Политики нейронных сетей, обеспечивающие проверяемую автономию. Нат Мах Интелл 2, 642–652 (2020). https://doi.org/10.1038/s42256-020-00237-3
[3] П. П. Шринивасан, Б. Денг, К. Чжан, М. Танчик, Б. Милденхолл и Дж. Т. Бэррон, «Nerv: нейронные поля отражения и видимости для повторного освещения и синтеза представлений», в arXiv, 2020.
[4] Бочковский А., К.-Ю. Ван и Х.-Ю. Ляо, Йолов4: Оптимальная скорость и точность обнаружения объектов, 2020. arXiv:2004.10934 [cs.CV].
[5] С. Менон, А. Дамиан, С. Ху, Н. Рави и К. Рудин, «Пульс: самоконтролируемая повышающая дискретизация фотографий посредством скрытого космического исследования генеративных моделей», 2020. arXiv:2003.03808 [cs.CV].
[6] М. Чен, А. Рэдфорд, Р. Чайлд, Дж. Ву, Х. Джун, Д. Луан и И. Суцкевер, «Генераторивная предварительная подготовка по пикселям», в материалах 37-й Международной конференции по машинному обучению. HD III и А. Сингх, ред., сер. Труды исследований машинного обучения, том. 119, виртуально: PMLR, 13–18 июля 2020 г., стр. 1691–1703. [Онлайн].
[7] С.-Ю. Чен, В. Су, Л. Гао, С. Ся и Х. Фу, «DeepFaceDrawing: глубокое создание изображений лиц на основе эскизов», Транзакции ACM в графике (Материалы ACM SIGGRAPH2020), том. 39, нет. 4, 72:1–72:16, 2020. Доступно: http://proceedings.mlr.press/v119/chen20s.html.
[8] С. Сайто, Т. Саймон, Дж. Сараги и Х. Джу, Пифухд: Многоуровневая неявная функция с выравниванием по пикселям для оцифровки трехмерных изображений человека с высоким разрешением, 2020. arXiv:2004.00452 [cs.CV].
[9] З. Тид и Дж. Денг, Плот: Рекуррентные преобразования всех пар полей для оптического потока, 2020. arXiv:2003.12039 [cs.CV].
[10] Ю. Цзэн, Дж. Фу и Х. Чао, Изучение совместных пространственно-временных преобразований для видео в живописи, 2020. arXiv:2007.10247 [cs.CV].
[Бонус 1] З. Ван, Б. Чжан, Д. Чен, П. Чжан, Д. Чен, Дж. Ляо и Ф. Вэнь, Восстановление старых фотографий с помощью перевода в глубокое скрытое пространство, 2020. arXiv: 2009.07047 [cs. РЕЗЮМЕ].
[Бонус 2] З. Кэ, К. Ли, Ю. Чжоу, Ц. Ву, С. Мао, Ц. Ян и Р. В. Лау: «Действительно ли зеленый экран необходим для создания портретов в реальном времени?» АрXiv, том. абс/2011.11961, 2020.
[Бонус 3] Джейсон Антик, создатель DeOldify, https://github.com/jantic/DeOldify