Скачать awesome colab notebooks - awesome colab notebooks Скачать исходный код

Страница может отображаться неправильно. Пожалуйста, откройте файл README.md напрямую.

Потрясающая коллекция блокнотов Colab для экспериментов по машинному обучению

Тенденции

репозитории	документы
facebookresearch/со-трекер итеративный/цепочка данных КаллуммКдугалл/ARENA_3.0 ToTheBeginning/PuLID ЧжэнПэн7/BiRefNet ультралитики/ультралитики неленивый/неленивый Facebookresearch/сегментировать что-нибудь-2 Ильясвиэль/IC-Light гемело-ай/вокос comfyanonymous/ComfyUI TransformerLensOrg/TransformerLens Хунвэньчжан/PyMAF-X робопоток/надзор КвайВГИ/LivePortrait пидднад/DDColor TencentARC/InstantMesh LAION-AI/эстетический предсказатель Дубию/DynamiCrafter facebookresearch/домашний робот Киллиан Лукас/открытый переводчик jxnl/инструктор	ЛИДА Гауссово пятно Настроить видео Следуй за своей позой Text2Video-ноль ГЛИП УниФормерV2 SadTalker СОВА-ВИТ ВидеоReTalking ЛДМ Поля мечты Детик ГрафКаст ПеретащитеГАН ВРТ Модель сплайнового движения тонкой пластины ПиМАФ-X FateZero py-irt VQ-Диффузия ЭКОНО

репозитории

документы

facebookresearch/со-трекер
итеративный/цепочка данных
КаллуммКдугалл/ARENA_3.0
ToTheBeginning/PuLID
ЧжэнПэн7/BiRefNet
ультралитики/ультралитики
неленивый/неленивый
Facebookresearch/сегментировать что-нибудь-2
Ильясвиэль/IC-Light
гемело-ай/вокос
comfyanonymous/ComfyUI
TransformerLensOrg/TransformerLens
Хунвэньчжан/PyMAF-X
робопоток/надзор
КвайВГИ/LivePortrait
пидднад/DDColor
TencentARC/InstantMesh
LAION-AI/эстетический предсказатель
Дубию/DynamiCrafter
facebookresearch/домашний робот
Киллиан Лукас/открытый переводчик
jxnl/инструктор

ЛИДА
Гауссово пятно
Настроить видео
Следуй за своей позой
Text2Video-ноль
ГЛИП
УниФормерV2
SadTalker
СОВА-ВИТ
ВидеоReTalking
ЛДМ
Поля мечты
Детик
ГрафКаст
ПеретащитеГАН
ВРТ
Модель сплайнового движения тонкой пластины
ПиМАФ-X
FateZero
py-irt
VQ-Диффузия
ЭКОНО

Исследовать

имя	описание	авторы	ссылки	обновлять
КоТрекер	Архитектура, которая совместно отслеживает несколько точек на протяжении всего видео	Никита Караев Игнасио Рокко Бенджамин Грэм Наталья Неверова другие Андреа Ведальди Кристиан Рупрехт	, проект	16.10.2024
ПИФу	Неявная функция с выравниванием по пикселям для оцифровки человека в одежде с высоким разрешением	Рёта Нацумэ Сюнсуке Сайто Цзэн Хуан Анджу Канадзава Хао Ли		08.10.2024
Диффейс	Метод, который способен более изящно справляться с невидимыми и сложными деградациями без сложных расчетов потерь.	Цзуншэн Юэ Чен Чэнг Лой	, , ,	05.10.2024
Сегментируйте что угодно 2	Базовая модель для решения быстрой визуальной сегментации изображений и видео	Никхила Рави Валентин Габер Юань-Тин Ху Ронхан Ху другие Чайтанья Рьяли Тенгю Ма Хайсам Хедр Роман Рэдле Хлоя Роллан Лора Густафсон Эрик Минтун Юнтинг Пан [Калян Васудев](lwala](https://scholar.google.co.in/citations?user=m34oaWEAAAAJ) Николас Карион [Чао-Юань](u](https://chaoyuan.org/) Росс Гиршик Петр Доллар Кристоф Файхтенхофер	демо , , проект , , ,	01.10.2024
Открыть-Unmix	Эталонная реализация глубокой нейронной сети для разделения музыкальных источников, применимая для исследователей, звукорежиссеров и художников.	Фабиан-Роберт Стётер Антуан Люткус	данные проект	25.09.2024
Глубокая живописная гармонизация	Алгоритм дает значительно лучшие результаты, чем методы композиции фотографий или глобальной стилизации, и позволяет творчески редактировать изображения, чего в противном случае было бы трудно достичь.	Фуджун Луань Сильвен Пэрис Эли Шехтман Кавита Бала	, , ,	23.09.2024
аудио2фотореалистичный	Платформа для создания полноценных фотореалистичных аватаров, которые жестикулируют в соответствии с разговорной динамикой диадического взаимодействия.	Эвонн Нг Хавьер Ромеро Тимур Багаутдинов Шаоцзе Бай другие Тревор Даррелл Анджу Канадзава Александр Ричард	проект	13.09.2024
Быстрая сегментация чего угодно	Модель CNN Segment Anything, обученная с использованием только 2% набора данных SA-1B, опубликованного авторами SAM.	Сюй Чжао Вэньчао Дин Юнци Ан Инлун Ду другие Тао Ю Мин Ли Мин Тан Цзиньцяо Ван	, , ,	10.09.2024
Неураланджело	Платформа для высококачественной трехмерной реконструкции поверхности на основе видеозаписей RGB	Чжаошуо Ли Томас Мюллер Алекс Эванс Рассел Тейлор другие Матиас Унберат Мин-Ю Лю Чэнь-Сюань Линь	сообщение в блоге проект , ,	09.02.2024
БиРефНет	Двусторонняя эталонная система для сегментации дихотомических изображений высокого разрешения	Пэн Чжэн Дехонг Гао Дэн-Пин Фан Ли Лю другие Йорма Лааксонен Ванли Оуян Нику Себе	, , , , проект , ,	23.08.2024
ВРАЩАТЬСЯ	Научимся реконструировать трехмерную позу и форму человека посредством подгонки модели в цикле	Никос Колотурос Георгиос Павлакос Майкл Блэк Костас Данилидис	, проект	21.08.2024
YOLOv10	Стремитесь к дальнейшему улучшению границ производительности и эффективности YOLO как с точки зрения постобработки, так и с точки зрения архитектуры модели.	Ао Ван Хуэй Чен Кай Чен Цзыцзя Линь другие Юнгонг Хан Гуйгуан Дин	сообщение в блоге демо , , , , , , , , , , , , ,	20.08.2024
СпецВКГАН	Укрощение визуально управляемой генерации звука путем сокращения набора обучающих данных до набора репрезентативных векторов	Владимир Яшин Эса Рахту	, , , , , , , , проект , ,	12.07.2024
LiveПортрет	Фреймворк портретной анимации на основе видео с упором на лучшее обобщение, управляемость и эффективность для практического использования.	Цзянжу Го Динъюнь Чжан Сяоцян Лю Чжичжоу Чжун другие Юань Чжан Пэнфэй Ван Ди Чжан	, , , , проект , , , , ,	10.07.2024
ТАПИР	Отслеживание любой точки с покадровой инициализацией и временным уточнением	Карл Дорш И Ян Мел Весерик Дилара Гокай другие Анкуш Гупта Юсуф Айтар Жоау Каррейра Эндрю Зиссерман	, сообщение в блоге, сообщение в блоге ,	07.05.2024
Wav2Lip	Эксперт по синхронизации губ — это все, что вам нужно для создания речи и губ в дикой природе	Праджвал Ренукананд Рудрабха Мукхопадхьяй Винай Намбудири Резюме Джавахар	данные демо проект	27.06.2024
DeepLabCut	Эффективный метод безмаркерной оценки позы, основанный на трансферном обучении с использованием глубоких нейронных сетей, который достигает отличных результатов с минимальными обучающими данными.	Александр Матис Пранав Мамиданна Кевин Кьюри Тайга Абэ другие Венкатеш Мурти Маккензи Мэтис Матиас Бетге	, , , , , форум , веб-сайт , ,	05.06.2024
БассейнБывший	MetaFormer — это именно то, что нужно для зрения	Вэйхао Ю Ми Луо Пан Чжоу Чэньян Си другие Ичен Чжоу Синьчао Ван Цзяши Фэн Шуйчэн Ян	, ,	01.06.2024
ИсторияРаспространение	Способ расчета самовнимания, называемый последовательным самовниманием, который значительно повышает согласованность между сгенерированными изображениями и дополняет распространенные предварительно обученные модели преобразования текста в изображение на основе диффузии с нулевым выстрелом.	Юпэн Чжоу Дацюань Чжоу Мин-Минг Ченг Цзяши Фэн Цибинь Хоу	проект ,	05.04.2024
ПуЛИД	Настройка Pure и Lightning ID — метод настройки идентификатора без настройки для преобразования текста в изображение.	Зинань Го Янзе Ву Чжуовэй Чен Лан Чен Цянь Хэ	, ,	03.05.2024
ФИЛЬМ	Алгоритм интерполяции кадров, который синтезирует несколько промежуточных кадров из двух входных изображений с большим промежуточным движением.	Фицум Реда Янне Контканен Эрик Табеллион Дэцин Сан другие Кэролайн Пантофару Брайан Керлесс	данные, данные, данные проект , ,	03.05.2024
ГолосКрафт	языковая модель нейронного кодека, заполняющая токен, которая обеспечивает высочайшую производительность как при редактировании речи, так и при преобразовании текста в речь с нулевой частотой в аудиокнигах, интернет-видео и подкастах.	Пуюань Пэн По-Яо Хуан Шан-Вэнь Ли Абдельрахман Мохамед Дэвид Харват	проект , ,	21.04.2024
ЗеСТ	Метод нулевого переноса материала на объект во входном изображении с учетом изображения образца материала	Та-Ин Ченг Прафулл Шарма Эндрю Маркхэм Ники Тригони Варун Джампани	, проект	16.04.2024
Мгновенная сетка	Платформа прямой связи для мгновенного создания 3D-сетки из одного изображения, обеспечивающая современное качество генерации и значительную масштабируемость обучения.	Цзялэ Сюй Вэйхао Ченг Имин Гао Синьтао Ван другие Шэнхуа Гао Ин Шань	, ,	16.04.2024
АльфаФолд	Высокоточное предсказание структуры белка	Джон Джампер Ричард Эванс Александр Притцель Тим Грин другие Михаил Фигурнов Олаф Роннебергер Кэтрин Туньясувунакул Расс Бейтс Августин Жидек Анна Потапенко Алекс Бриджланд Клеменс Мейер Саймон Коль Эндрю Баллард Бернардино Ромера-Паредес Станислав Николов Ришуб Джайн	сообщение в блоге, сообщение в блоге , бумага ,	15.04.2024
Вюрстхен	Архитектура синтеза текста в изображение, сочетающая конкурентоспособную производительность с беспрецедентной экономической эффективностью для крупномасштабных моделей распространения текста в изображение.	Пабло Перниас Доминик Рампас Матс Рихтер Кристофер Пал Марк Обревиль		04.06.2024
АКЛМ	Чрезвычайное сжатие больших языковых моделей посредством аддитивного квантования	Ваге Егиазарян Андрей Панферов Денис Кузнеделев Элиас Франтар другие Артем Бабенко Дэн Алистарх	, , ,	08.03.2024
YOLOv9	Изучите то, что вы хотите узнать, используя информацию о программируемом градиенте	Чиен-Яо Ван Я-Хау Йе Хун-Юань Марк Ляо	, сообщение в блоге , , , , ,	05.03.2024
Мульти-LoRA состав	LoRA Switch и LoRA Composite — подходы, целью которых является превзойти традиционные методы с точки зрения точности и качества изображения, особенно в сложных композициях.	Мин Чжун Йелун Шен Шуохан Ван Ядонг Лу другие Ичжу Цзяо Сиру Оуян Донхан Ю Цзявэй Хан Вэйчжу Чен	веб-сайт	03.03.2024
АМАРЕТТО	Многомасштабный и мультимодальный вывод о регуляторных сетях для идентификации клеточных цепей и их драйверов, общих и различных внутри и между биологическими системами заболеваний человека.	Натали Почет Оливье Геварт Мохсен Набиан Джайендра Шинде другие Селин Эверарт Торин Табор	биопроводник проект	28.02.2024
ЛИДА	Инструмент для создания грамматически-независимых визуализаций и инфографики.	Виктор Дибиа	, проект , ,	06.02.2024
ВИТ	Архитектуры Vision Transformer и MLP-Mixer	Алексей Досовицкий Лукас Бейер Александр Колесников Дирк Вайсенборн другие Сяохуа Чжай Томас Унтертинер Мостафа Дегани Маттиас Миндерер Георг Хейгольд Сильвен Желли Якоб Ушкорейт Нил Хоулсби	, , , , , , сообщение в блоге , , , , ,	06.02.2024
3D Кен Бернс	Эталонная реализация 3D-эффекта Кена Бернса из одного изображения с использованием PyTorch — учитывая одно входное изображение, оно анимирует это неподвижное изображение с помощью сканирования и масштабирования виртуальной камеры с учетом параллакса движения.	Мануэль Ромеро		24.01.2024
ВАЛЛ-И Х	Межъязыковая языковая модель нейронного кодека для межъязыкового синтеза речи	Цзыцян Чжан Лун Чжоу Чэнъи Ван Саньюань Чен другие Ю Ву Шуцзе Лю Чжо Чен Яньцин Лю Хуамин Ван Цзинью Ли Лэй Хэ Шэн Чжао Фуру Вэй	, , демо проект	19.01.2024
Фотомейкер	Эффективный метод персонализированной генерации текста в изображение, который в основном кодирует произвольное количество входных изображений идентификатора в встраивание идентификатора стека для сохранения идентификационной информации.	Чжэнь Ли Минденг Цао Синьтао Ван Чжунган Ци другие Мин-Минг Ченг Ин Шань	, , , , , проект ,	18.01.2024
ДДЦвет	Сквозной метод с двойными декодерами для раскрашивания изображений	Сяоян Кан Тао Ян Вэньци Оуян Пейран Рен другие Линчжи Ли Сюаньсонг Се	,	15.01.2024
ПРОШЛО	Стабильная диффузионная сеть с учетом пикселей для обеспечения надежного Real-ISR, а также персонализированной стилизации	Тао Ян Пейран Рен Сюаньсонг Се Лэй Чжан	,	12.01.2024
Ручной рафинер	Уточнение искаженных рук в сгенерированных изображениях с помощью условной заливки на основе диффузии	Вэньцюань Лу Юфей Сюй Цзин Чжан Чаоюэ Ван Даченг Тао	, ,	08.01.2024
ГрафКаст	Обучение умелому среднесрочному глобальному прогнозу погоды	Реми Лам Альваро Санчес-Гонсалес Мэтью Уилсон Питер Вирнсбергер другие Мейре Фортунато Ферран Алет Суман Равури Тимо Эвальдс Зак Итон-Розен Вэйхуа Ху Александр Мерозе Стефан Хойер Джордж Холланд Ориол Виньялс Джеклинн Стотт Александр Притцель Шакир Мохамед Питер Батталья	данные , , , , , , , ,	01.04.2024
ЭСМ	Эволюционное масштабное моделирование: предварительно обученные языковые модели белков.	Цзэминг Линь Рошан Рао Брайан Хи Чжункай Чжу другие Аллан дос Сантос Коста Марьям Фазель-Заранди Том Серку Сальваторе Кандидо Александр Ривс Джошуа Мейер Роберт Веркуил Джейсон Лю Хлоя Сюй Адам Лерер	ЭСМ Атлас ФСДП ICML данные бумага, бумага, бумага, бумага опубликовано ,	28.12.2023
ЛЛаВА	Large Language and Vision Assistant, комплексная обученная большая мультимодальная модель, которая соединяет видеокодер и LLM для общего визуального и языкового понимания.	Хаотянь Лю Чунюань Ли Цинъян Ву Ён Джэ Ли Юхэн Ли	, , , , демо , , , , , , проект , , , , ,	22.12.2023
Матирование фона V2	Технология замены фона в реальном времени с высоким разрешением, которая работает со скоростью 30 кадров в секунду для разрешения 4K и 60 кадров в секунду для HD на современном графическом процессоре.	Шаньчуань Линь Андрей Рябцев Сумьядип Сенгупта Брайан Керлесс другие Стив Зейтц Ира Кемельмахер-Шлизерман	, проект ,	22.12.2023
Гауссово пятно	Современное качество изображения при сохранении конкурентоспособного времени обучения и, что немаловажно, обеспечивает высококачественный синтез новых изображений в реальном времени (≥ 100 кадров в секунду) с разрешением 1080p.	Бернхард Кербл Георгиос Копанас Томас Леймкюлер Джордж Дреттакис	проект , , , , , ,	19.12.2023
СМПЛер-X	Масштабирование EHPS в сторону первой универсальной базовой модели с использованием ViT-Huge в качестве основы и обучения с использованием до 4,5 млн экземпляров из различных источников данных.	Чжунган Цай Ваньци Инь Больной Цзэн Чэнь Вэй другие Цинпин Сунь Яньцзюнь Ван Хуэй Энь Панг Хайи Мэй Мингюань Чжан Лэй Чжан Чен Чэнг Лой Лэй Ян Цивэй Лю	, , проект ,	18.12.2023
ДипКэш	Парадигма, не требующая обучения, которая ускоряет распространение моделей с точки зрения архитектуры модели.	Синьинь Ма Гунфан Фанг Синьчао Ван	проект	18.12.2023
МагияАнимация	Платформа на основе диффузии, целью которой является улучшение временной согласованности, достоверное сохранение эталонного изображения и повышение точности анимации.	Чжунцун Сюй Цзяньфэн Чжан Цзюнь Хао Лью Ханьшу Ян другие Цзявэй Лю Чэньсюй Чжан Цзяши Фэн Майк Шу	, , проект веб-сайт , ,	18.12.2023
ДиффБИР	На пути к восстановлению слепых изображений с помощью генеративной диффузии	Синьци Линь Цзинвэнь Хэ Зиян Чен Чжаоян Лю другие Бен Фей Бо Дай Ванли Оуян Ю Цяо Чао Донг	проект ,	18.12.2023
АудиоLDM	Система преобразования текста в аудио, построенная на скрытом пространстве для изучения непрерывных звуковых представлений на основе контрастирующих латентных предварительных тренировок языка и звука.	Хаохэ Лю Зехуа Чен И Юань Синьхао Мэй другие Сюбо Лю Данило Мандич Вэньу Ван Марк Пламбли	, , проект	02.12.2023
ТабПФН	Нейронная сеть, которая научилась прогнозировать табличные данные	Ной Холлманн Самуэль Мюллер Катарина Эггенспергер Фрэнк Хаттер	, , , , , сообщение в блоге	29.11.2023
Концептуальные слайдеры	Адаптеры низкого ранга Plug-and-Play, применяемые поверх предварительно обученных моделей	Рохит Гандикота Джоанна Матержиньска Тингруй Чжоу Антонио Торральба Дэвид Бау	, проект	26.11.2023
Квен-ВЛ	Набор крупномасштабных моделей языка видения, предназначенных для восприятия и понимания как текста, так и изображений.	Цзиньцзе Бай Шуай Бай Шушенг Ян Шицзе Ван другие Синан Тан Пэн Ван Цзюньян Линь Чанг Чжоу Цзинжэнь Чжоу	, , демо , , , , ,	24.11.2023
АнимеGANv3	Двойная генеративно-состязательная сеть для быстрой фотоанимации	Ган Лю Синь Чен	проект , , , , ,	23.11.2023
Итака	Первая глубокая нейронная сеть для текстового восстановления, географической и хронологической атрибуции древнегреческих надписей.	Яннис Ассаэль Тея Зоммершильд Брендан Шиллингфорд Махьяр Бордбар другие Джон Павлопулос Марита Хаципанагиоту Ион Андрутсопулос Джонатан Праг Нандо де Фрейтас	, проект	21.11.2023
PixArt-Σ	Обучение диффузионного преобразователя от слабого до сильного для преобразования текста в изображение 4K	Джунсонг Чен Чунцзянь Ге Энзе Се Юэ Ву другие Льюэй Яо Сяочжэ Рен Чжундао Ван Пин Ло Хучуань Лу Чжэньго Ли	, , , проект	07.11.2023
Ноль123++	Модель диффузии с кондиционированием изображения для создания 3D-согласованных многоракурсных изображений из одного входного изображения.	Руокси Ши Ханшэн Чен Чжоян Чжан Минхуа Лю другие Чао Сюй Синьюэ Вэй Линхао Чен Чонг Цзэн Хао Су	, ,	26.10.2023
УниФормерV2	Унифицированный преобразователь для эффективного обучения пространственно-временным представлениям	Куньчан Ли Яли Ван Инань Хэ Ичжуо Ли другие И Ван Лимин Ван Ю Цяо	, , , , , , ,	20.10.2023
Шоу-1	Гибридная модель, получившая название Show-1, которая объединяет VDM на основе пикселей и скрытых данных для генерации текста в видео.	Дэвид Цзюньхао Чжан Джей Чжанцзе Ву Цзявэй Лю Руй Чжао другие Лингмин Ран Ючао Гу Дифей Гао Майк Чжэн Шу	, , , , , проект	15.10.2023
Аудиосентябрь	Базовая модель для разделения аудиоисточников в открытой области с помощью запросов на естественном языке	Сюбо Лю Цюцян Конг Ян Чжао Хаохэ Лю другие И Юань Ючжуо Лю Руй Ся Юйсюань Ван Марк Пламбли Вэньу Ван	проект	12.10.2023
ДА-КЛИП	Модель языка видения, учитывающая деградацию, для лучшей передачи предварительно обученных моделей языка видения для задач машинного зрения низкого уровня в качестве универсальной основы для восстановления изображений.	Цивэй Луо Фредрик Густавссон Чжэн Чжао Йенс Шёлунд Томас Шен	проект	11.10.2023
SadTalker	Генерирует трехмерные коэффициенты движения 3DMM из аудио и неявно модулирует новый трехмерный рендеринг лица для генерации говорящей головы.	Вэньсюань Чжан Сяодун Цунь Сюань Ван Юн Чжан другие Си Шен Ю Го Ин Шань Фэй Ван	, , , , , , , проект , , ,	10.10.2023
Музыка	Система генерации музыки, которая может обучаться на сотнях часов музыки с использованием одного потребительского графического процессора и позволяет гораздо быстрее генерировать музыку произвольной длины в реальном времени на потребительском процессоре.	Марко Пасини Ян Шлютер	, данные , проект ,	09.10.2023
YOLOv6	Одноэтапная система обнаружения объектов, предназначенная для промышленного применения.	Кайхэн Венг Мэн Ченг Идуо Ли Сянсян Чу Сяолинь Вэй	, сообщение в блоге данные , , , , , ,	08.10.2023
DreamGaussian	Алгоритм преобразования 3D-гауссианов в текстурированные сетки и применения этапа тонкой настройки для уточнения деталей.	Цзясян Тан Цзявэй Рен Хан Чжоу Цивэй Лю Банда Цзэн	, , проект	04.10.2023
ИКОНА	Учитывая набор изображений, метод оценивает детальную трехмерную поверхность каждого изображения, а затем объединяет их в анимационный аватар.	Юлян Сю Цзиньлун Ян Димитриос Ционас Майкл Блэк	, , , , , , , проект	31.08.2023
ДИНОВов2	Создавайте высокопроизводительные визуальные функции, которые можно напрямую использовать с такими простыми классификаторами, как линейные слои, в различных задачах компьютерного зрения; эти визуальные функции надежны и хорошо работают в разных областях без необходимости тонкой настройки.	Максим Окуаб Тимоти Дарсе Тео Мутаканни Хай Во другие Марк Шафранец Василь Халидов Пьер Фернандес Дэниел Хазиза Франсиско Масса Алааэльдин Эль-Нуби Махмуд Асран Николас Баллас Войцех Галуба Рассел Хаус По-Яо Хуан Шан-Вэнь Ли Ишан Мишра Майкл Рэббат Васу Шарма Габриэль Синнев Ху Сюй Эрве Жегу Жюльен Майрал Патрик Лабатут Арман Жулен Петр Бояновский	сообщение в блоге демо , , ,	31.08.2023
СОВА-ВИТ	Простое обнаружение объектов с открытым словарем с помощью преобразователей зрения	Маттиас Миндерер Алексей Гриценко Остин Стоун Максим Нейман другие Дирк Вайсенборн Алексей Досовицкий Аравинд Махендран Анураг Арнаб Мостафа Дегани Чжуоран Шен Сяо Ван Сяохуа Чжай Томас Кипф Нил Хоулсби		21.08.2023
СтильGAN3	Генеративно-состязательные сети без псевдонимов	Теро Каррас Миика Айттала Самули Лайне Эрик Харконен другие Янне Хеллстен Яакко Лехтинен Тимо Айла	, , , , , , , , , проект	13.08.2023
FateZero	Метод редактирования текста с нулевым кадром для реальных видео без обучения каждому запросу или использования специальной маски.	Чэньян Ци Сяодун Цунь Юн Чжан Чэньян Лей другие Синьтао Ван Ин Шань Цифэн Чен	, , проект видео	13.08.2023
Большой ГАН	Крупномасштабное обучение GAN для высокоточного синтеза естественных изображений	Эндрю Брок Джефф Донахью Карен Симонян		03.08.2023
Лама	Устойчивое к разрешению окрашивание большой маски со свертками Фурье	Роман Суворов Елизавета Логачева Антон Машихин Анастасия Ремизова другие Арсений Ашуха Алексей Сильвестров Наэджин Конг Харшит Гока Кивунг Парк Виктор Лемпицкий	, , , проект	02.08.2023
MakeItTalk	Метод, который генерирует выразительные видео «говорящей головы» на основе одного изображения лица со звуком в качестве единственного входного сигнала.	Ян Чжоу Синьтун Хан Эли Шехтман Хосе Эчеваррия другие Евангелос Калогеракис Динзею Ли	данные проект	27.07.2023
ПриветДТ	Генеративная модель преобразования изображения в изображение и новая схема повышения дискретизации, которая позволяет применять перевод изображений с высоким разрешением.	Денис Корженков Глеб Стеркин Сергей Николенко Виктор Лемпицкий	проект ,	24.07.2023
КАТЛЕР	Простой подход к обучению моделей обнаружения и сегментации неконтролируемых объектов	Сюдун Ван Рохит Гирдхар Стелла Ю Ишан Мишра	, проект	24.07.2023
Распознавать что угодно и Tag2Text	Структура предварительной подготовки языка визуального представления, которая вводит теги изображений в модели визуального языка для управления изучением визуально-лингвистических функций.	Синьюй Хуан Юцай Чжан Цзинью Ма Чжаоян Ли другие Яньчунь Се Ючжуо Цинь Тонг Луо Яцянь Ли Яньдун Го Яньдун Го Лэй Чжан	, , проект, проект	07.09.2023
Модель сплайнового движения тонкой пластины	Комплексная неконтролируемая система передачи движения	Цзянь Чжао Хуэй Чжан	, , , поддержка	07.07.2023
ПеретащитеГАН	Перетащите свой GAN: интерактивное точечное манипулирование генеративным многообразием изображений	Синган Пан Аюш Тевари Томас Леймкюлер Линцзе Лю другие Абхимитра Мека Кристиан Теобальт	проект	07.03.2023
МобилСАМ	На пути к облегченному SAM для мобильных приложений	Чаонин Чжан Донгшен Хан Ю Цяо Юнг Ук Ким другие Сон-Хо Бэ Сынкю Ли Чунг Сон Хон	, , , , , , ,	30.06.2023
Заземление ДИНО	Объединение DINO с обоснованной предварительной тренировкой для обнаружения объектов открытого набора	Шилонг Лю Чжаоян Цзэн Тяньхэ Рен Фэн Ли другие Хао Чжан Цзе Ян Чунюань Ли Цзяньвэй Ян Ханг Су Цзюнь Чжу Лэй Чжан	, , , , , , , , , , , ,	28.06.2023
Т5Х	Модульная, компонуемая, удобная для исследований структура для высокопроизводительного, настраиваемого, самостоятельного обучения, оценки и вывода моделей последовательностей во многих масштабах.	Адам Робертс Хён Вон Чунг Ансельм Левская Гаурав Мишра другие Джеймс Брэдбери Дэниел Андор Шаран Наранг Брайан Лестер Колин Гаффни Афроз Мохиуддин Кертис Хоторн Айтор Левкович Алекс Салциану Марк ван Зее Джейкоб Остин Себастьян Гудман Ливио Бальдини Соарес Хайтан Ху Саша Цвященко Ааканша Чоудери Ясмейн Бастингс Яннис Булиан Ксавье Гарсия Цзянмо Ни Кэтлин Кенили Джонатан Кларк Дэн Гарретт Джеймс Ли-Торп Колин Раффель Ноам Шазир Марвин Риттер Мартен Босма Александр Пассос Джереми Мейтин-Шепард Ной Фидель Бреннан Саэта Райан Сепасси Александр Спиридонов Джошуа Ньюлан Андреа Джесмундо	, , , ,	27.06.2023
КодТалкер	Используйте речевую анимацию лица в качестве задачи запроса кода в конечном прокси-пространстве изученной кодовой книги, что эффективно повышает яркость генерируемых движений за счет уменьшения неопределенности кросс-модального отображения.	[Джинбо Син](Джинбо Син) Мэнхан Ся Юэчен Чжан Сяодун Цунь другие Цзюэ Ван Тянь-Цин Вонг	, , , , , , , , , , , , , , , проект	16.06.2023
Модель движения первого порядка для анимации изображений	Перенос мимики с видео на изображение	Александр Серохин	проект	04.06.2023
Параллельный WaveGAN	Современные неавторегрессивные модели для создания собственного великолепного вокодера	Томоки Хаяси	, , демо ,	01.06.2023
ЭКОНО	разработан для «оцифровки человека из цветного изображения», который сочетает в себе лучшие свойства неявных и явных представлений, чтобы получить высококачественные трехмерные изображения людей в одежде из изображений в дикой природе, даже в свободной одежде или в сложных позах.	Юлян Сю Цзиньлун Ян Сюй Цао Димитриос Ционас Майкл Блэк	, , , , , , , , ,	31.05.2023
ММС	Проект «Массовая многоязычная речь» расширяет речевую технологию со 100 до более чем 1000 языков за счет создания единой многоязычной модели распознавания речи, поддерживающей более 1100 языков, моделей идентификации языка, способных идентифицировать более 4000 языков, предварительно обученных моделей, поддерживающих более 1400 языков, и преобразования текста в речевые модели для более чем 1100 языков	Винил Пратап Андрос Тьяндра Боуэн Ши Паден Томаселло другие Арун Бабу Саяни Кунду Али Элькахки Чжаохэн Ни Апурв Вьяс Марьям Фазель-Заранди Алексей Баевский Йосси Ади Сяохуэй Чжан Вэй-Нин Сюй Алексис Конно Майкл Аули	, , ,	26.05.2023
ПОТРЯСАЮЩИЙ	Flow AIS Bootstrap использует AIS для генерации образцов в регионах, где поток плохо приближается к целевому, что облегчает обнаружение новых режимов.	Лоуренс Миджли Винсент Стимпер Грегор Н.К. Симм Бернхард Шёлкопф Хосе Мигель Эрнандес-Лобато	,	29.04.2023
КодБывший	Сеть прогнозирования на основе преобразователей для моделирования глобального состава и контекста лиц низкого качества для прогнозирования кода, что позволяет обнаруживать естественные лица, которые близко приближаются к целевым лицам, даже если входные данные сильно ухудшены.	Шанчен Чжоу Кельвин Чан Чонги Ли Чен Чэнг Лой	, , проект , , ,	21.04.2023
Text2Video-ноль	Модели диффузии текста в изображение — это генераторы видео с нулевым кадром	Левон Хачатрян Андраник Мовсисян Ваграм Тадевосян Роберто Хеншель другие Чжанъян Ван Шант Навасардян Хамфри Ши	, , , , , проект видео ,	11.04.2023
Сегментируйте что угодно	Модель Segment Anything создает высококачественные маски объектов из подсказок ввода, таких как точки или прямоугольники, и ее можно использовать для создания масок для всех объектов на изображении.	Александр Кириллов Эрик Минтун Никхила Рави Ханзи Мао другие Хлоя Роллан Лора Густафсон Тете Сяо Спенсер Уайтхед Алекс Берг Ван-Йен Ло Петр Доллар Росс Гиршик	данные , веб-сайт , ,	10.04.2023
Следуй за своей позой	Двухэтапная схема обучения, которая может использовать пары поз изображений и наборы видеоданных без поз, а также предварительно обученную модель преобразования текста в изображение для получения видео персонажей с управляемой позой.	Юэ Ма Инцин Хэ Сяодун Цунь Синьтао Ван другие Сиран Чен Ин Шань Сю Ли Цифэн Чен	, , , проект видео	07.04.2023
Ева3D	Высококачественная безусловная 3D-генеративная модель человека, для обучения которой требуются только коллекции 2D-изображений.	Фанчжоу Хун Чжаоси Чен Юши Лан Лян Пан Цивэй Лю	проект ,	06.04.2023
Стабильный Dreamfusion	Использование предварительно обученной 2D-модели диффузии текста в изображение для выполнения синтеза текста в 3D.	Цзясян Тан Бен Пул Аджай Джайн Джон Бэррон Бен Милденхолл	, проект , , ,	04.04.2023
ПИФуHD	Многоуровневая неявная функция с выравниванием по пикселям для оцифровки трехмерных изображений человека с высоким разрешением	Сюнсуке Сайто Томас Саймон Джейсон Сараги Ханбёль Джу	,	26.03.2023
ВидеоReTalking	Система для редактирования лиц реального видео говорящей головы в соответствии с входным звуком, создавая высококачественное выходное видео с синхронизацией губ даже с разными эмоциями.	Кун Ченг Сяодун Цунь Юн Чжан Мэнхан Ся другие Фэй Инь Минжуй Чжу Сюань Ван Цзюэ Ван Наньнан Ван	, , , , проект , ,	19.03.2023
Визуальный чатGPT	Соединяет ChatGPT и ряд моделей Visual Foundation, позволяя отправлять и получать изображения во время чата.	Чэньфэй Ву Шэнмин Инь Вэйчжэнь Ци Сяодун Ван другие Цзэчэн Тан Нан Дуань	, , , ,	15.03.2023
Настроить видео	Одноразовая настройка моделей распространения изображений для преобразования текста в видео	Джей Чжанцзе Ву Исяо Гэ Синьтао Ван Стэн Вэйсянь Лей другие Ючао Гу Юфей Ши Винн Сюй Ин Шань Сяоху Це Майк Чжэн Шу	, , , проект ,	23.02.2023
ГПЕН	Встроенная сеть GAN Prior для восстановления слепых лиц в дикой природе	Тао Ян Пейран Рен Сюаньсонг Се Лэй Чжан	демо ,	15.02.2023
ПиМАФ-X	Основанный на кегрессии подход к восстановлению параметрических моделей всего тела по монокулярным изображениям	Хунвэнь Чжан Ятинг Тянь Юйсян Чжан Мэнчэн Ли другие Лян Ань Чженань Сунь Ебин Лю	, , , , проект	14.02.2023
Дискотека Диффузия	Франкенштейновское объединение блокнотов, моделей и техник для создания искусственного интеллекта и анимации.	Макс Ингэм Адам Леттс Дэниел Рассел Чигози Нри	, ,	11.02.2023
ГруВАЭ	Некоторые приложения машинного обучения для создания и управления битами и игрой на барабанах	Джон Гиллик Адам Робертс Джесси Энгель	сообщение в блоге данные веб-приложение	02.02.2023
Многодорожечная музыкаVAE	Модели в этом ноутбуке способны кодировать и декодировать отдельные такты до 8 треков, опционально с учетом основного аккорда.	Ян Саймон Адам Робертс Колин Раффель Джесси Энгель другие Кертис Хоторн Дуглас Эк	сообщение в блоге	02.02.2023
МузыкаVAE	Иерархическая модель скрытого вектора для изучения долгосрочной структуры музыки	Адам Робертс Джесси Энгель Колин Раффель Кертис Хоторн Дуглас Эк	сообщение в блоге проект	02.02.2023
Учимся рисовать	Учимся рисовать с помощью глубокого обучения с подкреплением на основе моделей	Мануэль Ромеро		01.02.2023
Мгновенный NGP	Примитивы мгновенной нейронной графики с хеш-кодированием с несколькими разрешениями	Томас Мюллер Алекс Эванс Кристоф Шид Александр Келлер	сообщение в блоге , , , , проект учебник , , ,	18.01.2023
Сети признаков Фурье	Функции Фурье позволяют сетям изучать высокочастотные функции в низкоразмерных областях	Мэтью Танчик Пратул Шринивасан Бен Милденхолл Сара Фридович-Кейл другие Нитин Рагхаван Уткарш Сингхал Рави Рамамурти Джон Бэррон Рен Нг	, проект	17.01.2023
АльфаПоза	Региональная оценка и отслеживание позы всего тела нескольких человек в режиме реального времени	Хао-Шу Фанг Цзифэн Ли Хунъян Тан Чао Сюй другие Хаойи Чжу Юлян Сю Ён-Лу Ли Севу Лу	, проект , , ,	01.07.2023
ГибрИК	Гибридное аналитически-нейронное решение обратной кинематики для трехмерной оценки позы и формы человека	Цзифэн Ли Чао Сюй Чжицунь Чен Сиюань Бянь другие Лисинь Ян Севу Лу	проект поддержка	01.01.2023
Оценка якобианской цепочки	Примените цепное правило к изученным градиентам и выполните обратное распространение оценки диффузионной модели через якобиан дифференцируемого средства визуализации, экземпляр которого мы создаем как поле воксельного излучения.	Хаочэнь Ван Сяодань Ду Цзяхао Ли Раймонд Йе Грег Шахнарович	, проект ,	05.12.2022
Демукс	Гибридная спектрограмма и разделение источников сигналов	Александр Дефосс	, , , , , ,	21.11.2022
СтильCLIP	Текстовое управление StyleGAN Imager	Или Паташник Цзунцзе Ву Эли Шехтман Дэниел Коэн-Ор Дэни Лищински	, , , ,	30.10.2022
ДвижениеДиффузный	Первая платформа генерации текстовых движений на основе модели диффузии, которая демонстрирует несколько желаемых свойств по сравнению с существующими методами.	Мингюань Чжан Чжунган Цай Лян Пан Фанчжоу Хун другие Синьин Го Лэй Ян Цивэй Лю	проект	13.10.2022
VToonify	Использует слои StyleGAN среднего и высокого разрешения для рендеринга высококачественных художественных портретов на основе многомасштабных функций контента, извлеченных кодировщиком, для лучшего сохранения деталей кадра.	Шуай Ян Лиминг Цзян Цивэй Лю Чен Чэнг Лой	, , , , проект	07.10.2022
ПиМАФ	Выравнивание пирамидальной сетки. Цикл обратной связи в регрессионной сети для восстановления хорошо выровненной сетки тела и ее расширения для восстановления выразительных моделей всего тела.	Хунвэнь Чжан Ятинг Тянь Юйсян Чжан Мэнчэн Ли другие Лян Ань Чженань Сунь Ебин Лю	, , , , проект ,	06.10.2022
АльфаТензор	Открытие более быстрых алгоритмов умножения матриц с помощью обучения с подкреплением	Альхусейн Фаузи Матей Балог Аджа Хуанг Томас Юбер другие Бернардино Ромера-Паредес Мохаммадамин Барекатаин Александр Новиков Франсиско Руис Джулиан Шритвизер Гжегож Свирщ Дэвид Сильвер Демис Хассабис Пушмит Кохли	, , ,	04.10.2022
Свин2СР	Новый Swin Transformer V2 для улучшения SwinIR для обеспечения сверхразрешения изображений и, в частности, сценария сжатого ввода.	Маркос Конде Уи-Джин Чой Максим Бурчи Раду Тимофте	, , , , , , ,	03.10.2022
Функция	От данных к функциям: ваша точка данных — это функция, и вы можете относиться к ней как к функции.	Эмильен Дюпон Хюнджик Ким Али Эслами Данило Резенде Дэн Розенбаум	,	24.09.2022
Шепот	Система автоматического распознавания речи, обученная на 680 000 часов многоязычных и многозадачных контролируемых данных, собранных из Интернета.	Алек Рэдфорд Чон Ук Ким Тао Сюй Грег Брокман другие Кристин МакЛиви Илья Суцкевер	сообщение в блоге , ,	21.09.2022
ДеОлдифай (видео)	Раскрашивайте свои видео!	Джейсон Антик	, модель , веб-сайт ,	19.09.2022
ДеОлдифай (фото)	Раскрасьте свои фотографии!	Джейсон Антик Мэтт Робинсон Мария Бенавенте	, модель веб-сайт	19.09.2022
Реал-ESRGAN	Расширьте возможности ESRGAN до практического приложения для восстановления, которое обучается на чистых синтетических данных.	Синьтао Ван Лянбинь Се Чао Донг Ин Шань	, , , ,	18.09.2022
IDE-3D	Интерактивное распутанное редактирование для синтеза портретов высокого разрешения с поддержкой 3D	Цзинсян Сунь Сюань Ван Ичунь Ши Лижен Ван другие Цзюэ Ван Ебин Лю	, , ,	08.09.2022
Трансформаторы решений	Архитектура, которая рассматривает проблему RL как модель условной последовательности. Расширять Дополнительная информация Версия 1.0.0 Тип Другой исходный код Время обновления 2024-12-27 размер 804.02KB От Github Связанные приложения awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 Потрясающая игра про дьявола 2023-04-16 Потрясающая реклама 2022-08-08 Рекомендуем вам chat.petals.dev Другой исходный код 1.0.0 GPT Prompt Templates Другой исходный код 1.0.0 GPTyped Другой исходный код GPTyped 1.0.5 waymo open dataset Другой исходный код December 2023 Update SmartTube Другой исходный код 24.71 Stable Sunamu Другой исходный код Release 2.2.0 waymo open dataset Другой исходный код December 2023 Update termwind Другие категории v2.3.0 wp functions Другие категории 1.0.0 Связанные новости Все Как исправить заикание в «Сталкер 2: Сердце Чернобыля» 2024-11-23 Где находится Juice WRLD в Fortnite? 2024-11-23 Как начать расширение Wild Card в Star Wars Outlaws 2024-11-23 Пекин открывает новое научно-исследовательское учреждение для улучшения безопасности искусственного интеллекта и схемы управления 2024-11-22 В Шанхае открылся семинар, на котором присутствовал Гутерриш, а предложение Китая о сотрудничестве в укреплении потенциала искусственного интеллекта было принято Генеральной Ассамблеей Организации Объединенных Наций. 2024-11-22 Создайте систему искусственного интеллекта, чтобы найти наиболее эффективный лизоцим. 2024-11-22 Крупные модели искусственного интеллекта вступают в первый год применения. Финансовые учреждения активизируют свои усилия по созданию новой экосистемы интеллектуальных вычислительных мощностей. 2024-11-22 MiniMax Ян Цзюньцзе: Быстрота хороша для больших моделей, но иногда медленная просто необходима для того, чтобы быть быстрее. 2024-11-22 Искусственный интеллект проникает в кампус, чтобы воплотить в жизнь научные мечты студентов 2024-11-22 Искусственный интеллект активизирует потребительское производство, а фитнес-оборудование Yongkang хорошо продается на внутреннем и внешнем рынках. 2024-11-22 Nvidia инвестирует в финансирование серии B Sakana AI, чтобы помочь в разработке генеративного искусственного интеллекта 2024-11-22 ИИ открывает новую когнитивную революцию! Универсальное чтение общего курса новой науки и техники, график развития искусственного интеллекта: создание видео в 2028 году, написание бестселлера в 2049 году... 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]