Обновление: наша статья была принята на брифинги по биоинформатике!
Репозиторий обзорного документа «Обзор генеративного ИИ для открытия лекарств de novo : новые рубежи в дизайне молекул и белков».
Сянжу Тан 1 *, Ховард Дай 1 *, Элизабет Найт 1 *, Юньян Ли 1 , Фан Ву 2 , Тяньсяо Ли 1 , Марк Герштейн 1
1. Йельский университет; 2. Стэнфордский университет
(*: Равный вклад)
[**] обозначает разделы приложения.
Раздел | Подраздел | Наборы данных | Метрики | Модели |
---|---|---|---|---|
Молекула | Целевое независимое поколение | Наборы данных | Метрики | Модели |
Молекула | Целевое поколение | Наборы данных | Метрики | Модели |
Молекула | Генерация конформации** | Наборы данных | Метрики | Модели |
Белок | Обучение представлению** | Наборы данных | Модели | |
Белок | Прогнозирование структуры | Наборы данных | Метрики | Модели |
Белок | Генерация последовательности | Наборы данных | Метрики | Модели |
Белок | Проектирование магистральной сети | Наборы данных | Метрики | Модели |
антитело | Обучение представлению** | Наборы данных | Модели | |
антитело | Прогноз структуры** | Наборы данных | Метрики | Модели |
антитело | Генерация CDR** | Наборы данных | Метрики | Модели |
Пептид | Разное. Задачи** | Модели |
@article{tang2024survey,
title={A survey of generative ai for de novo drug design: new frontiers in molecule and protein generation},
author={Tang, Xiangru and Dai, Howard and Knight, Elizabeth and Wu, Fang and Li, Yunyang and Li, Tianxiao and Gerstein, Mark},
journal={Briefings in Bioinformatics},
volume={25},
number={4},
year={2024},
publisher={Oxford Academic}
}
Обзор тем, затронутых в нашей статье. Разделы, выделенные синим цветом, можно найти в основном тексте, а фиолетовые разделы — это расширенные разделы, находящиеся в приложении.
Квантовохимические структуры и свойства 134 килограммовых молекул (QM9)
Рагунатан Рамакришнан, Павел О. Драл, Матиас Рупп, О. Анатоль фон Лилиенфельд
Научные данные (2014)
GEOM, молекулярные конформации с энергетической аннотацией для предсказания свойств и генерации молекул (GEOM)
Саймон Аксельрод, Рафаэль Гомес-Бомбарелли
Научные данные (2022 г.)
Автоматический химический дизайн с использованием непрерывного представления молекул на основе данных (CVAE)
Рафаэль Гомес-Бомбарелли, Дженнифер Н. Вей, Давид Дювено, ХосеМигель Эрнандес-Лобато, Бенхамин Санчес-Ленгелинг, Деннис Шеберла, Хорхе Агилера-Ипаррагирре, Тимоти Д. Хирзель, Райан П. Адамс и Алан Аспуру-Гузик
Центральная наука ACS (2018)
Грамматический вариационный автоэнкодер (GVAE)
Мэтт Дж. Каснер, Брукс Пейдж, Хосе Мигель Эрнандес-Лобато
МКМЛ 2017
Вариационный автокодировщик с синтаксическим управлением для структурированных данных (SD-VAE)
Ханджун Дай, Интао Тянь, Бо Дай, Стивен Скиена, Ле Сонг
ИКЛР 2018
Вариационный автоэнкодер соединительного дерева для генерации молекулярных графов (JT-VAE)
Венгонг Джин, Регина Барзилай, Томми Яаккола
МКМЛ 2018
E(n) Эквивариантные нормализующие потоки (E-NF)
Виктор Гарсия Саторрас, Эмиэль Хугебум, Фабиан Фукс, Ингмар Познер, Макс Веллинг
НейрИПС 2021
Адаптированное к симметрии создание наборов трехмерных точек для целенаправленного открытия молекул (G-SchNet)
Никлас Гебауэр, Михаэль Гастеггер, Кристоф Шютт
НейрИПС 2019
Эквивариантная диффузия для генерации молекул в 3D (EDM)
Эмиэль Хугебум, Виктор Гарсиа Саторрас, Клеман Виньяк, Макс Веллинг
МКМЛ 2022
Полная геометрия диффузии для генерации и оптимизации трехмерных молекул (GCDM)
Алекс Морхед, Цзяньлинь Ченг
arXiv:2302.04313 (2023)
MDM: Модель молекулярной диффузии для генерации трехмерных молекул (MDM)
Лэй Хуан, Хэнтун Чжан, Тинъян Сюй, Ка-Чун Вонг
АААИ 2023
Геометрические модели скрытой диффузии для генерации трехмерных молекул (GeoLDM)
Минкай Сюй, Александр С. Пауэрс, Рон О. Дрор, Стефано Эрмон, Юре Лесковец
МКМЛ 2023
Изучение совместных 2D и 3D моделей диффузии для полной генерации молекул (JODO)
Хан Хуан, Лейлей Сунь, Боуэн Ду, Вэйфэн Лв
arXiv:2305.12347 (2023)
MiDi: смешанный график и трехмерная диффузия с шумоподавлением для генерации молекул (MiDi)
Клеман Виньяк, Нагам Осман, Лаура Тони, Паскаль Фроссар
arXiv:2302.09048 (2023)
Трехмерные сверточные нейронные сети и набор перекрестных данных для структурно-ориентированного дизайна лекарств (CrossDocked2020)
Пол Дж. Франкёр, Томохиде Масуда, Джоселин Сансери, Эндрю Цзя, Ричард Б. Йованиски, Ян Снайдер, Дэвид Р. Коес
АСУ JCIM 2020
ZINC20 — бесплатная сверхкрупномасштабная химическая база данных для открытия лигандов (ZINC20)
Джон Дж. Ирвин, Хан Дж. Тан, Дженнифер Янг, Чинзориг Дандарчулуун, Бенджамин Р. Вонг, Мункхзул Хурелбаатар, Юрий С. Мороз, Джон Мэйфилд, Роджер А. Сэйл
АСУ JCIM 2020
Привязка MOAD (Мать всех баз данных) (Привязка MOAD)
Лиеги Ху, Марк Л. Бенсон, Ричард Д. Смит, Майкл Дж. Лернер, Хизер А. Карлсон
Белки 2005
AutoDock Vina: Повышение скорости и точности стыковки с помощью новой функции подсчета очков, эффективной оптимизации и многопоточности (Vina AutoDock)
Олег Тротт, Артур Дж. Олсон
ОКК 2010
Количественная оценка химической красоты лекарств (QED) Дж. Ричард Бикертон, Гайя В. Паолини, Жереми Беснар, Сорел Муресан, Эндрю Л. Хопкинс
Химия природы (2012)
Оценка показателя синтетической доступности лекарствоподобных молекул на основе молекулярной сложности и вклада фрагментов (SAScore)
Питер Эртл, Журнал хеминформатики Ансгара Шуффенхауэра, 2009 г.
DrugGPT: стратегия на основе GPT для разработки потенциальных лигандов, нацеленных на определенные белки (DrugGPT)
Юэсень Ли, Чэнъи Гао, Синь Сун, Сянъюй Ван, Юнган Сюй, Суся Хань
биоRxiv (2023)
Создание трехмерных молекулярных структур, обусловленных сайтом связывания рецептора, с помощью глубоких генеративных моделей (LiGAN)
Томохидэ Масуда, Мэттью Рагоза, Дэвид Райан Коес
arXiv:2010.14442 (2020)
Pocket2Mol: эффективный молекулярный отбор проб на основе трехмерных белковых карманов (Pocket2Mol)
Синган Пэн, Шитун Луо, Цзяци Гуань, Ци Се, Цзянь Пэн, Цзяньчжу Ма
МКМЛ 2022
Генеративная 3D-модель для разработки лекарств на основе структуры
Шитун Ло, Цзяци Гуань, Цзяньжу Ма, Цзянь Пэн
НейрИПС 2021
3D-эквивариантная диффузия для генерации молекул с учетом цели и прогнозирования сродства (TargetDiff)
Цзяци Гуань, Уэсли Вэй Цянь, Синган Пэн, Юфэн Су, Цзянь Пэн, Цзяньчжу Ма
ICLR 2023
Структурно-ориентированный дизайн лекарств с использованием эквивариантных диффузионных моделей (DiffSBDD)
Арне Шнойинг, Юаньци Ду, Чарльз Харрис, Ариан Ямасб, Илья Игашов, Вейтао Ду, Том Бланделл, Пьетро Лио, Карла Гомес, Макс Веллинг, Майкл Бронштейн, Бруно Коррейя
arXiv:2210.13695 (2022)
GEOM, молекулярные конформации с энергетической аннотацией для прогнозирования свойств и генерации молекул (GEOM)
Саймон Аксельрод, Рафаэль Гомес-Бомбарелли
Научные данные 2022 г.
SchNet: сверточная нейронная сеть с непрерывным фильтром для моделирования квантовых взаимодействий (ISO17).
Кристоф Шютт, Питер-Ян Киндерманс, Хузиэль Энок Сауседа Феликс, Стефан Хмиела, Александр Ткаченко, Клаус-Роберт Мюллер
НейрИПС 2017
Прогнозирование молекулярной геометрии с использованием нейронной сети с глубокими генеративными графами (CVGAE)
Эльман Мансимов, Омар Махмуд, Кан Сохо, Чо Кёнхён
Научные отчеты 2019
Генеративная модель для молекулярной дистанционной геометрии (GraphDG)
Грегор Н.К. Симм, Хосе Мигель Эрнандес-Лобато
МКМЛ 2020
Изучение нейронной генеративной динамики для генерации молекулярных конформаций (CGCF)
Минкай Сюй, Шитонг Ло, Йошуа Бенгио, Цзянь Пэн, Цзянь Тан
ICLR 2021
GeoMol: крутильно-геометрическое создание молекулярных ансамблей трехмерных конформеров (GeoMol)
Октавиан Ганеа, Лагнажит Паттанаик, Коннор Коли, Регина Барзилай, Клавс Йенсен, Уильям Грин, Томми Яаккола
НейрИПС 2021
Изучение градиентных полей для генерации молекулярных конформаций (ConfGF)
Чэнс Ши, Шитонг Ло, Минкай Сюй, Цзянь Тан
МКМЛ 2021
Прогнозирование молекулярной конформации с помощью сопоставления показателей динамического графика (DGSM)
Шитонг Ло, Чэнс Ши, Минкай Сюй, Цзянь Тан
НейрИПС 2021
GeoDiff: геометрическая модель диффузии для генерации молекулярных конформаций (GeoDiff)
Минкай Сюй, Лантао Ю, Ян Сун, Чэнс Ши, Стефано Эрмон, Цзянь Тан
ICLR 2022
UniProt: универсальная база знаний по белкам (UniProt)
Рольф Апвейлер, Амос Байрох, Кэти Х. Ву, Вайнона С. Баркер, Бриджит Бёкманн, Серенелла Ферро, Элизабет Гастайгер, Хунжан Хуанг, Родриго Лопес, Мишель Магран, Мария Дж. Мартин, Даррен А. Натале, Клэр О'Донован, Николь Редаски, Лай-Су Л. Йе
Исследования нуклеиновых кислот 2004 г.
OntoProtein: предварительная тренировка белка с внедрением онтологии генов (ProteinKG)
Ниню Чжан, Чжэнь Би, Сяочжуань Лян, Сиюань Чэн, Хаосен Хун, Шумин Дэн, Цзячжан Лянь, Цян Чжан, Хуацзюнь Чен
ICLR 2022
Банк данных белков (PDB)
Хелен М. Берман, Джон Уэстбрук, Зуканг Фэн, Гэри Гиллиланд, Т. Н. Бхат, Хельге Вайсиг, Илья Н. Шиндьялов, Филип Э. Борн
Исследования нуклеиновых кислот 2000 г.
База данных структуры белков AlphaFold: массовое расширение структурного охвата пространства белковых последовательностей с помощью моделей высокой точности (AlphaFoldDB)
Михай Варади, Стивен Аньянго, Мандар Дешпанде, Шринат Наир, Синди Натассиа, Галабина Йорданова, Дэвид Юан, Оана Строу, Джемма Вуд, Агата Лэйдон, Огюстин Жидек, Тим Грин, Кэтрин Туньясувунакул, Стиг Петерсен, Джон Джампер, Эллен Клэнси, Ричард Грин , Анкур Вора, Мира Лютфи, Михаил Фигурнов, Эндрю Коуи, Николь Хоббс, Пушмит Кохли, Джерард Клейвегт, Юэн Бирни, Демис Хассабис, Самир Веланкар
Исследования нуклеиновых кислот 2022
Pfam: база данных семейств белков в 2021 году (Pfam)
Джайна Мистри, Сара Чугурански, Лоури Уильямс, Мэтлуб Куреши, Густаво А. Салазар, Эрик Л.Л. Зоннхаммер, Сильвио С.Э. Тосатто, Лисанна Паладин, Шрия Радж, Лорна Дж. Ричардсон, Роберт Д. Финн, Алекс Бейтман
Исследования нуклеиновых кислот 2021
Унифицированная рациональная белковая инженерия с глубоким обучением представлению на основе последовательностей (UniRep)
Итан К. Элли, Григорий Химуля, Суроджит Бисвас, Мохаммед Аль-Курайши, Джордж М. Чёрч
Природные методы 2019
Prottrans: На пути к пониманию языка жизни посредством самостоятельного обучения (ProtBERT)
Ахмед Эльнаггар, Майкл Хайнцингер, Кристиан Даллаго, Галия Рехави, Ю Ван, Ллайон Джонс, Том Гиббс, Тамас Фехер, Кристоф Ангерер, Мартин Штайнеггер, Дебсинду Бхоумик и Буркхард Рост
IEEE ПАМИ 2021
Биологическая структура и функция возникают в результате масштабирования неконтролируемого обучения до 250 миллионов белковых последовательностей (ESM-1b).
Александр Райвс, Джошуа Мейер, Том Серку, Сиддхарт Гоял, Земин Лин, Джейсон Лью, Деми Го, Майл Отт, К. Лоуренс Зитник, Джерри Ма, Роб Фергюс
ПНАС 2021
Трансформатор МСА (Трансформатор МСА)
Рошан М. Рао, Джейсон Лью, Роберт Веркуил, Джошуа Мейер, Джон Кэнни, Питер Аббил, Том Серку, Александр Райвс
МКМЛ 2021
Увеличение полученной последовательности для обучения представлению белков (RSA)
Чан Ма, Хайтен Чжао, Линь Чжэн, Цзяи Синь, Циньтун Ли, Лицзюнь Ву, Чжихун Дэн, Ян Лу, Ци Лю, Линпэн Конг
биоRxiv (2023)
OntoProtein: предварительная подготовка белка с внедрением онтологии генов (OntoProtein)
Ниню Чжан, Чжэнь Би, Сяочжуань Лян, Сиюань Чэн, Хаосен Хун, Шумин Дэн, Цзячжан Лянь, Цян Чжан, Хуацзюнь Чен
ICLR 2022
Изучение представления белков посредством моделирования первичной структуры с расширенными знаниями (KeAP)
Хун-Ю Чжоу, Юньсян Фу, Чжичэн Чжан, Чэн Бянь, Ичжоу Юй
биоRxiv (2023)
Внутренняя-внешняя свертка и объединение для обучения трехмерным белковым структурам (IEConv)
Педро Эрмосилья, Марко Шефер, Матей Ланг, Глория Факельманн, Пере Пау Васкес, Барбора Козликова, Михаэль Кроне, Тобиас Ритчел, Тимо Ропински
ICLR 2021
Прогнозирование функций белка на основе структуры с использованием сверточных сетей графов (DeepFRI)
Владимир Глигоревич, П. Дуглас Ренфрю, Томаш Косциолек, Джулия Келер Леман, Дэниел Беренберг, Томми Ватанен, Крис Чендлер, Брин С. Тейлор, Йен М. Фиск, Гера Вламакис, Рамник Дж. Ксавьер, Роб Найт, Кёнхён Чо, Ричард Бонно
Природные коммуникации 2021
Обучение представлению белков посредством предварительной тренировки геометрической структуры (GearNET)
Цзобай Чжан, Минхао Сюй, Ариан Джамасб, Виджил Чентамаракшан, Орели Лозано, Пайел Дас, Цзянь Тан
arXiv:2203.06125 (2022)
Банк данных белков (PDB)
Хелен М. Берман, Джон Уэстбрук, Зуканг Фэн, Гэри Гиллиланд, Т. Н. Бхат, Хельге Вайсиг, Илья Н. Шиндьялов, Филип Э. Борн
Исследования нуклеиновых кислот 2000 г.
Критическая оценка методов прогнозирования структуры белков (CASP) — раунд XIV (CASP14)
Андрей Крыштафович, Торстен Шведе, Майя Топф, Кшиштоф Фиделис, Джон Моулт
Белки 2021
Непрерывная автоматизированная оценка модели (CAMEO), дополняющая критическую оценку прогнозирования структуры в CASP12 (CAMEO)
Юрген Хаас, Алессандро Барбато, Дарио Берингер, Габриэль Штудер, Стивен Рот, Мартино Бертони, Халед Мостагир, Рафал Гумиенни, Торстен Шведе
Белки 2017
LGA: метод поиска 3D-сходств в белковых структурах (GDT-TS)
Адам Земла
Нуклеиновые кислоты 2003 г.
Функция оценки для автоматической оценки качества шаблона структуры белка (TM-score)
Ян Чжан, Джеффри Сколник
Белки 2004
lDDT: локальная оценка без суперпозиции для сравнения белковых структур и моделей с использованием тестов на разницу расстояний (lDDT).
Валерио Мариани, Марко Биазини, Алессандро Барбато, Торстен Шведе
Биоинформатика 2013
Высокоточное предсказание структуры белка с помощью AlphaFold (AlphaFold)
Джон Джампер, Ричард Эванс, Александр Притцель, Тим Грин, Майкл Фигурнов, Олаф Роннебергер, Кэтрин Туньясувунакул, Расс Бейтс, Огюстин Жидек, Анна Потапенко, Алекс Бриджланд, Клеменс Мейер, Саймон А.А. Коль, Эндрю Дж. Баллард, Эндрю Коуи, Бернардино Ромера -Паредес, Станислав Николов, Ришуб Джайн, Йонас Адлер, Тревор Бэк, Стиг Петерсен, Дэвид Рейман, Эллен Клэнси, Михал Зелински, Мартин Штайнеггер, Михалина Пачольска, Тамаш Бергаммер, Себастьян Боденштейн, Дэвид Сильвер, Ориол Виньялс, Эндрю В. Сениор, Корай Кавукчуоглу, Пушмит Кохли, Демис Хассабис
Природа 2021)
Сервер trRosetta для быстрого и точного прогнозирования структуры белков (trRosetta)
Цзунъян Ду, Хун Су, Венкай Ван, Лиша Е, Хун Вэй, Чжэньлин Пэн, Иван Анищенко, Дэвид Бейкер, Цзяньи Ян Nature Protocols 2021
Точное предсказание белковых структур и взаимодействий с использованием трехдорожечной нейронной сети (RoseTTAFold)
Минкьюнг Пэк, Фрэнк ДиМайо, Иван Анищенко, Юстас Даупарас, Сергей Овчинников, Гю Ри Ли, Джу Ван, Цянь Конг, Лиза Н. Кинч, Р. Дастин Шеффер, Клаудия Миллан, Ханбеом Пак, Карсон Адамс, Калеб Р. Глассман, Энди ДеДжованни, Хосе Х. Перейра, Андрия В. Родригес, Альбердина А. ван Дейк, Ана К. Эбрехт, Дидерик Дж. Опперман, Тео Сагмайстер, Кристоф Бюлхеллер, Теа Павков-Келлер, Манодж К. Ратинасвами, Удит Далвади, Кэлвин К. Йип, Джон Э. Берк, К. Кристофер Гарсия, Ник В. Гришин, Пол Д. Адамс, Рэнди Дж. Рид, Дэвид Бейкер
Наука 2021
Эволюционное предсказание структуры белка на атомном уровне с помощью языковой модели (ESMFold)
Земин Линь, Халил Акин, Рошан Рао, Брайан Хи, Чжункай Чжу, Вентинг Лу, Никита Сметанин, Роберт Веркуил, Ори Кабели, Янив Шмуэли, Аллан душ Сантос Коста, Марьям Фазель-Заранди, Том Серку, Сальваторе Кандидо, Александр Ривс
Наука 2023
EigenFold: прогнозирование генеративной структуры белка с помощью диффузионных моделей (EigenFold)
Боуэн Цзин, Эзра Эривз, Питер Пао-Хуан, Габриэле Корсо, Бонни Бергер, Томми Яаккола
arXiv:2304.02198 (2023)
Банк данных белков (PDB)
Хелен М. Берман, Джон Уэстбрук, Зуканг Фэн, Гэри Гиллиланд, Т. Н. Бхат, Хельге Вайсиг, Илья Н. Шиндьялов, Филип Э. Борн
Исследования нуклеиновых кислот 2000 г.
UniProt: база знаний Universal Protein (UniRef/UniParc)
Рольф Апвейлер, Амос Байрох, Кэти Х. Ву, Вайнона С. Баркер, Бриджит Бёкманн, Серенелла Ферро, Элизабет Гастайгер, Хунжан Хуанг, Родриго Лопес, Мишель Магран, Мария Дж. Мартин, Даррен А. Натале, Клэр О'Донован, Николь Редаски, Лай-Су Л. Йе
Исследования нуклеиновых кислот 2004 г.
CATH: комплексные структурные и функциональные аннотации последовательностей генома (CATH)
Иэн Силлито, Тони Э. Льюис, Элисон Кафф, Сайони Дас, Пол Эшфорд, Натали Л. Доусон, Николас Фернэм, Роман А. Ласковски, Дэвид Ли, Джонатан Дж. Лис, Соня Лехтинен, Ромен А. Студер, Джанет Торнтон, Кристина А. Оренго
Исследование нуклеиновых кислот 2015 г.
Прямое предсказание профилей последовательностей, совместимых со структурой белка, с помощью нейронных сетей с локальными и энергетическими нелокальными профилями на основе фрагментов (TS500)
Чжисю Ли, Юэдун Ян, Эшель Фарагги, Цзянь Чжань и Яоци Чжоу
Белки 2014
ProteinVAE: вариационный автоэнкодер для трансляционного дизайна белков (ProteinVAE)
Суюэ Лю, Шахин Солати-Хашджин, Майкл Гартон
биоRxiv (2023)
ProT-VAE: вариационный автоэнкодер белкового преобразователя для функционального проектирования белков (ProT-VAE)
Эмре Севген, Джошуа Моллер, Адриан Ланге, Джон Паркер, Шон Куигли, Джефф Майер, Пунам Шривастава, Ситарам Гаятри, Дэвид Хосфилд, Мария Коршунова, Миша Ливн, Мишель Гилл, Рама Ранганатан, Энтони Б. Коста, Эндрю Л. Фергюсон
биоRxiv (2023)
Расширение пространства функциональных белковых последовательностей с использованием генеративно-состязательных сетей (ProteinGAN)
Донатас Репецка, Викинтас Яунишкис, Лауринас Карпус, Эльжбета Рембеза, Ирмантас Рокайтис, Ян Жримец, Симона Повилонене, Аудрюс Лауриненас, Сандра Викнандер, Виссам Абуайва, Отто Саволайнен, Роландас Мескис, Мартин К.М. Энгквист, Алексей Железняк
Природный машинный интеллект (2021)
Быстрый и гибкий дизайн белков с использованием нейронных сетей с глубокими графами (ProteinSolver)
Алексей Строкач, Давид Бесерра, Карлес Корби-Верж, Альберт Перес-Риба, Филип М. Ким
Клеточные системы 2020
PiFold: На пути к эффективному и действенному обратному сворачиванию белка (PiFold)
Чжанъян Гао, Ченг Тан, Стэн З. Ли
ICLR 2023
Дизайн белковой последовательности с изученным потенциалом
Намрата Ананд, Рафаэль Эгучи, Иримпан И. Мэтьюз, Карла П. Перес, Александр Дерри, Расс Б. Альтман, По-Су Хуанг
Природные коммуникации 2022
Дизайн белковых последовательностей без ротамеров на основе глубокого обучения и самосогласованности (ABACUS-R)
Лю Юфэн, Лу Чжан, Вэйлунь Ван, Мин Чжу, Чэньчэнь Ван, Фудун Ли, Цзяхай Чжан, Хоуцян Ли, Цюань Чен, Хайян Лю
Природа Вычислительная наука 2022
ProRefiner: основанная на энтропии стратегия очистки для обратного сворачивания белков с глобальным вниманием к графу (ProRefiner)
Синьи Чжоу, Гуанъюн Чен, Цзюньцзе Е, Эрченг Ван, Цзюнь Чжан, Конг Мао, Чжаньвэй Ли, Цзянье Хао, Синсюй Хуан, Цзинь Тан, Фэн Энн Хэн
Природные коммуникации 2023
Граформер руководил методом проектирования белков de novo и проверкой их функций (GPD)
Цзюньси Му, Чжэнсинь Ли, Бо Чжан, Ци Чжан, Джамшед Икбал, Абдул Вадуд, Тин Вэй, Ян Фэн, Хай-Фэн Чен
Брифинги по биоинформатике 2024
Изучение структуры белка с помощью геометрических векторных перцептронов (GVP-GNN)
Боуэн Цзин, Стефан Айсманн, Патриция Суриана, Рафаэль Джон Ламарр Тауншенд, Рон Дрор
ICLR 2021
Изучение обратного сворачивания на основе миллионов предсказанных структур (ESM-IF1)
Хлоя Сюй, Роберт Веркуил, Джейсон Лью, Земин Линь, Брайан Хи, Том Серку, Адам Лерер, Александр Райвс
МКМЛ 2022
Надежный дизайн белковых последовательностей на основе глубокого обучения с использованием ProteinMPNN (ProteinMPNN)
Дж. Даупарас, И. Анищенко, Н. Беннетт, Х. Бай, Р. Дж. Раготт, Л. Ф. Миллес, БИМ Вики, А. Курбе, Р. Дж. де Хаас, Н. Бетел, П. Дж. Люнг, Т. Ф. Хадди, С. Пеллок, Д. Тишер, Ф. Чан, Б. Кепник, Х. Нгуен, А. Канг, Б. Шанкаран, А. К. Бера, Н. П. Кинг, Д. Бейкер
Наука 2022
Банк данных белков (PDB)
Хелен М. Берман, Джон Уэстбрук, Зуканг Фэн, Гэри Гиллиланд, Т. Н. Бхат, Хельге Вайсиг, Илья Н. Шиндьялов, Филип Э. Борн
Исследования нуклеиновых кислот 2000 г.
База данных структуры белков AlphaFold: массовое расширение структурного охвата пространства белковых последовательностей с помощью моделей высокой точности (AlphaFoldDB)
Михай Варади, Стивен Аньянго, Мандар Дешпанде, Шринат Наир, Синди Натассиа, Галабина Йорданова, Дэвид Юан, Оана Строу, Джемма Вуд, Агата Лэйдон, Огюстин Жидек, Тим Грин, Кэтрин Туньясувунакул, Стиг Петерсен, Джон Джампер, Эллен Клэнси, Ричард Грин , Анкур Вора, Мира Лютфи, Михаил Фигурнов, Эндрю Коуи, Николь Хоббс, Пушмит Кохли, Джерард Клейвегт, Юэн Бирни, Демис Хассабис, Самир Веланкар
Исследования нуклеиновых кислот 2022
SCOP: База данных структурной классификации белков для исследования последовательностей и структур (SCOP).
Алексей Г. Мурзин, Стивен Э. Бреннер, Тим Хаббард, Сайрус Чотиа JMB 1995 г.
SCOPe: улучшения структурной классификации белков – расширенная база данных для облегчения интерпретации вариантов и машинного обучения (SCOPe)
Джон-Марк Чандония, Линдси Гуан, Шианги Линь, Чанхуа Ю, Наоми К. Фокс, Стивен Э. Бреннер Исследование нуклеиновых кислот 2022
CATH: комплексные структурные и функциональные аннотации последовательностей генома (CATH)
Иэн Силлито, Тони Э. Льюис, Элисон Кафф, Сайони Дас, Пол Эшфорд, Натали Л. Доусон, Николас Фернэм, Роман А. Ласковски, Дэвид Ли, Джонатан Дж. Лис, Соня Лехтинен, Ромен А. Студер, Джанет Торнтон, Кристина А. Оренго
Исследование нуклеиновых кислот 2015 г.
Диффузионно-вероятностное моделирование белковых остовов в 3D для задачи построения мотивов (ProtDiff)
Брайан Л. Трипп, Джейсон Йим, Даг Тишер, Дэвид Бейкер, Тамара Бродерик, Регина Барзилай, Томми Яаккола
ICLR 2023
Генерация белковой структуры посредством фолдинг-диффузии (FoldingDiff)
Кевин Э. Ву, Кевин К. Янг, Рианна ван ден Берг, Сара Аламдари, Джеймс Ю. Зоу, Алекс X. Лу, Ава П. Амини
Природные коммуникации 2024
Модель скрытой диффузии для создания структуры белка (LatentDiff)
Конг Фу, Кэцян Янь, Ван Лимей, Винг Йи Ау, Майкл МакТроу, Тао Комикадо, Кодзи Марухаси, Кандзи Учино, Сяонин Цянь, Шуйван Цзи
Лог 2023
Создание новых, проектируемых и разнообразных белковых структур путем эквивариантной диффузии ориентированных облаков остатков (Genie)
Йецин Линь, Мохаммед Аль-Курайши
arXiv:2301.12485 (2023)
Диффузионная модель SE (3) с применением к генерации белкового остова (FrameDiff)
Джейсон Йим, Брайан Л. Трипп, Валентин Де Бортоли, Эмиль Матье, Арно Дусе, Регина Барзилай, Томми Яаккола
МКМЛ 2023
Разработка структуры и функций белка de novo с помощью RFdiffusion (RFDiffusion)
Джозеф Л. Уотсон, Дэвид Юргенс, Натаниэль Р. Беннетт, Брайан Л. Трипп, Джейсон Йим, Хелен Э. Эйзенах, Вуди Ахерн, Эндрю Дж. Борст, Роберт Дж. Раготт, Лукас Ф. Миллес, Бэзил М. Вики, Никита Ханикель , Сэмюэл Дж. Пеллок, Алексис Курбе, Уильям Шеффлер, Джу Ван, Притам Венкатеш, Исаак Саппингтон, Сусана Васкес Торрес, Анна Лауко, Валентин Де Бортоли, Эмиль Матье, Сергей Овчинников, Регина Барзилай, Томми С. Яаккола, Фрэнк ДиМайо, Минкьюнг Пэк, Дэвид Бэйкер
Природа 2023
Модель белкового языка контролирует точный и эффективный метод проектирования белкового остова (GPDL)
Бо Чжан, Кэсинь Лю, Чжуоци Чжэн, Юнфэйян Лю, Цзюньси Му, Тин Вэй, Хай-Фэн Чен
биоRxiv (2023)
Совместный дизайн последовательности и структуры белка на основе мотивов (GeoPro)
Чжэньцяо Сун, Юньлун Чжао, Юфэй Сун, Вэньсянь Ши, Ян Ян, Лэй Ли
arXiv:2310.02546 (2023)
Генеративная модель полноатомного белка (Protpardelle)
Александр Э. Чу, Люси Ченг, Джина Эль Неср, Минкай Сюй, По-Су Хуан
биоRxiv (2023)
Совместный дизайн последовательности и структуры белка с эквивариантным переводом (ProtSeed)
Чэнс Ши, Чуанруй Ван, Цзяруй Лу, Боцзитао Чжун, Цзянь Тан
ICLR 2023
Обучение представлению антител для открытия лекарств (BERTTransformer)
Лин Ли, Эстер Гупта, Джон Спэт, Лесли Шинг, Тристан Беплер, Раймонда Суло Касерес
arXiv:2210.02881 (2022)
Расшифровка созревания аффинности антител с помощью языковых моделей и обучения со слабым контролем (AntiBERTy)
Джеффри А. Руффоло, Джеффри Дж. Грей, Джеремиас Сулам
arXiv:2112.07782 (2021)
Расшифровка языка антител с помощью самоконтролируемого обучения (AntiBERTa)
Джин Ву Лим, Лаура С. Митчелл, Джеймс Х. Р. Фармери, Джастин Бартон, Джейкоб Д. Галсон
Выкройки 2022
AbLang: модель языка антител для завершения последовательностей антител (AbLang)
Тобиас Х. Олсен, Иэн Х. Моал, Шарлотта М. Дин
Достижения биоинформатики 2022
Предварительная тренировка с рациональным подходом к антителам (PARA)
Сянжуй Гао, Чанлин Цао, Липэн Лай
биоRxiv (2023)
SAbDab: база данных структурных антител (SAbDab)
Джеймс Данбар, Конрад Кравчик, Джин Ву Лим, Терри Бэйкер, Анжелика Фукс, Гай Джорджес, Джие Ши, Шарлотта М. Дин
Исследование нуклеиновых кислот 2014 г.
RosettaAntibodyDesign (RAbD): общая основа компьютерного дизайна антител (RAB).
Джаред Адольф-Брюфогл, Олекс Калюжный, Майкл Кубиц, Брайан Д. Вайцнер, Сяочжэнь Ху, Юмико Адачи, Уильям Р. Шиф, Роланд Л. Данбрэк-младший.
PLOS Вычислительная биология 2018
tFold-Ab: быстрое и точное предсказание структуры антител без гомологов последовательностей (tFold-Ab)
Цзясян Ву, Фанди Ву, Бяобинь Цзян, Вэй Лю, Пейлинь Чжао
биоRxiv (2022)
xTrimoABFold: прогнозирование структуры антител de novo без MSA (xTrimoABFold)
Инин Ван, Сюмэн Гун, Шаочуань Ли, Бин Ян, Иу Сун, Чуань Ши, Янган Ван, Чэн Ян, Хуэй Ли, Ле Сун
arXiv:2212.00735 (2022)
ImmuneBuilder: модели глубокого обучения для прогнозирования структур иммунных белков (ABodyBuilder)
Бреннан Абанадес, Винг Ки Вонг, Фергус Бойлз, Гай Джорджес, Александр Буйоцек, Шарлотта М. Дин
Природа 2023
ABlooper: быстрое и точное предсказание структуры петли CDR антитела с оценкой точности (ABlooper)
Бреннан Абанадес, Гай Жорж, Александр Буйоцек, Шарлотта М. Дин
Биоинформатика 2022
Геометрические потенциалы глубокого обучения улучшают прогнозирование структур петли CDR H3 (DeepH3)
Джеффри А. Руффоло, Карлос Герра, Сай Пуджа Махаджан, Джеремиас Сулам, Джеффри Джей Грей
Биоинформатика 2020
Простая сквозная модель глубокого обучения для прогнозирования структуры цикла CDR-H3 (SimpleDH3)
Наталья Зенкова, Екатерина Седых, Татьяна Шугаева, Владислав Страшко, Тимофей Ермак, Алексей Шпильман
arXiv:2111.10656 (2021)
Прогнозирование структуры антител с использованием интерпретируемого глубокого обучения (DeepAB)
Джеффри А. Руффоло, Джеремиас Сулам, Джеффри Джей Грей
Выкройки 2021
Быстрое и точное предсказание структуры антител на основе глубокого обучения огромного набора природных антител (IgFold)
Джеффри А. Руффоло, Ли-Шин Чу, Сай Пуджа Махаджан, Джеффри Джей Грей
Природные коммуникации 2023
SAbDab: база данных структурных антител (SAbDab)
Джеймс Данбар, Конрад Кравчик, Джин Ву Лим, Терри Бэйкер, Анжелика Фукс, Гай Джорджес, Джие Ши, Шарлотта М. Дин
Исследование нуклеиновых кислот 2014 г.
RosettaAntibodyDesign (RAbD): общая основа компьютерного дизайна антител (RAB).
Джаред Адольф-Брюфогл, Олекс Калюжный, Майкл Кубиц, Брайан Д. Вайцнер, Сяочжэнь Ху, Юмико Адачи, Уильям Р. Шиф, Роланд Л. Данбрэк-младший.
PLOS Вычислительная биология 2018
SKEMPI 2.0: обновленный тест изменений энергии связывания белок-белок, кинетики и термодинамики при мутации (SKEMPI)
Хустина Янкаускайте, Брайан Хименес-Гарсиа, Хустас Дапкунас, Хуан Фернандес-Ресио, Иэн Моал
Биоинформатика 2019
In silico доказательство принципа разработки антител на основе машинного обучения в неограниченном масштабе
Рахмад Акбара, Филипп А. Роберта, Седрик Р. Веберб, Михаэль Видрич, Роберт Франка, Милена Павлович, Лоннеке Шефферд, Мария Черниговская, Игорь Снапкова, Андрей Слабодкина, Бридж Бхушан Мехтаа, Энкелейда Михо, Фритьоф Лунд-Йохансена, Ян Терье Андерсена, ж, Зепп Хохрайтерц,г, Ингрид Хобек Хафф, Гюнтер Кламбауерк, Гейр Кьетил Сандвед, Виктор Грайфф
мАт 2022https://www.tandfonline.com/doi/full/10.1080/19420862.2022.2031482
Нейронная сеть итеративного уточнения графа для совместного проектирования последовательности и структуры антитела (RefineGNN)
Венгонг Джин, Джереми Волвенд, Регина Барзилай, Томми Яаккола
ICLR 2022
Условный дизайн антител как трансляция 3D-эквивариантного графа (MEAN)
Сянчжэ Конг, Вэньбин Хуан, Ян Лю
ICLR 2023
MLP Cross-Gate с инвариантным встраиванием белкового комплекса — это однократный конструктор антител (ADesigner)
Чэн Тан, Чжанъян Гао, Лижун Ву, Цзюнь Ся, Цзянбинь Чжэн, Сихун Ян, Юэ Лю, Божен Ху, Стэн З. Ли
АААИ 2024
Дизайн и оптимизация антиген-специфичных антител с помощью генеративных моделей белковых структур на основе диффузии (DiffAb)
Шитун Ло, Юфэн Су, Синган Пэн, Шэн Ван, Цзянь Пэн, Цзяньчжу Ма
НейрИПС 2022
Глубокое обучение для гибкого и специфичного для конкретного сайта стыковки и проектирования белков (DockGPT)
Мэтт Макпартлон, Джинбо Сюй
биоRxiv (2023)
Стыковка и дизайн антитело-антиген посредством иерархического эквивариантного уточнения (HERN)
Венгонг Джин, доктор Регина Барзилай, Томми Яаккола
МКМЛ 2022
Комплексный дизайн полноатомных антител (dyMEAN)
Сянчжэ Конг, Вэньбин Хуан, Ян Лю
МКМЛ 2023
Мультимодальная модель контрастной диффузии для генерации терапевтических пептидов (MMCD)
Юнкан Ван, Сюань Лю, Фэн Хуан, Чжанкунь Сюн, Вэнь Чжан
АААИ 2024
PepGB: Содействие открытию пептидных лекарств с помощью графовых нейронных сетей (PepGB)
Ипин Лэй, Сюй Ван, Мэн Фан, Хань Ли, Сян Ли, Цзяньян Цзэн
arXiv:2401.14665 (2024)
PepHarmony: многопрофильная система контрастного обучения для интегрированного кодирования пептидов на основе последовательностей и структур (PepHarmony)
Руочи Чжан, Хаоран Ву, Чанг Лю, Хуапин Ли, Юцянь Ву, Кевэй Ли, Ифань Ван, Ифань Дэн, Цзяхуэй Чен, Фэнфэн Чжоу, Синь Гао
arXiv:2401.11360 (2024)
PEFT-SP: точная настройка параметров больших белковых языковых моделей улучшает прогнозирование сигнальных пептидов (PEFT-SP)
Шуай Цзэн, Дуолинь Ван, Донг Сюй
биоRxiv (2023)
AdaNovo: адаптивное секвенирование пептидов De Novo с условной взаимной информацией (AdaNovo)
Цзюнь Ся, Шаорун Чен, Цзинбо Чжоу, Тяньцзе Лин, Вэньцзе Ду, Сичэ Лю, Стэн З. Ли
arXiv:2403.07013 (2024)