更新:我們的論文已被生物資訊簡報接受!
調查論文「從頭藥物發現的產生人工智慧調查:分子和蛋白質設計的新前沿」的儲存庫。
唐相如1 *,Howard Dai 1 *,Elizabeth Knight 1 *,李雲陽1 ,吳芳2 ,李天笑1 ,Mark Gerstein 1
1. 耶魯大學; 2.史丹佛大學
(*: 同等貢獻)
[**] 表示附錄部分。
部分 | 小節 | 數據集 | 指標 | 型號 |
---|---|---|---|---|
分子 | 與目標無關的生成 | 數據集 | 指標 | 型號 |
分子 | 目標感知一代 | 數據集 | 指標 | 型號 |
分子 | 構像生成** | 數據集 | 指標 | 型號 |
蛋白質 | 表徵學習** | 數據集 | 型號 | |
蛋白質 | 結構預測 | 數據集 | 指標 | 型號 |
蛋白質 | 序列生成 | 數據集 | 指標 | 型號 |
蛋白質 | 骨幹網路設計 | 數據集 | 指標 | 型號 |
抗體 | 表徵學習** | 數據集 | 型號 | |
抗體 | 結構預測** | 數據集 | 指標 | 型號 |
抗體 | CDR 產生** | 數據集 | 指標 | 型號 |
勝肽 | 雜項。任務** | 型號 |
@article{tang2024survey,
title={A survey of generative ai for de novo drug design: new frontiers in molecule and protein generation},
author={Tang, Xiangru and Dai, Howard and Knight, Elizabeth and Wu, Fang and Li, Yunyang and Li, Tianxiao and Gerstein, Mark},
journal={Briefings in Bioinformatics},
volume={25},
number={4},
year={2024},
publisher={Oxford Academic}
}
我們論文所涵蓋主題的概述。以藍色突出顯示的部分可以在正文中找到,而紫色部分是附錄中的擴展部分。
134 公斤分子的量子化學結構與性質(QM9)
Raghunathan Ramakrishnan、Pavlo O. Dral、Matthias Rupp、O. Anatole von Lilienfeld
科學數據 (2014)
GEOM,用於屬性預測和分子生成的能量註釋分子構象(GEOM)
西蒙·阿克塞爾羅德、拉斐爾·戈麥斯-邦巴萊利
科學數據 (2022)
使用數據驅動的分子連續表示 (CVAE) 進行自動化學設計
Rafael Gómez-Bombarelli、Jennifer N. Wei、David Duvenaud、JoséMiguel Hernández-Lobato、BenjamínSánchez-Lengeling、Dennis Sheberla、Jorge Aguilera-Iparraguirre、Timothy D. Hirzel、Ryan Sheberla、Jorge Aguilera-Iparraguirre、Timothy D. Hirzel、Ryan P. Adams 和 Alániksp-Guz
美國化學學會中央科學 (2018)
語法變分自動編碼器(GVAE)
馬特·J·庫斯納、布魯克斯·佩奇、何塞·米格爾·埃爾南德斯-洛巴托
2017年ICML
用於結構化資料的語法定向變分自動編碼器(SD-VAE)
戴涵軍、田英濤、戴波、Steven Skiena、宋樂
ICLR 2018
用於分子圖產生的連接樹變分自動編碼器(JT-VAE)
金文功、雷吉娜·巴爾茲萊、托米·賈科拉
2018年ICML
E(n) 等變歸一化流(E-NF)
維克多·加西亞·薩托拉斯、埃米爾·胡格博姆、法比安·福克斯、英格瑪·波斯納、馬克斯·威靈
神經IPS 2021
用於分子標靶發現的對稱性自適應生成 3d 點集(G-SchNet)
尼克拉斯·格鮑爾、麥可·加斯特格、克里斯托夫·舒特
2019 年神經資訊處理大會
3D 分子生成的等變擴散(EDM)
艾米爾·胡格布姆、維克多·加西亞·薩托拉斯、克萊門特·維尼亞克、馬克斯·威靈
ICML 2022
用於 3D 分子生成和優化的幾何完全擴散(GCDM)
亞歷克斯·莫爾黑德、程建林
arXiv:2302.04313 (2023)
MDM:3D 分子生成的分子擴散模型(MDM)
黃磊、張恆通、徐廷陽、黃家俊
AAAI 2023
用於 3D 分子生成的幾何潛在擴散模型(GeoLDM)
徐敏凱、Alexander S Powers、Ron O. Dror、Stefano Ermon、Jure Leskovec
ICML 2023
學習完整分子生成的聯合 2D 和 3D 擴散模型(JODO)
黃瀚、孫蕾蕾、杜博文、呂偉峰
arXiv:2305.12347 (2023)
MiDi:用於分子生成的混合圖和 3D 去雜訊擴散(MiDi)
克萊門特·維尼亞克、納甘·奧斯曼、勞拉·托尼、帕斯卡·弗羅薩德
arXiv:2302.09048 (2023)
三維卷積神經網路和用於基於結構的藥物設計的交叉對接資料集(CrossDocked2020)
Paul G. Francoeur、Tomohide Masuda、Jocelyn Sunseri、Andrew Jia、Richard B. Iovanisci、Ian Snyder、David R. Koes
ACS JCIM 2020
ZINC20—用於配體發現的免費超大規模化學資料庫(ZINC20)
約翰·J·歐文、Khanh G. Tang、Jennifer Young、Chinzorig Dandarchuluun、Benjamin R. Wong、Munkhzul Khurelbaatar、Yurii S. Moroz、John Mayfield、Roger A. Sayle
ACS JCIM 2020
綁定 MOAD(所有資料庫之母) (Binding MOAD)
Liegi Hu、Mark L. Benson、Richard D. Smith、Michael G. Lerner、Heather A. Carlson
蛋白質 2005
AutoDock Vina:透過新的評分功能、高效優化和多執行緒提高對接速度和準確性(Vina AutoDock)
奧列格·特洛特、阿瑟·J·奧爾森
2010年JCC
量化藥物的化學美(QED) G Richard Bickerton、Gaia V Paolini、Jérémy Besnard、Sorel Muresan、Andrew L Hopkins
自然化學(2012)
基於分子複雜性與片段貢獻估計類藥分子的合成可近性分數(SAScore)
Peter Ertl,Ansgar Schuffenhauer 化學資訊學雜誌 2009
DrugGPT:基於 GPT 的策略,用於設計針對特定蛋白質的潛在配體(DrugGPT)
李躍森、高成毅、宋鑫、王翔宇、徐雲剛、韓素霞
生物Rxiv (2023)
使用深度生成模型 (LiGAN) 產生以受體結合位點為條件的 3D 分子結構
增田智秀、馬修拉戈扎、大衛瑞安科斯
arXiv:2010.14442 (2020)
Pocket2Mol:基於 3D 蛋白質口袋的高效分子採樣(Pocket2Mol)
彭新剛、羅詩彤、關佳琪、謝琪、彭劍、馬建柱
ICML 2022
基於結構的藥物設計的 3D 生成模型
羅詩彤、關嘉琪、馬建柱、彭劍
神經IPS 2021
用於目標感知分子生成和親和力預測的 3D 等變擴散(TargetDiff)
關嘉琪、錢偉、彭新剛、蘇宇峰、彭劍、馬建柱
ICLR 2023
具有等變擴散模型的結構為基礎的藥物設計(DiffSBDD)
阿恩·施紐因、杜元奇、查爾斯·哈里斯、阿里安·賈馬斯、伊利亞·伊加紹夫、杜偉濤、湯姆·布倫德爾、彼得羅·廖、卡拉·戈麥斯、馬克斯·威靈、麥可·布朗斯坦、布魯諾·科雷亞
arXiv:2210.13695 (2022)
GEOM,用於屬性預測和分子生成的能量註釋分子構象(GEOM)
西蒙·阿克塞爾羅德、拉斐爾·戈麥斯-邦巴萊利
2022 年科學數據
SchNet:用於模擬量子交互作用的連續濾波器卷積神經網路(ISO17)
克里斯托夫·舒特、彼得-揚·金德曼斯、胡齊爾·伊諾克·索達·菲利克斯、斯特凡·奇米拉、亞歷山大·特卡琴科、克勞斯-羅伯特·穆勒
2017 年神經資訊處理大會
使用深度生成圖神經網路 (CVGAE) 進行分子幾何預測
曼西莫夫、奧馬爾馬哈茂德、Seokho Kang、Kyunghyun Cho
2019 年科學報告
分子距離幾何生成模型(GraphDG)
格雷戈爾·NC·西姆、何塞·米格爾·埃爾南德斯-洛巴托
ICML 2020
學習分子構形生成的神經生成動力學(CGCF)
許敏凱、羅詩彤、Yoshua Bengio、彭健、唐健
ICLR 2021
GeoMol:分子 3D 適形體係綜的扭轉幾何生成(GeoMol)
奧克塔維安·加內亞、拉格納吉特·帕塔奈克、康納·科利、雷吉娜·巴茲萊、克拉夫斯·詹森、威廉姆·格林、托米·賈科拉
神經IPS 2021
學習分子構形生成的梯度場(ConfGF)
石成策、羅世同、許敏凱、唐健
ICML 2021
透過動態圖得分匹配 (DGSM) 預測分子構象
羅世同、石成策、許敏凱、唐健
神經IPS 2021
GeoDiff:分子構形生成的幾何擴散模型(GeoDiff)
徐敏凱、餘蘭濤、宋楊、石成策、Stefano Ermon、唐健
ICLR 2022
UniProt:通用蛋白質知識庫(UniProt)
Rolf Apweiler、Amos Bairoch、Cathy H. Wu、Winona C. Barker、Brigitte Boeckmann、Serenella Ferro、Elisabeth Gasteiger、黃宏展、Rodrigo Lopez、Michele Magrane、Maria J. Martin、Darren A. Natale、Claire O'Donovan、Nicole葉麗素·雷達斯基
核酸研究 2004
OntoProtein:利用基因本體嵌入進行蛋白質預訓練(ProteinKG)
張寧宇、畢臻、梁小專、程思源、洪浩森、鄧淑敏、連家章、張強、陳華軍
ICLR 2022
蛋白質資料庫(PDB)
海倫·M·伯曼、約翰·威斯布魯克、馮祖康、加里·吉利蘭、TN·巴特、赫爾格·韋西格、伊利亞·N·辛迪亞洛夫、菲利普·E·伯恩
核酸研究 2000
AlphaFold蛋白質結構資料庫:透過高精度模型大規模擴展蛋白質序列空間的結構覆蓋範圍(AlphaFoldDB)
米哈伊·瓦拉迪/ 史蒂芬·安尼揚戈/ 曼達爾·德什潘德/ 斯里納斯·奈爾/ 辛迪·娜塔莎/ 加拉比娜·約爾達諾娃/ 大衛袁/ 奧安娜·斯特羅/ 傑瑪·伍德/ 阿加塔·雷登/ 奧古斯丁·日德克/ 蒂姆·格林/ 凱瑟琳·圖尼亞蘇瓦納庫爾/ 斯蒂格·彼得森/ 約翰·詹珀/ 艾倫·克蘭西/ 理查德·格林安庫爾·沃拉/ 米拉·魯特菲/ 邁克爾·菲格諾夫/ 安德魯·考伊/ 妮可·霍布斯/ 普什米特·科利/ 傑拉德·克萊維格特/ 伊凡·伯尼/ 傑米斯·哈薩比斯/ 薩米爾·韋蘭卡
核酸研究 2022
Pfam:2021 年蛋白質家族資料庫(Pfam)
吉安娜·米斯特里、薩拉·丘古蘭斯基、洛瑞·威廉斯、馬特魯布·庫雷希、古斯塔沃·薩拉查、艾瑞克·LL·桑哈默、西爾維奧·CE·托薩托、麗莎娜·帕拉丁、施裡亞·拉傑、洛娜·J·理查森、羅伯特·D·芬恩、亞歷克斯·貝特曼
核酸研究 2021
具有基於序列的深度表示學習的統一理性蛋白質工程(UniRep)
Ethan C. Alley、Grigory Khimulya、Surojit Biswas、Mohammed AlQuraishi、George M. Church
2019年自然方法
Prottrans:透過自我監督學習理解生命的語言(ProtBERT)
Ahmed Elnaggar、Michael Heinzinger、Christian Dallago、Ghalia Rehawi、王宇、Llion Jones、Tom Gibbs、Tamas Feher、Christoph Angerer、Martin Steinegger、Debsindhu Bhowmik 和 Burkhard Rost
IEEE PAMI 2021
將無監督學習擴展到 2.5 億個蛋白質序列 (ESM-1b),產生生物結構和功能
亞歷山大·里夫斯、約書亞·梅爾、湯姆·塞爾庫、悉達斯·戈亞爾、林澤明、劉傑生、郭黛米、邁爾·奧特、C·勞倫斯·齊特尼克、馬傑瑞、羅伯弗格斯
美國國家科學院院刊 2021
MSA變壓器(MSA變壓器)
Roshan M Rao、Jason Liu、Robert Verkuil、Joshua Meier、John Canny、Pieter Abbeel、Tom Sercu、Alexander Rives
ICML 2021
用於蛋白質表示學習 (RSA) 的檢索序列增強
馬暢、趙海騰、鄭林、辛佳一、李勤童、吳麗君、鄧志宏、路陽、劉奇、孔令鵬
生物Rxiv (2023)
OntoProtein:利用基因本體嵌入進行蛋白質預訓練(OntoProtein)
張寧宇、畢臻、梁小專、程思源、洪浩森、鄧淑敏、連家章、張強、陳華軍
ICLR 2022
透過知識增強一級結構建模 (KeAP) 進行蛋白質表示學習
週宏宇、付雲翔、張志成、卞成、於一洲
生物Rxiv (2023)
用於 3D 蛋白質結構學習的內在-外在卷積和池化(IEConv)
佩德羅·埃莫西拉、馬可·謝弗、馬特耶·朗、格洛麗亞·法克爾曼、佩雷·保·巴斯克斯、巴博拉·科茲利科娃、麥可·克朗、托比亞斯·里切爾、蒂莫·羅平斯基
ICLR 2021
使用圖卷積網絡進行基於結構的蛋白質功能預測(DeepFRI)
Vladimir Gligorijević、P. Douglas Renfrew、Tomasz Kosciolek、Julia Koehler Leman、Daniel Berenberg、Tommi Vatanen、Chris Chandler、Bryn C. Taylor、Ian M. Fisk、Hera Vlamakis、Ramnik J. Xavier、Rob Knight、Kyunghyun Choonne、Richard Byunghyun
自然通訊 2021
透過幾何結構預訓練進行蛋白質表示學習(GearNET)
張作柏、徐明浩、Arian Jamasb、Vijil Chenthamarakshan、Aurelie Lozano、Payel Das、唐健
arXiv:2203.06125 (2022)
蛋白質資料庫(PDB)
海倫·M·伯曼、約翰·威斯布魯克、馮祖康、加里·吉利蘭、TN·巴特、赫爾格·韋西格、伊利亞·N·辛迪亞洛夫、菲利普·E·伯恩
核酸研究 2000
蛋白質結構預測 (CASP) 方法的嚴格評估-第 XIV 輪(CASP14)
安德烈·克里斯塔福維奇、托斯頓·施韋德、瑪雅·托普夫、克日什托夫·菲德利斯、約翰·摩爾特
蛋白質 2021
連續自動模型評估 (CAMEO) 補充了 CASP12 (CAMEO) 中結構預測的關鍵評估
尤爾根·哈斯、亞歷桑德羅·巴巴托、達裡奧·貝林格、加布里埃爾·斯圖德、史蒂文·羅斯、馬蒂諾·貝爾托尼、哈立德·莫史塔吉爾、拉法爾古米尼、托斯頓施韋德
蛋白質 2017
LGA:一種尋找蛋白質結構 3D 相似性的方法(GDT-TS)
亞當·澤姆拉
核酸 2003
自動評估蛋白質結構模板品質的評分功能(TM-score)
張陽,傑弗瑞‧斯科爾尼克
蛋白質 2004
lDDT:使用距離差異測試 (lDDT) 比較蛋白質結構和模型的局部無疊加評分
瓦萊裡奧·馬裡亞尼、馬可·比亞西尼、亞歷山德羅·巴爾巴托、托斯頓·施韋德
生物資訊學2013
使用 AlphaFold (AlphaFold) 進行高度準確的蛋白質結構預測
約翰·詹珀、理查德·埃文斯、亞歷山大·普利策爾、蒂姆·格林、邁克爾·菲格諾夫、奧拉夫·羅尼伯格、凱瑟琳·圖尼亞蘇瓦納庫爾、拉斯貝茲、奧古斯丁日德克、安娜波塔彭科、亞歷克斯布里奇蘭、克萊門斯邁耶、西蒙AA·科爾、安德魯·J·巴拉德、安德魯·考伊、貝爾納迪諾·羅梅拉-Paredes、斯坦尼斯拉夫·尼科洛夫、Rishub Jain、喬納斯·阿德勒、特雷弗·巴克、斯蒂格·彼德森、大衛雷曼、艾倫克蘭西、米哈爾齊林斯基、馬丁斯坦內格、米卡利娜帕喬斯卡、塔馬斯伯格哈默、塞巴斯蒂安·博登斯坦、大衛·西爾弗、奧裡奧爾·維尼亞爾斯、安德魯·W·西尼爾、 Koray Kavukcuoglu、Pushmeet Kohli、Demis Hassabis
自然2021)
用於快速準確預測蛋白質結構的 trRosetta 伺服器(trRosetta)
杜宗陽, 蘇紅, 王文凱, 葉麗莎, 魏紅, 彭振玲, Ivan Anishchenko, David Baker, 楊建一 自然協議 2021
使用三軌神經網路 (RoseTTAFold) 準確預測蛋白質結構和相互作用
Minkyung Baek、Frank DiMaio、Ivan Anishchenko、Justas Dauparas、Sergey Ovchinnikov、Gyu Rie Lee、Jue Wang、Qian Cong、Lisa N. Kinch、R. Dustin Schaeffer、Claudia Millán、Hahnbeom Park、Carson Adams、Caleb R. Glassman、Andyeb R. DeGiovanni、Jose H. Pereira、Andria V. Rodrigues、Alberdina A. van Dijk、Ana C. Ebrecht、Diederik J. Opperman、Theo Sagmeister、Christoph Buhlheller、Tea Pavkov-Keller、Manoj K. Rarchnaswamy、Uditf、Keller K.葉、約翰·E·伯克、K·克里斯多福·加西亞、尼克·V·格里辛、保羅·D·亞當斯、蘭迪·J·里德、大衛·貝克
科學 2021
使用語言模型(ESMFold)對原子級蛋白質結構進行演化規模預測
林澤明、Halil Akin、Roshan Rao、Brian Hie、朱中凱、盧文婷、Nikita Smetanin、Robert Verkuil、Ori Kabeli、Yaniv Shmueli、Allan dos Santos Costa、Maryam Fazel-Zarandi、Tom Sercu、Salvatore Candido、Alexander Rivestos Costa、Maryam Fazel-Zarandi、Tom Sercu、Salvatore Candido、Alexander Rivestos Costa、Maryam Fazel-Zarandi、Tom Sercu、Salvatore Candido、Alexander Rivestos Costa、Maryam Fazel-Zarandi、Tom Sercu、Salvatore Candido、Alexander Rivestos Costa、Maryam Fazel-Zarandi、Tom Sercu、Salvatore Candido、Alexander Rivestos Costa
科學2023
EigenFold:利用擴散模型進行產生蛋白質結構預測(EigenFold)
井博文、埃茲拉·埃里維斯、黃彼得、加布里埃爾·科爾索、邦妮·伯傑、湯米·賈科拉
arXiv:2304.02198 (2023)
蛋白質資料庫(PDB)
海倫·M·伯曼、約翰·威斯布魯克、馮祖康、加里·吉利蘭、TN·巴特、赫爾格·韋西格、伊利亞·N·辛迪亞洛夫、菲利普·E·伯恩
核酸研究 2000
UniProt:通用蛋白質知識庫(UniRef/UniParc)
Rolf Apweiler、Amos Bairoch、Cathy H. Wu、Winona C. Barker、Brigitte Boeckmann、Serenella Ferro、Elisabeth Gasteiger、黃宏展、Rodrigo Lopez、Michele Magrane、Maria J. Martin、Darren A. Natale、Claire O'Donovan、Nicole葉麗素·雷達斯基
核酸研究 2004
CATH:基因組序列的全面結構和功能註釋(CATH)
伊恩·西利托、東尼·E·劉易斯、艾莉森·卡夫、薩奧尼·達斯、保羅·阿什福德、娜塔莉·L·道森、尼古拉斯·弗納姆、羅曼·拉斯科夫斯基、大衛李、喬納森G利斯、索妮亞萊蒂寧、羅曼A史圖德、珍妮特桑頓、克莉絲汀A奧倫戈
核酸研究 2015
透過具有基於片段的局部和基於能量的非局部特徵的神經網路直接預測與蛋白質結構相容的序列特徵(TS500)
李志秀、楊躍東、Eshel Faraggi、詹建、周耀奇
蛋白質 2014
ProteinVAE:用於翻譯蛋白質設計的變分自動編碼器(ProteinVAE)
呂蘇月、沙辛·索拉提-哈甚金、麥可·加頓
生物Rxiv (2023)
ProT-VAE:用於功能性蛋白質設計的 Protein Transformer 變分自動編碼器(ProT-VAE)
艾姆雷·塞夫根、約書亞·莫勒、阿德里安·蘭格、約翰·帕克、肖恩·奎格利、傑夫·梅爾、普納姆·斯里瓦斯塔瓦、西塔拉姆·加亞特里、大衛·霍斯菲爾德、瑪麗亞·科舒諾娃、米夏·利夫內、米歇爾·吉爾、拉瑪·蘭加納坦、安東尼·B·科斯塔、安德魯· L·弗格森
生物Rxiv (2023)
使用生成對抗網絡 (ProteinGAN) 擴展功能性蛋白質序列空間
Donatas Repecka、Vykintas Jauniskis、Laurynas Karpus、Elzbieta Rembeza、Irmantas Rokaitis、Jan Zrimec、Simona Poviloniene、Audrius Laurynenas、Sandra Viknander、Wissam Abuajwa、Ottoel Savnien、Rolandas Meaks、AlkManders、Wissam Abuajw、Ottoas Meaks、Rolandas Mex
自然機器智能(2021)
使用深度圖神經網路進行快速且靈活的蛋白質設計(ProteinSolver)
Alexey Strokach、David Becerra、Carles Corbi-Verge、Albert Perez-Riba、Philip M. Kim
細胞系統 2020
PiFold:邁向有效且高效的蛋白質反向折疊(PiFold)
高張陽、譚成、李斯坦
ICLR 2023
具有學習潛力的蛋白質序列設計
Namrata Anand、Raphael Eguchi、Irimpan I. Mathews、Carla P. Perez、Alexander Derry、Russ B. Altman、Po-Ssu Huang
自然通訊 2022
基於深度學習和自我一致性的無旋轉異構體蛋白質序列設計(ABACUS-R)
劉玉峰、張璐、王偉倫、朱敏、王晨晨、李福東、張家海、李厚強、陳泉、瀏海燕
自然計算科學2022
ProRefiner:一種基於熵的精煉策略,用於具有全局圖注意力的反向蛋白質折疊(ProRefiner)
周欣怡、陳光勇、葉俊傑、王二成、張軍、毛叢、李佔偉、郝建業、黃星旭、唐金、恆鵬安
自然通訊2023
Graphormer 監督的從頭蛋白質設計方法和功能驗證(GPD)
穆俊熙、李正新、張博、張琪、賈姆希德·伊克巴爾、阿卜杜勒·瓦杜德、魏婷、馮岩、陳海峰
2024 年生物資訊簡報
使用幾何向量感知器學習蛋白質結構(GVP-GNN)
景博文、史蒂芬艾斯曼、派翠西亞蘇麗安娜、拉斐爾約翰拉馬爾湯森德、羅恩德羅爾
ICLR 2021
從數百萬個預測結構中學習逆折疊(ESM-IF1)
Chloe Hsu, 羅伯特·維庫爾, 劉傑森, 林澤明, Brian Hie, 湯姆·塞爾庫, Adam Lerer, 亞歷山大·里弗斯
ICML 2022
使用 ProteinMPNN (ProteinMPNN) 進行基於穩健深度學習的蛋白質序列設計
J Dauparas、I Anishchenko、N Bennett、H Bai、RJ Ragotte、LF Milles、BIM Wicky、A Courbet、RJ de Haas、N Bethel、PJY Leung、TF Huddy、S Pellock、D Tischer、F Chan、B Koepnick、H Nguyen、A Kang、B Sankaran、AK Bera、NP King、D Baker
科學 2022
蛋白質資料庫(PDB)
海倫·M·伯曼、約翰·威斯布魯克、馮祖康、加里·吉利蘭、TN·巴特、赫爾格·韋西格、伊利亞·N·辛迪亞洛夫、菲利普·E·伯恩
核酸研究 2000
AlphaFold蛋白質結構資料庫:透過高精度模型大規模擴展蛋白質序列空間的結構覆蓋範圍(AlphaFoldDB)
米哈伊·瓦拉迪/ 史蒂芬·安尼揚戈/ 曼達爾·德什潘德/ 斯里納斯·奈爾/ 辛迪·娜塔莎/ 加拉比娜·約爾達諾娃/ 大衛袁/ 奧安娜·斯特羅/ 傑瑪·伍德/ 阿加塔·雷登/ 奧古斯丁·日德克/ 蒂姆·格林/ 凱瑟琳·圖尼亞蘇瓦納庫爾/ 斯蒂格·彼得森/ 約翰·詹珀/ 艾倫·克蘭西/ 理查德·格林安庫爾·沃拉/ 米拉·魯特菲/ 邁克爾·菲格諾夫/ 安德魯·考伊/ 妮可·霍布斯/ 普什米特·科利/ 傑拉德·克萊維格特/ 伊凡·伯尼/ 傑米斯·哈薩比斯/ 薩米爾·韋蘭卡
核酸研究 2022
SCOP:用於研究序列和結構的蛋白質結構分類資料庫(SCOP)
阿列克謝·G·穆爾津、史蒂文·E·布倫納、蒂姆·哈伯德、賽勒斯·喬蒂亞 JMB 1995
SCOPe:蛋白質結構分類的改進-擴展資料庫以促進變異解釋和機器學習(SCOPe)
John-Marc Chandonia、Lindseyguan、Shiangyi Lin、Changhua Yu、Naomi K Fox、Steven E Brenner 核酸研究 2022
CATH:基因組序列的全面結構和功能註釋(CATH)
伊恩·西利托、東尼·E·劉易斯、艾莉森·卡夫、薩奧尼·達斯、保羅·阿什福德、娜塔莉·L·道森、尼古拉斯·弗納姆、羅曼·拉斯科夫斯基、大衛李、喬納森G利斯、索妮亞萊蒂寧、羅曼A史圖德、珍妮特桑頓、克莉絲汀A奧倫戈
核酸研究 2015
針對基序支架問題的 3D 蛋白質骨架擴散機率建模(ProtDiff)
布萊恩·特里普 / 傑森·米 / 道格·蒂舍爾 / 大衛·貝克 / 塔瑪拉·布羅德里克 / 雷吉娜·巴茲萊 / 托米·賈科拉
ICLR 2023
透過折疊擴散生成蛋白質結構(FoldingDiff)
Kevin E. Wu、Kevin K. Yang、Rianne van den Berg、Sarah Alamdari、James Y. Zou、Alex X. Lu、Ava P. Amini
自然通訊 2024
蛋白質結構生成的潛在擴散模型(LatentDiff)
付聰、嚴克強、王麗梅、歐永儀、Michael McThrow、小美門陶、丸橋浩司、內野寬二、錢小寧、季水旺
日誌 2023
透過等變擴散定向殘基雲生成新穎、可設計且多樣化的蛋白質結構(Genie)
林葉青、穆罕默德·庫萊什
arXiv:2301.12485 (2023)
SE(3) 擴散模型應用於蛋白質骨架生成(FrameDiff)
Jason Yim、Brian L. Trippe、Valentin De Bortoli、Emile Mathieu、Arnaud Doucet、Regina Barzilay、Tommi Jaakkola
ICML 2023
使用 RFdiffusion 進行蛋白質結構與功能的從頭設計(RFDiffusion)
約瑟夫·L·沃森、大衛·於爾根斯、納撒尼爾·R·貝內特、布萊恩·L·特里普、傑森·伊姆、海倫·E·艾森納赫、伍迪·埃亨、安德魯·J·博斯特、羅伯特·J·拉戈特、盧卡斯·F·米爾斯、巴塞爾·IM·威基、尼基塔·哈尼克爾, 塞繆爾·J·佩洛克, 亞歷克西斯·庫爾貝, 威廉·謝弗勒, 王珏, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, 埃米爾·馬蒂厄, 謝爾蓋·奧夫欽尼科夫, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung貝克,大衛·貝克
自然 2023
蛋白質語言模型監督的精確高效蛋白質主鏈設計方法(GPDL)
張波、劉可欣、鄭卓奇、劉雲飛揚、穆俊熙、魏婷、陳海峰
生物Rxiv (2023)
基於基序的蛋白質序列和結構聯合設計(GeoPro)
宋振橋、趙雲龍、宋宇飛、史文賢、楊洋、李雷
arXiv:2310.02546 (2023)
全原子蛋白質生成模型(Protpardelle)
Alexander E. Chu、Lucy Cheng、Gina El Nesr、Minkai Xu、Po-Ssu Huang
生物Rxiv (2023)
具有等變翻譯的蛋白質序列和結構協同設計(ProtSeed)
石成策、王傳瑞、路嘉瑞、鐘波子濤、唐健
ICLR 2023
用於藥物發現的抗體表示學習(BERTTransformer)
林莉、艾絲特·古普塔、約翰·斯佩思、盛國榮、特里斯坦·貝普勒、拉傑蒙達·蘇洛·卡塞雷斯
arXiv:2210.02881 (2022)
使用語言模型和弱監督學習破解抗體親和力成熟(AntiBERTy)
傑弗裡·A·魯弗洛、傑弗裡·J·格雷、傑里米斯·蘇拉姆
arXiv:2112.07782 (2021)
使用自我監督學習破解抗體的語言(AntiBERTa)
Jinwoo Leem、勞拉·S·米切爾、詹姆斯·HR·法默里、賈斯汀·巴頓、雅各布·D·加爾森
2022 年圖案
AbLang:用於完成抗體序列的抗體語言模型(AbLang)
托比亞斯·H·奧爾森、伊恩·H·莫爾、夏洛特·M·迪恩
2022 年生物資訊學進展
使用合理的抗體方法 (PARA) 進行預訓練
高祥瑞、曹長嶺、賴立鵬
生物Rxiv (2023)
SAbDab:結構抗體資料庫(SAbDab)
詹姆斯·鄧巴、康拉德·克勞奇克、Jinwoo Leem、特里·貝克、安吉麗卡·福克斯、蓋伊·喬治、史吉野、夏洛特·M·迪恩
核酸研究 2014
RosettaAntibodyDesign (RAbD):計算抗體設計 (RAB) 的通用框架
Jared Adolf-Bryfogle、Oleks Kalyuzhniy、Michael Kubitz、Brian D. Weitzner、Xiaozhen Hu、Yumiko Adachi、William R. Schief、Roland L. Dunbrack, Jr.
PLOS 計算生物學 2018
tFold-Ab:快速且準確的抗體結構預測,無需序列同源物(tFold-Ab)
吳家祥、吳凡迪、蔣標斌、劉偉、趙培林
生物Rxiv (2022)
xTrimoABFold:無需 MSA 的從頭抗體結構預測(xTrimoABFold)
王一寧、龔旭猛、李少川、楊冰、孫義武、史傳、王彥剛、程陽、李慧、宋樂
arXiv:2212.00735 (2022)
ImmuneBuilder:用於預測免疫蛋白結構的深度學習模型(ABodyBuilder)
布倫南·阿巴納德斯、黃永基、弗格斯·博伊斯、蓋伊·喬治、亞歷山大·布約澤克、夏洛特·M·迪恩
自然 2023
ABlooper:快速且準確的抗體 CDR 環結構預測和準確度估計(ABlooper)
布倫南·阿巴納德斯、蓋伊·喬治、亞歷山大·布約澤克、夏洛特·M·迪恩
生物資訊學 2022
深度學習的幾何勢改進了 CDR H3 循環結構的預測(DeepH3)
傑弗裡·A·魯弗洛、卡洛斯·格拉、Sai Pooja Mahajan、傑里米·蘇拉姆、杰弗裡·J·格雷
生物資訊學2020
用於 CDR-H3 循環結構預測的簡單端對端深度學習模型(SimpleDH3)
娜塔莉亞·贊科娃、葉卡捷琳娜·塞德赫、塔蒂亞娜·舒加耶娃、弗拉迪斯拉夫·斯特拉什科、蒂莫費·埃爾馬克、阿列克謝·施皮爾曼
arXiv:2111.10656 (2021)
使用可解釋深度學習 (DeepAB) 預測抗體結構
傑弗裡·A·魯弗洛、傑里米·蘇拉姆、傑弗裡·J·格雷
2021 年圖案
透過深度學習對大量天然抗體 (IgFold) 進行快速、準確的抗體結構預測
傑弗瑞·A·魯弗洛、李新朱、Sai Pooja Mahajan、傑弗瑞·J·格雷
自然通訊2023
SAbDab:結構抗體資料庫(SAbDab)
詹姆斯·鄧巴、康拉德·克勞奇克、Jinwoo Leem、特里·貝克、安吉麗卡·福克斯、蓋伊·喬治、史吉野、夏洛特·M·迪恩
核酸研究 2014
RosettaAntibodyDesign (RAbD):計算抗體設計 (RAB) 的通用框架
Jared Adolf-Bryfogle、Oleks Kalyuzhniy、Michael Kubitz、Brian D. Weitzner、Xiaozhen Hu、Yumiko Adachi、William R. Schief、Roland L. Dunbrack, Jr.
PLOS 計算生物學 2018
SKEMPI 2.0:突變時蛋白質-蛋白質結合能、動力學和熱力學變化的更新基準(SKEMPI)
賈斯蒂娜·揚考斯凱特、布萊恩·希門尼斯-加西亞、賈斯塔斯·達普庫納斯、胡安·費爾南德斯-雷西奧、伊恩·H·莫阿爾
生物資訊學2019
基於機器學習的無限制規模抗體設計原理的電腦證明
Rahmad Akbara、Philippe A. Roberta、Cédric R. Weberb、Michael Widrichc、Robert Franka、Milena Pavlovićd、Lonneke Schefferd、Maria Chernigovskayaa、Igor Snapkova、Andrei Slabodkina、Brij Bhushan Mehtaa、ridenaa、Mandk、ida、idk 它、Momaan Mehtaa、Jenajey、Jena、Jidan Lhoetaa、Jenaa、Manda、Jaka、lida、ida、illad我現在、Fanddena、Fomey、Jaan Mehtaa、Jenajey、Jena、Jenai Lhoetaa、Jenajey、J我、海分子f、Sepp Hochreiterc、g、Ingrid Hobæk Haffh、Günter Klambauerc、Geir Kjetil Sandved、Victor Greiff
單株抗體2022https://www.tandfonline.com/doi/full/10.1080/19420862.2022.2031482
用於抗體序列-結構協同設計的迭代細化圖神經網路(RefineGNN)
金文功、傑瑞米·沃爾文德、雷吉娜·巴齊萊、托米·雅科拉
ICLR 2022
作為 3D 等變圖轉換 (MEAN) 的條件抗體設計
孔祥哲、黃文兵、劉洋
ICLR 2023
具有蛋白質複合物不變嵌入的跨門 MLP 是一次性抗體設計器(ADesigner)
譚成、高張陽、吳立榮、夏軍、鄭江濱、楊喜紅、劉悅、胡伯振、李斯坦
AAAI 2024
使用基於擴散的蛋白質結構生成模型 (DiffAb) 進行抗原特異性抗體設計和優化
羅世同、蘇玉峰、彭新剛、王勝、彭建、馬建柱
神經IPS 2022
用於靈活且特定位點的蛋白質對接和設計的深度學習(DockGPT)
馬特麥克帕特隆、徐金波
生物Rxiv (2023)
透過分層等變細化 (HERN) 進行抗體-抗原對接和設計
金文公、Regina Barzilay 博士、Tommi Jaakkola
ICML 2022
端對端全原子抗體設計(dyMEAN)
孔祥哲、黃文兵、劉洋
ICML 2023
用於治療性勝肽產生的多模態對比擴散模型(MMCD)
王永康、劉軒、黃峰、熊佔坤、張文
AAAI 2024
PepGB:透過圖神經網路促進勝肽藥物發現(PepGB)
雷一品、王旭、方孟、李韓、李翔、曾建陽
arXiv:2401.14665 (2024)
PepHharmony:用於整合序列和基於結構的勝肽編碼的多視圖對比學習框架(PepHarmony)
張若池、吳浩然、劉昶、李華平、吳雨倩、李可偉、王一凡、鄧一凡、陳家輝、週峰峰、高鑫
arXiv:2401.11360 (2024)
PEFT-SP:大型蛋白質語言模型的參數高效微調可改善訊號勝肽預測(PEFT-SP)
曾帥、王多林、徐東
生物Rxiv (2023)
AdaNovo:具有條件互資訊的自適應從頭勝肽定序(AdaNovo)
夏軍、陳少榮、週靜波、凌天澤、杜文傑、劉思哲、李斯坦
arXiv:2403.07013 (2024)