Update: Unser Beitrag wurde für Briefings in Bioinformatik angenommen!
Repository für das Umfragepapier „A Survey of Generative AI for de novo Drug Discovery: New Frontiers in Molecule and Protein Design“.
Xiangru Tang 1 *, Howard Dai 1 *, Elizabeth Knight 1 *, Yunyang Li 1 , Fang Wu 2 , Tianxiao Li 1 , Mark Gerstein 1
1. Yale University; 2. Stanford-Universität
(*: Gleicher Beitrag)
[**] bezeichnet Anhangabschnitte.
Abschnitt | Unterabschnitt | Datensätze | Metriken | Modelle |
---|---|---|---|---|
Molekül | Zielunabhängige Generierung | Datensätze | Metriken | Modelle |
Molekül | Zielbewusste Generation | Datensätze | Metriken | Modelle |
Molekül | Konformationsgenerierung** | Datensätze | Metriken | Modelle |
Protein | Repräsentationslernen** | Datensätze | Modelle | |
Protein | Strukturvorhersage | Datensätze | Metriken | Modelle |
Protein | Sequenzgenerierung | Datensätze | Metriken | Modelle |
Protein | Backbone-Design | Datensätze | Metriken | Modelle |
Antikörper | Repräsentationslernen** | Datensätze | Modelle | |
Antikörper | Strukturvorhersage** | Datensätze | Metriken | Modelle |
Antikörper | CDR-Generierung** | Datensätze | Metriken | Modelle |
Peptid | Sonstiges Aufgaben** | Modelle |
@article{tang2024survey,
title={A survey of generative ai for de novo drug design: new frontiers in molecule and protein generation},
author={Tang, Xiangru and Dai, Howard and Knight, Elizabeth and Wu, Fang and Li, Yunyang and Li, Tianxiao and Gerstein, Mark},
journal={Briefings in Bioinformatics},
volume={25},
number={4},
year={2024},
publisher={Oxford Academic}
}
Ein Überblick über die in unserem Artikel behandelten Themen. Blau hervorgehobene Abschnitte finden sich im Haupttext, während lila Abschnitte erweiterte Abschnitte im Anhang sind.
Quantenchemische Strukturen und Eigenschaften von 134-Kilo-Molekülen (QM9)
Raghunathan Ramakrishnan, Pavlo O. Dral, Matthias Rupp, O. Anatole von Lilienfeld
Wissenschaftliche Daten (2014)
GEOM, energieannotierte molekulare Konformationen zur Eigenschaftsvorhersage und Molekülgenerierung (GEOM)
Simon Axelrod, Rafael Gómez-Bombarelli
Wissenschaftliche Daten (2022)
Automatisches chemisches Design mithilfe einer datengesteuerten kontinuierlichen Darstellung von Molekülen (CVAE)
Rafael Gómez-Bombarelli, Jennifer N. Wei, David Duvenaud, JoséMiguel Hernández-Lobato, BenjamínSánchez-Lengeling, Dennis Sheberla, Jorge Aguilera-Iparraguirre, Timothy D. Hirzel, Ryan P. Adams und Alán Aspuru-Guzik
ACS Central Science (2018)
Grammatik-Variations-Autoencoder (GVAE)
Matt J. Kusner, Brooks Paige, José Miguel Hernández-Lobato
ICML 2017
Syntaxgesteuerter Variations-Autoencoder für strukturierte Daten (SD-VAE)
Hanjun Dai, Yingtao Tian, Bo Dai, Steven Skiena, Le Song
ICLR 2018
Junction Tree Variational Autoencoder für die Erzeugung molekularer Graphen (JT-VAE)
Wengong Jin, Regina Barzilay, Tommi Jaakkola
ICML 2018
E(n) Äquivariante normalisierende Flüsse (E-NF)
Victor Garcia Satorras, Emiel Hoogeboom, Fabian Fuchs, Ingmar Posner, Max Welling
NeurIPS 2021
Symmetrieadaptierte Generierung von 3D-Punktmengen zur gezielten Entdeckung von Molekülen (G-SchNet)
Niklas Gebauer, Michael Gastegger, Kristof Schütt
NeurIPS 2019
Äquivariante Diffusion zur Molekülerzeugung in 3D (EDM)
Emiel Hoogeboom, Victor Garcia Satorras, Clément Vignac, Max Welling
ICML 2022
Geometrievollständige Diffusion für die 3D-Molekülerzeugung und -optimierung (GCDM)
Alex Morehead, Jianlin Cheng
arXiv:2302.04313 (2023)
MDM: Molekulares Diffusionsmodell für die 3D-Molekülerzeugung (MDM)
Lei Huang, Hengtong Zhang, Tingyang Xu, Ka-Chun Wong
AAAI 2023
Geometrische latente Diffusionsmodelle für die 3D-Molekülerzeugung (GeoLDM)
Minkai Xu, Alexander S Powers, Ron O. Dror, Stefano Ermon, Jure Leskovec
ICML 2023
Erlernen gemeinsamer 2D- und 3D-Diffusionsmodelle für die vollständige Molekülerzeugung (JODO)
Han Huang, Leilei Sun, Bowen Du, Weifeng Lv
arXiv:2305.12347 (2023)
MiDi: Gemischter Graph und 3D-Rauschunterdrückungsdiffusion für die Molekülerzeugung (MiDi)
Clement Vignac, Nagham Osman, Laura Toni, Pascal Frossard
arXiv:2302.09048 (2023)
Dreidimensionale Faltungs-Neuronale Netze und ein Cross-Docked-Datensatz für strukturbasiertes Arzneimitteldesign (CrossDocked2020)
Paul G. Francoeur, Tomohide Masuda, Jocelyn Sunseri, Andrew Jia, Richard B. Iovanisci, Ian Snyder, David R. Koes
ACS JCIM 2020
ZINC20 – Eine kostenlose chemische Datenbank im Ultragroßmaßstab für die Ligandenentdeckung (ZINC20)
John J. Irwin, Khanh G. Tang, Jennifer Young, Chinzorig Dandarchuluun, Benjamin R. Wong, Munkhzul Khurelbaatar, Yurii S. Moroz, John Mayfield, Roger A. Sayle
ACS JCIM 2020
Bindung MOAD (Mutter aller Datenbanken) (Bindung MOAD)
Liegi Hu, Mark L. Benson, Richard D. Smith, Michael G. Lerner, Heather A. Carlson
Proteine 2005
AutoDock Vina: Verbesserung der Geschwindigkeit und Genauigkeit des Andockens mit einer neuen Bewertungsfunktion, effizienter Optimierung und Multithreading (Vina AutoDock)
Oleg Trott, Arthur J. Olson
JCC 2010
Quantifizierung der chemischen Schönheit von Arzneimitteln (QED) G Richard Bickerton, Gaia V Paolini, Jérémy Besnard, Sorel Muresan, Andrew L Hopkins
Naturchemie (2012)
Schätzung der synthetischen Zugänglichkeitsbewertung arzneimittelähnlicher Moleküle basierend auf molekularer Komplexität und Fragmentbeiträgen (SAScore)
Peter Ertl, Ansgar Schuffenhauer Journal of Cheminformatics 2009
DrugGPT: Eine GPT-basierte Strategie zur Entwicklung potenzieller Liganden, die auf spezifische Proteine abzielen (DrugGPT)
Yuesen Li, Chengyi Gao, Xin Song, Xiangyu Wang, Yungang Xu, Suxia Han
bioRxiv (2023)
Generierung von 3D-Molekülstrukturen abhängig von einer Rezeptorbindungsstelle mit tiefen generativen Modellen (LiGAN)
Tomohide Masuda, Matthew Ragoza, David Ryan Koes
arXiv:2010.14442 (2020)
Pocket2Mol: Effiziente molekulare Probenahme basierend auf 3D-Proteintaschen (Pocket2Mol)
Xingang Peng, Shitong Luo, Jiaqi Guan, Qi Xie, Jian Peng, Jianzhu Ma
ICML 2022
Ein generatives 3D-Modell für strukturbasiertes Arzneimitteldesign
Shitong Luo, Jiaqi Guan, Jianzhu Ma, Jian Peng
NeurIPS 2021
3D-äquivariante Diffusion zur zielbewussten Molekülgenerierung und Affinitätsvorhersage (TargetDiff)
Jiaqi Guan, Wesley Wei Qian, Xingang Peng, Yufeng Su, Jian Peng, Jianzhu Ma
ICLR 2023
Strukturbasiertes Arzneimitteldesign mit äquivarianten Diffusionsmodellen (DiffSBDD)
Arne Schneuing, Yuanqi Du, Charles Harris, Arian Jamasb, Ilia Igashov, Weitao Du, Tom Blundell, Pietro Lió, Carla Gomes, Max Welling, Michael Bronstein, Bruno Correia
arXiv:2210.13695 (2022)
GEOM, energieannotierte molekulare Konformationen zur Eigenschaftsvorhersage und Molekülgenerierung (GEOM)
Simon Axelrod, Rafael Gómez-Bombarelli
Wissenschaftliche Daten 2022
SchNet: Ein Faltungs-Neuronales Netzwerk mit kontinuierlichem Filter zur Modellierung von Quanteninteraktionen (ISO17)
Kristof Schütt, Pieter-Jan Kindermans, Huziel Enoc Sauceda Felix, Stefan Chmiela, Alexandre Tkatchenko, Klaus-Robert Müller
NeurIPS 2017
Vorhersage der molekularen Geometrie mithilfe eines Deep Generative Graph Neural Network (CVGAE)
Elman Mansimov, Omar Mahmood, Seokho Kang, Kyunghyun Cho
Wissenschaftliche Berichte 2019
Ein generatives Modell für die molekulare Distanzgeometrie (GraphDG)
Gregor NC Simm, Jose Miguel Hernandez-Lobato
ICML 2020
Lernen neuronaler generativer Dynamik für die Erzeugung molekularer Konformationen (CGCF)
Minkai Xu, Shitong Luo, Yoshua Bengio, Jian Peng, Jian Tang
ICLR 2021
GeoMol: Torsionsgeometrische Erzeugung molekularer 3D-Konformer-Ensembles (GeoMol)
Octavian Ganea, Lagnajit Pattanaik, Connor Coley, Regina Barzilay, Klavs Jensen, William Green, Tommi Jaakkola
NeurIPS 2021
Lernende Gradientenfelder für die Erzeugung molekularer Konformationen (ConfGF)
Chence Shi, Shitong Luo, Minkai Xu, Jian Tang
ICML 2021
Vorhersage der molekularen Konformation mittels Dynamic Graph Score Matching (DGSM)
Shitong Luo, Chence Shi, Minkai Xu, Jian Tang
NeurIPS 2021
GeoDiff: Ein geometrisches Diffusionsmodell zur Erzeugung molekularer Konformationen (GeoDiff)
Minkai Xu, Lantao Yu, Yang Song, Chence Shi, Stefano Ermon, Jian Tang
ICLR 2022
UniProt: die universelle Protein-Wissensdatenbank (UniProt)
Rolf Apweiler, Amos Bairoch, Cathy H. Wu, Winona C. Barker, Brigitte Boeckmann, Serenella Ferro, Elisabeth Gasteiger, Hongzhan Huang, Rodrigo Lopez, Michele Magrane, Maria J. Martin, Darren A. Natale, Claire O'Donovan, Nicole Redaschi, Lai-Su L. Yeh
Nukleinsäureforschung 2004
OntoProtein: Protein-Vortraining mit Gene Ontology Embedding (ProteinKG)
Ningyu Zhang, Zhen Bi, Xiaozhuan Liang, Siyuan Cheng, Haosen Hong, Shumin Deng, Jiazhang Lian, Qiang Zhang, Huajun Chen
ICLR 2022
Die Proteindatenbank (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Nukleinsäureforschung 2000
AlphaFold Protein Structure Database: Erweitert die strukturelle Abdeckung des Proteinsequenzraums massiv mit hochpräzisen Modellen (AlphaFoldDB)
Mihaly Varadi, Stephen Anyango, Mandar Deshpande, Sreenath Nair, Cindy Natassia, Galabina Yordanova, David Yuan, Oana Stroe, Gemma Wood, Agata Laydon, Augustin Žídek, Tim Green, Kathryn Tunyasuvunakool, Stig Petersen, John Jumper, Ellen Clancy, Richard Green , Ankur Vora, Mira Lutfi, Michael Figurnov, Andrew Cowie, Nicole Hobbs, Pushmeet Kohli, Gerard Kleywegt, Ewan Birney, Demis Hassabis, Sameer Velankar
Nukleinsäureforschung 2022
Pfam: Die Proteinfamilien-Datenbank im Jahr 2021 (Pfam)
Jaina Mistry, Sara Chuguransky, Lowri Williams, Matloob Qureshi, Gustavo A. Salazar, Erik LL Sonnhammer, Silvio CE Tosatto, Lisanna Paladin, Shriya Raj, Lorna J. Richardson, Robert D. Finn, Alex Bateman
Nukleinsäureforschung 2021
Einheitliches rationales Protein-Engineering mit sequenzbasiertem Deep-Representation-Learning (UniRep)
Ethan C. Alley, Grigory Khimulya, Surojit Biswas, Mohammed AlQuraishi, George M. Church
Naturmethoden 2019
Prottrans: Auf dem Weg zum Verständnis der Sprache des Lebens durch selbstüberwachtes Lernen (ProtBERT)
Ahmed Elnaggar, Michael Heinzinger, Christian Dallago, Ghalia Rehawi, Yu Wang, Llion Jones, Tom Gibbs, Tamas Feher, Christoph Angerer, Martin Steinegger, Debsindhu Bhowmik und Burkhard Rost
IEEE PAMI 2021
Biologische Struktur und Funktion entstehen durch Skalierung des unbeaufsichtigten Lernens auf 250 Millionen Proteinsequenzen (ESM-1b)
Alexander Rives, Joshua Meier, Tom Sercu, Siddharth Goyal, Zeming Lin, Jason Liu, Demi Guo, Myle Ott, C. Lawrence Zitnick, Jerry Ma, Rob Fergus
PNAS 2021
MSA-Transformator (MSA-Transformator)
Roshan M Rao, Jason Liu, Robert Verkuil, Joshua Meier, John Canny, Pieter Abbeel, Tom Sercu, Alexander Rives
ICML 2021
Retrieved Sequence Augmentation für Protein Representation Learning (RSA)
Chang Ma, Haiteng Zhao, Lin Zheng, Jiayi Xin, Qintong Li, Lijun Wu, Zhihong Deng, Yang Lu, Qi Liu, Lingpeng Kong
bioRxiv (2023)
OntoProtein: Protein-Vortraining mit Gen-Ontologie-Einbettung (OntoProtein)
Ningyu Zhang, Zhen Bi, Xiaozhuan Liang, Siyuan Cheng, Haosen Hong, Shumin Deng, Jiazhang Lian, Qiang Zhang, Huajun Chen
ICLR 2022
Proteinrepräsentationslernen mittels wissensgestützter Primärstrukturmodellierung (KeAP)
Hong-Yu Zhou, Yunxiang Fu, Zhicheng Zhang, Cheng Bian, Yizhou Yu
bioRxiv (2023)
Intrinsisch-extrinsische Faltung und Pooling zum Lernen von 3D-Proteinstrukturen (IEConv)
Pedro Hermosilla, Marco Schäfer, Matěj Lang, Gloria Fackelmann, Pere Pau Vázquez, Barbora Kozlíková, Michael Krone, Tobias Ritschel, Timo Ropinski
ICLR 2021
Strukturbasierte Proteinfunktionsvorhersage mithilfe von Graph Convolutional Networks (DeepFRI)
Vladimir Gligorijević, P. Douglas Renfrew, Tomasz Kosciolek, Julia Koehler Leman, Daniel Berenberg, Tommi Vatanen, Chris Chandler, Bryn C. Taylor, Ian M. Fisk, Hera Vlamakis, Ramnik J. Xavier, Rob Knight, Kyunghyun Cho, Richard Bonneau
Naturkommunikation 2021
Proteinrepräsentationslernen durch geometrisches Struktur-Pretraining (GearNET)
Zuobai Zhang, Minghao Xu, Arian Jamasb, Vijil Chenthamarakshan, Aurelie Lozano, Payel Das, Jian Tang
arXiv:2203.06125 (2022)
Die Proteindatenbank (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Nukleinsäureforschung 2000
Kritische Bewertung von Methoden zur Proteinstrukturvorhersage (CASP) – Runde XIV (CASP14)
Andriy Kryshtafovych, Torsten Schwede, Maya Topf, Krzysztof Fidelis, John Moult
Proteine 2021
Kontinuierliche automatisierte Modellbewertung (CAMEO) als Ergänzung zur kritischen Bewertung der Strukturvorhersage in CASP12 (CAMEO)
Jürgen Haas, Alessandro Barbato, Dario Behringer, Gabriel Studer, Steven Roth, Martino Bertoni, Khaled Mostaguir, Rafal Gumienny, Torsten Schwede
Proteine 2017
LGA: eine Methode zum Finden von 3D-Ähnlichkeiten in Proteinstrukturen (GDT-TS)
Adam Zemla
Nukleinsäuren 2003
Scoring-Funktion zur automatisierten Bewertung der Qualität von Proteinstrukturvorlagen (TM-Score)
Yang Zhang, Jeffrey Skolnick
Proteine 2004
lDDT: ein lokaler überlagerungsfreier Score zum Vergleich von Proteinstrukturen und -modellen mithilfe von Distanzdifferenztests (lDDT)
Valerio Mariani, Marco Biasini, Alessandro Barbato, Torsten Schwede
Bioinformatik 2013
Hochpräzise Vorhersage der Proteinstruktur mit AlphaFold (AlphaFold)
John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Olaf Ronneberger, Kathryn Tunyasuvunakool, Russ Bates, Augustin Žídek, Anna Potapenko, Alex Bridgland, Clemens Meyer, Simon AA Kohl, Andrew J. Ballard, Andrew Cowie, Bernardino Romera -Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor Back, Stig Petersen, David Reiman, Ellen Clancy, Michal Zielinski, Martin Steinegger, Michalina Pacholska, Tamas Berghammer, Sebastian Bodenstein, David Silver, Oriol Vinyals, Andrew W. Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis
Natur 2021)
Der trRosetta-Server für eine schnelle und genaue Vorhersage der Proteinstruktur (trRosetta)
Zongyang Du, Hong Su, Wenkai Wang, Lisha Ye, Hong Wei, Zhenling Peng, Ivan Anishchenko, David Baker, Jianyi Yang Nature Protocols 2021
Genaue Vorhersage von Proteinstrukturen und -interaktionen mithilfe eines dreispurigen neuronalen Netzwerks (RoseTTAFold)
Minkyung Baek, Frank DiMaio, Ivan Anishchenko, Justas Dauparas, Sergey Ovchinnikov, Gyu Rie Lee, Jue Wang, Qian Cong, Lisa N. Kinch, R. Dustin Schaeffer, Claudia Millán, Hahnbeom Park, Carson Adams, Caleb R. Glassman, Andy DeGiovanni, Jose H. Pereira, Andria V. Rodrigues, Alberdina A. van Dijk, Ana C. Ebrecht, Diederik J. Opperman, Theo Sagmeister, Christoph Buhlheller, Tea Pavkov-Keller, Manoj K. Rathinaswamy, Udit Dalwadi, Calvin K. Yip, John E. Burke, K. Christopher Garcia, Nick V. Grishin, Paul D. Adams , Randy J. Read, David Baker
Wissenschaft 2021
Vorhersage der Proteinstruktur auf atomarer Ebene im evolutionären Maßstab mit einem Sprachmodell (ESMFold)
Zeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Nikita Smetanin, Robert Verkuil, Ori Kabeli, Yaniv Shmueli, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Salvatore Candido, Alexander Rives
Wissenschaft 2023
EigenFold: Generative Proteinstrukturvorhersage mit Diffusionsmodellen (EigenFold)
Bowen Jing, Ezra Erives, Peter Pao-Huang, Gabriele Corso, Bonnie Berger, Tommi Jaakkola
arXiv:2304.02198 (2023)
Die Proteindatenbank (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Nukleinsäureforschung 2000
UniProt: die universelle Protein-Wissensdatenbank (UniRef/UniParc)
Rolf Apweiler, Amos Bairoch, Cathy H. Wu, Winona C. Barker, Brigitte Boeckmann, Serenella Ferro, Elisabeth Gasteiger, Hongzhan Huang, Rodrigo Lopez, Michele Magrane, Maria J. Martin, Darren A. Natale, Claire O'Donovan, Nicole Redaschi, Lai-Su L. Yeh
Nukleinsäureforschung 2004
CATH: umfassende strukturelle und funktionelle Annotationen für Genomsequenzen (CATH)
Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A. Orengo
Nukleinsäureforschung 2015
Direkte Vorhersage von Profilen von Sequenzen, die mit einer Proteinstruktur kompatibel sind, durch neuronale Netze mit fragmentbasierten lokalen und energiebasierten nichtlokalen Profilen (TS500)
Zhixiu Li, Yuedong Yang, Eshel Faraggi, Jian Zhan und Yaoqi Zhou
Proteine 2014
ProteinVAE: Variationaler AutoEncoder für translationales Proteindesign (ProteinVAE)
Suyue Lyu, Shahin Sowlati-Hashjin, Michael Garton
bioRxiv (2023)
ProT-VAE: Proteintransformator-Variations-AutoEncoder für funktionelles Proteindesign (ProT-VAE)
Emre Sevgen, Joshua Moller, Adrian Lange, John Parker, Sean Quigley, Jeff Mayer, Poonam Srivastava, Sitaram Gayatri, David Hosfield, Maria Korshunova, Micha Livne, Michelle Gill, Rama Ranganathan, Anthony B. Costa, Andrew L. Ferguson
bioRxiv (2023)
Erweiterung funktionaler Proteinsequenzräume mithilfe generativer gegnerischer Netzwerke (ProteinGAN)
Donatas Repecka, Vykintas Jauniskis, Laurynas Karpus, Elzbieta Rembeza, Irmantas Rokaitis, Jan Zrimec, Simona Poviloniene, Audrius Laurynenas, Sandra Viknander, Wissam Abuajwa, Otto Savolainen, Rolandas Meskys, Martin KM Engqvist, Aleksej Zelezniak
Nature Machine Intelligence (2021)
Schnelles und flexibles Proteindesign mithilfe neuronaler Deep-Graph-Netzwerke (ProteinSolver)
Alexey Strokach, David Becerra, Carles Corbi-Verge, Albert Perez-Riba, Philip M. Kim
Zellsysteme 2020
PiFold: Auf dem Weg zu einer effektiven und effizienten umgekehrten Proteinfaltung (PiFold)
Zhangyang Gao, Cheng Tan, Stan Z. Li
ICLR 2023
Proteinsequenzdesign mit erlerntem Potenzial
Namrata Anand, Raphael Eguchi, Irimpan I. Mathews, Carla P. Perez, Alexander Derry, Russ B. Altman, Po-Ssu Huang
Naturkommunikation 2022
Rotamerfreies Proteinsequenzdesign basierend auf Deep Learning und Selbstkonsistenz (ABACUS-R)
Yufeng Liu, Lu Zhang, Weilun Wang, Min Zhu, Chenchen Wang, Fudong Li, Jiahai Zhang, Houqiang Li, Quan Chen, Haiyan Liu
Nature Computational Science 2022
ProRefiner: eine entropiebasierte Verfeinerungsstrategie für die inverse Proteinfaltung mit globaler Graphenberücksichtigung (ProRefiner)
Xinyi Zhou, Guangyong Chen, Junjie Ye, Ercheng Wang, Jun Zhang, Cong Mao, Zhanwei Li, Jianye Hao, Xingxu Huang, Jin Tang, Pheng Ann Heng
Naturkommunikation 2023
Graphormer betreute De-novo-Proteindesign-Methode und Funktionsvalidierung (GPD)
Junxi Mu, Zhengxin Li, Bo Zhang, Qi Zhang, Jamshed Iqbal, Abdul Wadood, Ting Wei, Yan Feng, Hai-Feng Chen
Briefings in Bioinformatik 2024
Lernen aus der Proteinstruktur mit geometrischen Vektorperzeptronen (GVP-GNN)
Bowen Jing, Stephan Eismann, Patricia Suriana, Raphael John Lamarre Townshend, Ron Dror
ICLR 2021
Lernen der umgekehrten Faltung aus Millionen vorhergesagter Strukturen (ESM-IF1)
Chloe Hsu, Robert Verkuil, Jason Liu, Zeming Lin, Brian Hie, Tom Sercu, Adam Lerer, Alexander Rives
ICML 2022
Robustes, auf Deep Learning basierendes Proteinsequenzdesign mit ProteinMPNN (ProteinMPNN)
J Dauparas, I Anishchenko, N Bennett, H Bai, RJ Ragotte, LF Milles, BIM Wicky, A Courbet, RJ de Haas, N Bethel, PJY Leung, TF Huddy, S Pellock, D Tischer, F Chan, B Koepnick, H Nguyen, A. Kang, B. Sankaran, AK Bera, NP King, D. Baker
Wissenschaft 2022
Die Proteindatenbank (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Nukleinsäureforschung 2000
AlphaFold Protein Structure Database: Erweitert die strukturelle Abdeckung des Proteinsequenzraums massiv mit hochpräzisen Modellen (AlphaFoldDB)
Mihaly Varadi, Stephen Anyango, Mandar Deshpande, Sreenath Nair, Cindy Natassia, Galabina Yordanova, David Yuan, Oana Stroe, Gemma Wood, Agata Laydon, Augustin Žídek, Tim Green, Kathryn Tunyasuvunakool, Stig Petersen, John Jumper, Ellen Clancy, Richard Green , Ankur Vora, Mira Lutfi, Michael Figurnov, Andrew Cowie, Nicole Hobbs, Pushmeet Kohli, Gerard Kleywegt, Ewan Birney, Demis Hassabis, Sameer Velankar
Nukleinsäureforschung 2022
SCOP: Eine Datenbank zur strukturellen Klassifizierung von Proteinen zur Untersuchung von Sequenzen und Strukturen (SCOP)
Alexey G. Murzin, Steven E. Brenner, Tim Hubbard, Cyrus Chothia JMB 1995
SCOPe: Verbesserungen der strukturellen Klassifizierung von Proteinen – erweiterte Datenbank zur Erleichterung der Varianteninterpretation und des maschinellen Lernens (SCOPe)
John-Marc Chandonia, Lindsey Guan, Shiangyi Lin, Changhua Yu, Naomi K Fox, Steven E Brenner Nucleic Acids Research 2022
CATH: umfassende strukturelle und funktionelle Annotationen für Genomsequenzen (CATH)
Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A. Orengo
Nukleinsäureforschung 2015
Diffusionsprobabilistische Modellierung von Proteinrückgraten in 3D für das Motiv-Gerüst-Problem (ProtDiff)
Brian L. Trippe, Jason Yim, Doug Tischer, David Baker, Tamara Broderick, Regina Barzilay, Tommi Jaakkola
ICLR 2023
Proteinstrukturgenerierung durch Faltungsdiffusion (FoldingDiff)
Kevin E. Wu, Kevin K. Yang, Rianne van den Berg, Sarah Alamdari, James Y. Zou, Alex X. Lu, Ava P. Amini
Naturkommunikation 2024
Ein latentes Diffusionsmodell zur Proteinstrukturerzeugung (LatentDiff)
Cong Fu, Keqiang Yan, Limei Wang, Wing Yee Au, Michael McThrow, Tao Komikado, Koji Maruhashi, Kanji Uchino, Xiaoning Qian, Shuiwang Ji
Log 2023
Generierung neuartiger, gestaltbarer und vielfältiger Proteinstrukturen durch äquivariante Diffusion orientierter Rückstandswolken (Genie)
Yeqing Lin, Mohammed AlQuraishi
arXiv:2301.12485 (2023)
SE(3)-Diffusionsmodell mit Anwendung auf die Protein-Backbone-Generierung (FrameDiff)
Jason Yim, Brian L. Trippe, Valentin De Bortoli, Emile Mathieu, Arnaud Doucet, Regina Barzilay, Tommi Jaakkola
ICML 2023
De-novo-Design von Proteinstruktur und -funktion mit RFdiffusion (RFDiffusion)
Joseph L. Watson, David Jürgens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile IM Wicky, Nikita Hanikel , Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Sergey Ovchinnikov, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker
Natur 2023
Protein-Sprachmodell überwachte präzise und effiziente Protein-Backbone-Design-Methode (GPDL)
Bo Zhang, Kexin Liu, Zhuoqi Zheng, Yunfeiyang Liu, Junxi Mu, Ting Wei, Hai-Feng Chen
bioRxiv (2023)
Gemeinsames Design von Proteinsequenz und -struktur basierend auf Motiven (GeoPro)
Zhenqiao Song, Yunlong Zhao, Yufei Song, Wenxian Shi, Yang Yang, Lei Li
arXiv:2310.02546 (2023)
Ein generatives Allatom-Proteinmodell (Protpardelle)
Alexander E. Chu, Lucy Cheng, Gina El Nesr, Minkai Xu, Po-Ssu Huang
bioRxiv (2023)
Co-Design von Proteinsequenzen und -strukturen mit äquivarianter Übersetzung (ProtSeed)
Chence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang
ICLR 2023
Lernen der Antikörperrepräsentation für die Wirkstoffforschung (BERTTransformer)
Lin Li, Esther Gupta, John Spaeth, Leslie Shing, Tristan Bepler, Rajmonda Sulo Caceres
arXiv:2210.02881 (2022)
Entschlüsselung der Antikörper-Affinitätsreifung mit Sprachmodellen und schwach überwachtem Lernen (AntiBERTy)
Jeffrey A. Ruffolo, Jeffrey J. Gray, Jeremias Sulam
arXiv:2112.07782 (2021)
Die Sprache der Antikörper durch selbstüberwachtes Lernen entschlüsseln (AntiBERTa)
Jinwoo Leem, Laura S. Mitchell, James HR Farmery, Justin Barton, Jacob D. Galson
Muster 2022
AbLang: ein Antikörper-Sprachmodell zur Vervollständigung von Antikörpersequenzen (AbLang)
Tobias H. Olsen, Iain H. Moal, Charlotte M. Deane
Fortschritte in der Bioinformatik 2022
Vorschulung mit einem rationalen Ansatz für Antikörper (PARA)
Xiangrui Gao, Changling Cao, Lipeng Lai
bioRxiv (2023)
SAbDab: die strukturelle Antikörperdatenbank (SAbDab)
James Dunbar, Konrad Krawczyk, Jinwoo Leem, Terry Baker, Angelika Fuchs, Guy Georges, Jiye Shi, Charlotte M. Deane
Nukleinsäureforschung 2014
RosettaAntibodyDesign (RAbD): Ein allgemeiner Rahmen für computergestütztes Antikörperdesign (RAB)
Jared Adolf-Bryfogle, Oleks Kalyuzhniy, Michael Kubitz, Brian D. Weitzner, Xiaozhen Hu, Yumiko Adachi, William R. Schief, Roland L. Dunbrack, Jr.
PLOS Computational Biology 2018
tFold-Ab: Schnelle und genaue Vorhersage der Antikörperstruktur ohne Sequenzhomologe (tFold-Ab)
Jiaxiang Wu, Fandi Wu, Biaobin Jiang, Wei Liu, Peilin Zhao
bioRxiv (2022)
xTrimoABFold: De-novo-Vorhersage der Antikörperstruktur ohne MSA (xTrimoABFold)
Yining Wang, Xumeng Gong, Shaochuan Li, Bing Yang, YiWu Sun, Chuan Shi, Yangang Wang, Cheng Yang, Hui Li, Le Song
arXiv:2212.00735 (2022)
ImmuneBuilder: Deep-Learning-Modelle zur Vorhersage der Strukturen von Immunproteinen (ABodyBuilder)
Brennan Abanades, Wing Ki Wong, Fergus Boyles, Guy Georges, Alexander Bujotzek, Charlotte M. Deane
Natur 2023
ABlooper: Schnelle und genaue Vorhersage der Antikörper-CDR-Loop-Struktur mit Genauigkeitsschätzung (ABlooper)
Brennan Abanades, Guy Georges, Alexander Bujotzek, Charlotte M Deane
Bioinformatik 2022
Geometrische Potenziale aus Deep Learning verbessern die Vorhersage von CDR-H3-Schleifenstrukturen (DeepH3)
Jeffrey A. Ruffolo, Carlos Guerra, Sai Pooja Mahajan, Jeremias Sulam, Jeffrey J. Gray
Bioinformatik 2020
Einfaches End-to-End-Deep-Learning-Modell für die Vorhersage der CDR-H3-Schleifenstruktur (SimpleDH3)
Natalia Zenkova, Ekaterina Sedykh, Tatiana Shugaeva, Vladislav Strashko, Timofei Ermak, Aleksei Shpilman
arXiv:2111.10656 (2021)
Vorhersage der Antikörperstruktur mittels interpretierbarem Deep Learning (DeepAB)
Jeffrey A. Ruffolo, Jeremias Sulam, Jeffrey J. Gray
Muster 2021
Schnelle und genaue Vorhersage der Antikörperstruktur durch Deep Learning auf einer großen Menge natürlicher Antikörper (IgFold)
Jeffrey A. Ruffolo, Lee-Shin Chu, Sai Pooja Mahajan, Jeffrey J. Gray
Naturkommunikation 2023
SAbDab: die strukturelle Antikörperdatenbank (SAbDab)
James Dunbar, Konrad Krawczyk, Jinwoo Leem, Terry Baker, Angelika Fuchs, Guy Georges, Jiye Shi, Charlotte M. Deane
Nukleinsäureforschung 2014
RosettaAntibodyDesign (RAbD): Ein allgemeiner Rahmen für computergestütztes Antikörperdesign (RAB)
Jared Adolf-Bryfogle, Oleks Kalyuzhniy, Michael Kubitz, Brian D. Weitzner, Xiaozhen Hu, Yumiko Adachi, William R. Schief, Roland L. Dunbrack, Jr.
PLOS Computational Biology 2018
SKEMPI 2.0: ein aktualisierter Benchmark für Änderungen der Protein-Protein-Bindungsenergie, Kinetik und Thermodynamik bei Mutation (SKEMPI)
Justina Jankauskaite, Brian Jiménez-García, Justas Dapkunas, Juan Fernández-Recio, Iain H. Moal
Bioinformatik 2019
In-silico-Beweis des Prinzips des auf maschinellem Lernen basierenden Antikörperdesigns in uneingeschränktem Maßstab
Rahmad Akbara, Philippe A. Roberta, Cédric R. Weberb, Michael Widrichc, Robert Franka, Milena Pavlovićd, Lonneke Schefferd, Maria Chernigovskayaa, Igor Snapkova, Andrei Slabodkina, Brij Bhushan Mehtaa, Enkelejda Mihoe, Fridtjof Lund-Johansena, Jan Terje Andersena, f, Sepp Hochreiterc,g, Ingrid Hobæk Haffh, Günter Klambauerc, Geir Kjetil Sandved, Victor Greiff
mAbs 2022https://www.tandfonline.com/doi/full/10.1080/19420862.2022.2031482
Iteratives Refinement Graph Neural Network für das Co-Design von Antikörpersequenzen und -strukturen (RefineGNN)
Wengong Jin, Jeremy Wohlwend, Regina Barzilay, Tommi Jaakkola
ICLR 2022
Bedingtes Antikörperdesign als 3D-äquivariante Graphtranslation (MEAN)
Xiangzhe Kong, Wenbing Huang, Yang Liu
ICLR 2023
Cross-Gate-MLP mit proteinkomplexinvarianter Einbettung ist ein One-Shot-Antikörperdesigner (ADesigner)
Cheng Tan, Zhangyang Gao, Lirong Wu, Jun Xia, Jiangbin Zheng, Xihong Yang, Yue Liu, Bozhen Hu, Stan Z. Li
AAAI 2024
Antigenspezifisches Antikörperdesign und -optimierung mit diffusionsbasierten generativen Modellen für Proteinstrukturen (DiffAb)
Shitong Luo, Yufeng Su, Xingang Peng, Sheng Wang, Jian Peng, Jianzhu Ma
NeurIPS 2022
Deep Learning für flexibles und ortsspezifisches Protein-Docking und Design (DockGPT)
Matt McPartlon, Jinbo Xu
bioRxiv (2023)
Antikörper-Antigen-Docking und Design mittels hierarchischer äquivarianter Verfeinerung (HERN)
Wengong Jin, Dr. Regina Barzilay, Tommi Jaakkola
ICML 2022
End-to-End-Vollatom-Antikörperdesign (dyMEAN)
Xiangzhe Kong, Wenbing Huang, Yang Liu
ICML 2023
Ein multimodales kontrastives Diffusionsmodell für die Erzeugung therapeutischer Peptide (MMCD)
Yongkang Wang, Xuan Liu, Feng Huang, Zhankun Xiong, Wen Zhang
AAAI 2024
PepGB: Erleichterung der Entdeckung von Peptidwirkstoffen über graphische neuronale Netze (PepGB)
Yipin Lei, Xu Wang, Meng Fang, Han Li, Xiang Li, Jianyang Zeng
arXiv:2401.14665 (2024)
PepHarmony: Ein kontrastives Lernframework mit mehreren Ansichten für die integrierte sequenz- und strukturbasierte Peptidkodierung (PepHarmony)
Ruochi Zhang, Haoran Wu, Chang Liu, Huaping Li, Yuqian Wu, Kewei Li, Yifan Wang, Yifan Deng, Jiahui Chen, Fengfeng Zhou, Xin Gao
arXiv:2401.11360 (2024)
PEFT-SP: Parametereffiziente Feinabstimmung an Sprachmodellen großer Proteine verbessert die Signalpeptidvorhersage (PEFT-SP)
Shuai Zeng, Duolin Wang, Dong Xu
bioRxiv (2023)
AdaNovo: Adaptive De-Novo-Peptidsequenzierung mit bedingter gegenseitiger Information (AdaNovo)
Jun Xia, Shaorong Chen, Jingbo Zhou, Tianze Ling, Wenjie Du, Sizhe Liu, Stan Z. Li
arXiv:2403.07013 (2024)