Update: makalah kami telah diterima untuk Pengarahan Bioinformatika!
Repositori untuk makalah survei "Survei AI Generatif untuk Penemuan Obat de novo : Perbatasan Baru dalam Desain Molekul dan Protein".
Xiangru Tang 1 *, Howard Dai 1 *, Elizabeth Knight 1 *, Yunyang Li 1 , Fang Wu 2 , Tianxiao Li 1 , Mark Gerstein 1
1. Universitas Yale; 2. Universitas Stanford
(*: Kontribusi Setara)
[**] menunjukkan bagian lampiran.
Bagian | Ayat | Kumpulan data | Metrik | Model |
---|---|---|---|---|
Molekul | Generasi Target-Agnostik | Kumpulan data | Metrik | Model |
Molekul | Generasi Sadar Target | Kumpulan data | Metrik | Model |
Molekul | Generasi Konformasi** | Kumpulan data | Metrik | Model |
Protein | Pembelajaran Representasi** | Kumpulan data | Model | |
Protein | Prediksi Struktur | Kumpulan data | Metrik | Model |
Protein | Generasi Urutan | Kumpulan data | Metrik | Model |
Protein | Desain Tulang Punggung | Kumpulan data | Metrik | Model |
Antibodi | Pembelajaran Representasi** | Kumpulan data | Model | |
Antibodi | Prediksi Struktur** | Kumpulan data | Metrik | Model |
Antibodi | Generasi CDR** | Kumpulan data | Metrik | Model |
Peptida | Lain-lain Tugas** | Model |
@article{tang2024survey,
title={A survey of generative ai for de novo drug design: new frontiers in molecule and protein generation},
author={Tang, Xiangru and Dai, Howard and Knight, Elizabeth and Wu, Fang and Li, Yunyang and Li, Tianxiao and Gerstein, Mark},
journal={Briefings in Bioinformatics},
volume={25},
number={4},
year={2024},
publisher={Oxford Academic}
}
Ikhtisar topik yang dibahas dalam makalah kami. Bagian yang disorot dengan warna biru dapat ditemukan di teks utama, sedangkan bagian ungu adalah bagian tambahan yang terdapat di lampiran.
Struktur kimia kuantum dan sifat 134 kilo molekul (QM9)
Raghunathan Ramakrishnan, Pavlo O. Dral, Matthias Rupp, O. Anatole von Lilienfeld
Data Ilmiah (2014)
GEOM, konformasi molekul beranotasi energi untuk prediksi properti dan pembangkitan molekul (GEOM)
Simon Axelrod, Rafael Gomez-Bombarelli
Data Ilmiah (2022)
Desain Kimia Otomatis Menggunakan Representasi Molekul Berkelanjutan Berbasis Data (CVAE)
Rafael Gómez-Bombarelli, Jennifer N. Wei, David Duvenaud, JoséMiguel Hernández-Lobato, BenjamínSánchez-Lengeling, Dennis Sheberla, Jorge Aguilera-Iparraguirre, Timothy D. Hirzel, Ryan P. Adams, dan Alán Aspuru-Guzik
Ilmu Pusat ACS (2018)
Autoencoder Variasi Tata Bahasa (GVAE)
Matt J. Kusner, Brooks Paige, José Miguel Hernández-Lobato
ICML 2017
Autoencoder Variasi Terarah Sintaks untuk Data Terstruktur (SD-VAE)
Hanjun Dai, Yingtao Tian, Bo Dai, Steven Skiena, Le Song
ICLR 2018
Autoencoder Variasi Pohon Persimpangan untuk Pembuatan Grafik Molekuler (JT-VAE)
Wengong Jin, Regina Barzilay, Tommi Jaakkola
ICML 2018
E(n) Aliran Normalisasi Ekuivalen (E-NF)
Victor Garcia Satorras, Emiel Hoogeboom, Fabian Fuchs, Ingmar Posner, Max Welling
NeuroIPS 2021
Pembuatan kumpulan titik 3d yang diadaptasi secara simetri untuk penemuan molekul yang ditargetkan (G-SchNet)
Niklas Gebauer, Michael Gastegger, Kristof Schütt
NeuroIPS 2019
Difusi Ekivarian untuk Pembuatan Molekul dalam 3D (EDM)
Emiel Hoogeboom, Vı́ctor Garcia Satorras, Clément Vignac, Max Welling
ICML 2022
Difusi Lengkap Geometri untuk Pembuatan dan Optimasi Molekul 3D (GCDM)
Alex Morehead, Jianlin Cheng
arXiv:2302.04313 (2023)
MDM: Model Difusi Molekuler untuk Pembuatan Molekul 3D (MDM)
Lei Huang, Hengtong Zhang, Tingyang Xu, Ka-Chun Wong
AAAI 2023
Model Difusi Laten Geometris untuk Pembuatan Molekul 3D (GeoLDM)
Minkai Xu, Alexander S Powers, Ron O. Dror, Stefano Ermon, Jure Leskovec
ICML 2023
Pembelajaran Model Difusi 2D & 3D Gabungan untuk Pembuatan Molekul Lengkap (JODO)
Han Huang, Leilei Sun, Bowen Du, Weifeng Lv
arXiv:2305.12347 (2023)
MiDi: Grafik Campuran dan Difusi Denoising 3D untuk Pembuatan Molekul (MiDi)
Clement Vignac, Nagham Osman, Laura Toni, Pascal Frossard
arXiv:2302.09048 (2023)
Jaringan Neural Konvolusional Tiga Dimensi dan Kumpulan Data Cross-Docked untuk Desain Obat Berbasis Struktur (CrossDocked2020)
Paul G. Francoeur, Tomohide Masuda, Jocelyn Sunseri, Andrew Jia, Richard B. Iovanisci, Ian Snyder, David R. Koes
ACS JCIM 2020
ZINC20—Database Kimia Skala Ultra Besar Gratis untuk Penemuan Ligan (ZINC20)
John J. Irwin, Khanh G. Tang, Jennifer Young, Chinzorig Dandarchuluun, Benjamin R. Wong, Munkhzul Khurelbaatar, Yurii S. Moroz, John Mayfield, Roger A. Sayle
ACS JCIM 2020
Mengikat MOAD (Induk Dari Semua Basis Data) (Mengikat MOAD)
Liegi Hu, Mark L. Benson, Richard D. Smith, Michael G. Lerner, Heather A. Carlson
Protein 2005
AutoDock Vina: Meningkatkan kecepatan dan akurasi docking dengan fungsi penilaian baru, optimalisasi efisien, dan multithreading (Vina AutoDock)
Oleg Trott, Arthur J. Olson
JCC 2010
Mengukur keindahan kimia obat (QED) G Richard Bickerton, Gaia V Paolini, Jérémy Besnard, Sorel Muresan, Andrew L Hopkins
Kimia Alam (2012)
Estimasi skor aksesibilitas sintetik molekul mirip obat berdasarkan kompleksitas molekuler dan kontribusi fragmen (SAScore)
Peter Ertl, Jurnal Kimia Komputer Ansgar Schuffenhauer 2009
DrugGPT: Strategi berbasis GPT untuk Merancang Ligan Potensial yang Menargetkan Protein Tertentu (DrugGPT)
Yuesen Li, Chengyi Gao, Xin Song, Xiangyu Wang, Yungang Xu, Suxia Han
bioRxiv (2023)
Membangkitkan Struktur Molekul 3D Bersyarat pada Situs Pengikatan Reseptor dengan Model Generatif Dalam (LiGAN)
Tomohide Masuda, Matthew Ragoza, David Ryan Koes
arXiv:2010.14442 (2020)
Pocket2Mol: Pengambilan Sampel Molekul yang Efisien Berdasarkan Kantong Protein 3D (Pocket2Mol)
Xingang Peng, Shitong Luo, Jiaqi Guan, Qi Xie, Jian Peng, Jianzhu Ma
ICML 2022
Model Generatif 3D untuk Desain Obat Berbasis Struktur
Shitong Luo, Jiaqi Guan, Jianzhu Ma, Jian Peng
NeuroIPS 2021
Difusi Setara 3D untuk Pembuatan Molekul Sadar Target dan Prediksi Afinitas (TargetDiff)
Jiaqi Guan, Wesley Wei Qian, Xingang Peng, Yufeng Su, Jian Peng, Jianzhu Ma
ICLR 2023
Desain Obat Berbasis Struktur dengan Model Difusi Ekuivalen (DiffSBDD)
Arne Schneuing, Yuanqi Du, Charles Harris, Arian Jamasb, Ilia Igashov, Weitao Du, Tom Blundell, Pietro Lió, Carla Gomes, Max Welling, Michael Bronstein, Bruno Correia
arXiv:2210.13695 (2022)
GEOM, konformasi molekul beranotasi energi untuk prediksi properti dan pembangkitan molekul (GEOM)
Simon Axelrod, Rafael Gomez-Bombarelli
Data Ilmiah 2022
SchNet: Jaringan saraf konvolusional filter berkelanjutan untuk memodelkan interaksi kuantum (ISO17)
Kristof Schütt, Pieter-Jan Kindermans, Huziel Enoc Sauceda Felix, Stefan Chmiela, Alexandre Tkatchenko, Klaus-Robert Müller
NeuroIPS 2017
Prediksi Geometri Molekuler menggunakan Deep Generative Graph Neural Network (CVGAE)
Elman Mansimov, Omar Mahmood, Seokho Kang, Kyunghyun Cho
Laporan Ilmiah 2019
Model Generatif untuk Geometri Jarak Molekuler (GraphDG)
Gregor NC Simm, Jose Miguel Hernandez-Lobato
ICML 2020
Mempelajari Dinamika Neural Generatif untuk Generasi Konformasi Molekuler (CGCF)
Minkai Xu, Shitong Luo, Yoshua Bengio, Jian Peng, Jian Tang
ICLR 2021
GeoMol: Generasi Geometri Torsional dari Ensembel Konformer 3D Molekuler (GeoMol)
Octavian Ganea, Lagnajit Pattanaik, Connor Coley, Regina Barzilay, Klavs Jensen, William Green, Tommi Jaakkola
NeuroIPS 2021
Pembelajaran Bidang Gradien untuk Pembuatan Konformasi Molekuler (ConfGF)
Chence Shi, Shitong Luo, Minkai Xu, Jian Tang
ICML 2021
Memprediksi Konformasi Molekuler melalui Dynamic Graph Score Matching (DGSM)
Shitong Luo, Chence Shi, Minkai Xu, Jian Tang
NeuroIPS 2021
GeoDiff: Model Difusi Geometris untuk Pembuatan Konformasi Molekuler (GeoDiff)
Minkai Xu, Lantao Yu, Yang Song, Chence Shi, Stefano Ermon, Jian Tang
ICLR 2022
UniProt: basis pengetahuan Protein Universal (UniProt)
Rolf Apweiler, Amos Bairoch, Cathy H. Wu, Winona C. Barker, Brigitte Boeckmann, Serenella Ferro, Elisabeth Gasteiger, Hongzhan Huang, Rodrigo Lopez, Michele Magrane, Maria J. Martin, Darren A. Natale, Claire O'Donovan, Nicole Redaschi, Lai-Su L. Yeh
Penelitian Asam Nukleat 2004
OntoProtein: Pelatihan Awal Protein dengan Penanaman Ontologi Gen (ProteinKG)
Ningyu Zhang, Zhen Bi, Xiaozhuan Liang, Siyuan Cheng, Haosen Hong, Shumin Deng, Jiazhang Lian, Qiang Zhang, Huajun Chen
ICLR 2022
Bank Data Protein (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Penelitian Asam Nukleat 2000
Database Struktur Protein AlphaFold: memperluas cakupan struktural ruang urutan protein secara besar-besaran dengan model akurasi tinggi (AlphaFoldDB)
Mihaly Varadi, Stephen Anyango, Mandar Deshpande, Sreenath Nair, Cindy Natassia, Galabina Yordanova, David Yuan, Oana Stroe, Gemma Wood, Agata Laydon, Augustin Žídek, Tim Green, Kathryn Tunyasuvunakool, Stig Petersen, John Jumper, Ellen Clancy, Richard Green , Ankur Vora, Mira Lutfi, Michael Figurnov, Andrew Cowie, Nicole Hobbs, Pushmeet Kohli, Gerard Kleywegt, Ewan Birney, Demis Hassabis, Sameer Velankar
Penelitian Asam Nukleat 2022
Pfam: Database keluarga protein pada tahun 2021 (Pfam)
Jaina Mistry, Sara Chuguransky, Lowri Williams, Matloob Qureshi, Gustavo A Salazar, Erik LL Sonnhammer, Silvio CE Tosatto, Lisanna Paladin, Shriya Raj, Lorna J Richardson, Robert D Finn, Alex Bateman
Penelitian Asam Nukleat 2021
Rekayasa protein rasional terpadu dengan pembelajaran representasi mendalam berbasis urutan (UniRep)
Ethan C. Alley, Grigory Khimulya, Surojit Biswas, Mohammed AlQuraishi, George M. Church
Metode Alam 2019
Prottrans: Menuju pemahaman bahasa kehidupan melalui pembelajaran mandiri (ProtBERT)
Ahmed Elnaggar, Michael Heinzinger, Christian Dallago, Ghalia Rehawi, Yu Wang, Llion Jones, Tom Gibbs, Tamas Feher, Christoph Angerer, Martin Steinegger, Debsindhu Bhowmik, dan Burkhard Rost
IEEE PAMI 2021
Struktur dan fungsi biologis muncul dari penskalaan pembelajaran tanpa pengawasan hingga 250 juta rangkaian protein (ESM-1b)
Alexander Rives, Joshua Meier, Tom Sercu, Siddharth Goyal, Zeming Lin, Jason Liu, Demi Guo, Myle Ott, C. Lawrence Zitnick, Jerry Ma, Rob Fergus
PNAS 2021
Transformator MSA (Transformator MSA)
Roshan M Rao, Jason Liu, Robert Verkuil, Joshua Meier, John Canny, Pieter Abbeel, Tom Sercu, Alexander Rives
ICML 2021
Augmentasi Urutan yang Diambil untuk Pembelajaran Representasi Protein (RSA)
Chang Ma, Haiteng Zhao, Lin Zheng, Jiayi Xin, Qintong Li, Lijun Wu, Zhihong Deng, Yang Lu, Qi Liu, Lingpeng Kong
bioRxiv (2023)
OntoProtein: Pelatihan Awal Protein dengan Penanaman Ontologi Gen (OntoProtein)
Ningyu Zhang, Zhen Bi, Xiaozhuan Liang, Siyuan Cheng, Haosen Hong, Shumin Deng, Jiazhang Lian, Qiang Zhang, Huajun Chen
ICLR 2022
Pembelajaran Representasi Protein melalui Knowledge Enhanced Primary Structure Modeling (KeAP)
Hong-Yu Zhou, Yunxiang Fu, Zhicheng Zhang, Cheng Bian, Yizhou Yu
bioRxiv (2023)
Konvolusi dan Penyatuan Intrinsik-Ekstrinsik untuk Pembelajaran Struktur Protein 3D (IEConv)
Pedro Hermosilla, Marco Schäfer, Matěj Lang, Gloria Fackelmann, Pere Pau Vázquez, Barbora Kozlíková, Michael Krone, Tobias Ritschel, Timo Ropinski
ICLR 2021
Prediksi fungsi protein berbasis struktur menggunakan jaringan konvolusional grafik (DeepFRI)
Vladimir Gligorijević, P. Douglas Renfrew, Tomasz Kosciolek, Julia Koehler Leman, Daniel Berenberg, Tommi Vatanen, Chris Chandler, Bryn C. Taylor, Ian M. Fisk, Hera Vlamakis, Ramnik J. Xavier, Rob Knight, Kyunghyun Cho, Richard Bonneau
Komunikasi Alam 2021
Pembelajaran Representasi Protein dengan Pretraining Struktur Geometris (GearNET)
Zuobai Zhang, Minghao Xu, Arian Jamasb, Vijil Chenthamarakshan, Aurelie Lozano, Payel Das, Jian Tang
arXiv:2203.06125 (2022)
Bank Data Protein (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Penelitian Asam Nukleat 2000
Penilaian kritis terhadap metode prediksi struktur protein (CASP)—Putaran XIV (CASP14)
Andriy Kryshtafovych, Torsten Schwede, Maya Topf, Krzysztof Fidelis, John Moult
Protein 2021
Continuous Automated Model EvaluatiOn (CAMEO) melengkapi penilaian kritis prediksi struktur di CASP12 (CAMEO)
Jürgen Haas, Alessandro Barbato, Dario Behringer, Gabriel Studer, Steven Roth, Martino Bertoni, Khaled Mostaguir, Rafal Gumienny, Torsten Schwede
Protein 2017
LGA: metode untuk menemukan kesamaan 3D dalam struktur protein (GDT-TS)
Adam Zemla
Asam Nukleat 2003
Fungsi penilaian untuk penilaian otomatis kualitas templat struktur protein (skor TM)
Yang Zhang, Jeffrey Skolnick
Protein 2004
lDDT: skor bebas superposisi lokal untuk membandingkan struktur dan model protein menggunakan uji perbedaan jarak (lDDT)
Valerio Mariani, Marco Biasini, Alessandro Barbato, Torsten Schwede
Bioinformatika 2013
Prediksi struktur protein yang sangat akurat dengan AlphaFold (AlphaFold)
John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Olaf Ronneberger, Kathryn Tunyasuvunakool, Russ Bates, Augustin Žídek, Anna Potapenko, Alex Bridgland, Clemens Meyer, Simon AA Kohl, Andrew J. Ballard, Andrew Cowie, Bernardino Romera -Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor Kembali, Stig Petersen, David Reiman, Ellen Clancy, Michal Zielinski, Martin Steinegger, Michalina Pacholska, Tamas Berghammer, Sebastian Bodenstein, David Silver, Oriol Vinyals, Andrew W. Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis
Alam 2021)
Server trRosetta untuk prediksi struktur protein yang cepat dan akurat (trRosetta)
Zongyang Du, Hong Su, Wenkai Wang, Lisha Ye, Hong Wei, Zhenling Peng, Ivan Anishchenko, David Baker, Jianyi Yang Nature Protocols 2021
Prediksi akurat struktur dan interaksi protein menggunakan jaringan saraf tiga jalur (RoseTTAFold)
Minkyung Baek, Frank DiMaio, Ivan Anishchenko, Justas Dauparas, Sergey Ovchinnikov, Gyu Rie Lee, Jue Wang, Qian Cong, Lisa N. Kinch, R. Dustin Schaeffer, Claudia Millán, Hahnbeom Park, Carson Adams, Caleb R. Glassman, Andy DeGiovanni, Jose H. Pereira, Andria V. Rodrigues, Alberdina A. van Dijk, Ana C. Ebrecht, Diederik J. Opperman, Theo Sagmeister, Christoph Buhlheller, Tea Pavkov-Keller, Manoj K. Rathinaswamy, Udit Dalwadi, Calvin K. Yip, John E. Burke, K. Christopher Garcia, Nick V. Grishin, Paul D. Adams , Randy J. Baca, David Baker
Sains 2021
Prediksi skala evolusi struktur protein tingkat atom dengan model bahasa (ESMFold)
Zeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Nikita Smetanin, Robert Verkuil, Ori Kabeli, Yaniv Shmueli, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Salvatore Candido, Alexander Rives
Sains 2023
EigenFold: Prediksi Struktur Protein Generatif dengan Model Difusi (EigenFold)
Bowen Jing, Ezra Erives, Peter Pao-Huang, Gabriele Corso, Bonnie Berger, Tommi Jaakkola
arXiv:2304.02198 (2023)
Bank Data Protein (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Penelitian Asam Nukleat 2000
UniProt: basis pengetahuan Protein Universal (UniRef/UniParc)
Rolf Apweiler, Amos Bairoch, Cathy H. Wu, Winona C. Barker, Brigitte Boeckmann, Serenella Ferro, Elisabeth Gasteiger, Hongzhan Huang, Rodrigo Lopez, Michele Magrane, Maria J. Martin, Darren A. Natale, Claire O'Donovan, Nicole Redaschi, Lai-Su L. Yeh
Penelitian Asam Nukleat 2004
CATH: anotasi struktural dan fungsional yang komprehensif untuk urutan genom (CATH)
Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A.Orengo
Penelitian Asam Nukleat 2015
Prediksi langsung profil rangkaian yang kompatibel dengan struktur protein oleh jaringan saraf dengan profil nonlokal berbasis fragmen lokal dan berbasis energi (TS500)
Zhixiu Li, Yuedong Yang, Eshel Faraggi, Jian Zhan, dan Yaoqi Zhou
Protein 2014
ProteinVAE: AutoEncoder Variasi untuk Desain Protein Translasi (ProteinVAE)
Suyue Lyu, Shahin Sowlati-Hashjin, Michael Garton
bioRxiv (2023)
ProT-VAE: AutoEncoder Variasi Transformator Protein untuk Desain Protein Fungsional (ProT-VAE)
Emre Sevgen, Joshua Moller, Adrian Lange, John Parker, Sean Quigley, Jeff Mayer, Poonam Srivastava, Sitaram Gayatri, David Hosfield, Maria Korshunova, Micha Livne, Michelle Gill, Rama Ranganathan, Anthony B. Costa, Andrew L. Ferguson
bioRxiv (2023)
Memperluas ruang urutan protein fungsional menggunakan jaringan permusuhan generatif (ProteinGAN)
Donatas Repecka, Vykintas Jauniskis, Laurynas Karpus, Elzbieta Rembeza, Irmantas Rokaitis, Jan Zrimec, Simona Poviloniene, Audrius Laurynenas, Sandra Viknander, Wissam Abuajwa, Otto Savolainen, Rolandas Meskys, Martin KM Engqvist, Aleksej Zelezniak
Kecerdasan Mesin Alam (2021)
Desain protein yang cepat dan fleksibel menggunakan jaringan saraf grafik dalam (ProteinSolver)
Alexei Strokach, David Becerra, Carles Corbi-Verge, Albert Perez-Riba, Philip M. Kim
Sistem Sel 2020
PiFold: Menuju pelipatan terbalik protein (PiFold) yang efektif dan efisien
Zhangyang Gao, Cheng Tan, Stan Z. Li
ICLR 2023
Desain urutan protein dengan potensi yang dipelajari
Namrata Anand, Raphael Eguchi, Irimpan I. Mathews, Carla P. Perez, Alexander Derry, Russ B. Altman, Po-Ssu Huang
Komunikasi Alam 2022
Desain urutan protein bebas rotamer berdasarkan pembelajaran mendalam dan konsistensi diri (ABACUS-R)
Yufeng Liu, Lu Zhang, Weilun Wang, Min Zhu, Chenchen Wang, Fudong Li, Jiahai Zhang, Houqiang Li, Quan Chen, Haiyan Liu
Ilmu Komputasi Alam 2022
ProRefiner: strategi pemurnian berbasis entropi untuk pelipatan protein terbalik dengan perhatian grafik global (ProRefiner)
Xinyi Zhou, Guangyong Chen, Junjie Ye, Ercheng Wang, Jun Zhang, Cong Mao, Zhanwei Li, Jianye Hao, Xingxu Huang, Jin Tang, Pheng Ann Heng
Komunikasi Alam 2023
Metode desain protein de novo dan validasi fungsi (GPD) yang diawasi oleh Graphormer
Junxi Mu, Zhengxin Li, Bo Zhang, Qi Zhang, Jamshed Iqbal, Abdul Wadood, Ting Wei, Yan Feng, Hai-Feng Chen
Pembekalan Bioinformatika 2024
Belajar Struktur Protein dengan Perceptron Vektor Geometris (GVP-GNN)
Bowen Jing, Stephan Eismann, Patricia Suriana, Raphael John Lamarre Townshend, Ron Dror
ICLR 2021
Mempelajari pelipatan terbalik dari jutaan struktur yang diprediksi (ESM-IF1)
Chloe Hsu, Robert Verkuil, Jason Liu, Zeming Lin, Brian Hie, Tom Sercu, Adam Lerer, Alexander Rives
ICML 2022
Desain urutan protein berbasis pembelajaran mendalam yang kuat menggunakan ProteinMPNN (ProteinMPNN)
J Dauparas, I Anishchenko, N Bennett, H Bai, RJ Ragotte, LF Milles, BIM Wicky, A Courbet, RJ de Haas, N Bethel, PJY Leung, TF Huddy, S Pellock, D Tischer, F Chan, B Koepnick, H Nguyen, A Kang, B Sankaran, AK Bera, NP King, D Baker
Sains 2022
Bank Data Protein (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
Penelitian Asam Nukleat 2000
Database Struktur Protein AlphaFold: memperluas cakupan struktural ruang urutan protein secara besar-besaran dengan model akurasi tinggi (AlphaFoldDB)
Mihaly Varadi, Stephen Anyango, Mandar Deshpande, Sreenath Nair, Cindy Natassia, Galabina Yordanova, David Yuan, Oana Stroe, Gemma Wood, Agata Laydon, Augustin Žídek, Tim Green, Kathryn Tunyasuvunakool, Stig Petersen, John Jumper, Ellen Clancy, Richard Green , Ankur Vora, Mira Lutfi, Michael Figurnov, Andrew Cowie, Nicole Hobbs, Pushmeet Kohli, Gerard Kleywegt, Ewan Birney, Demis Hassabis, Sameer Velankar
Penelitian Asam Nukleat 2022
SCOP: Klasifikasi struktural database protein untuk penyelidikan urutan dan struktur (SCOP)
Alexei G. Murzin, Steven E. Brenner, Tim Hubbard, Cyrus Chothia JMB 1995
SCOPe: perbaikan pada klasifikasi struktural protein – database yang diperluas untuk memfasilitasi interpretasi varian dan pembelajaran mesin (SCOPe)
John-Marc Chandonia, Lindsey Guan, Shiangyi Lin, Changhua Yu, Naomi K Fox, Steven E Brenner Penelitian Asam Nukleat 2022
CATH: anotasi struktural dan fungsional yang komprehensif untuk urutan genom (CATH)
Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A.Orengo
Penelitian Asam Nukleat 2015
Pemodelan probabilistik difusi tulang punggung protein dalam 3D untuk masalah perancah motif (ProtDiff)
Brian L. Trippe, Jason Yim, Doug Tischer, David Baker, Tamara Broderick, Regina Barzilay, Tommi Jaakkola
ICLR 2023
Pembuatan struktur protein melalui difusi lipat (FoldingDiff)
Kevin E. Wu, Kevin K. Yang, Rianne van den Berg, Sarah Alamdari, James Y. Zou, Alex X. Lu, Ava P. Amini
Komunikasi Alam 2024
Model Difusi Laten untuk Pembuatan Struktur Protein (LatentDiff)
Cong Fu, Keqiang Yan, Limei Wang, Wing Yee Au, Michael McThrow, Tao Komikado, Koji Maruhashi, Kanji Uchino, Xiaoning Qian, Shuiwang Ji
Log 2023
Menghasilkan Struktur Protein yang Baru, Dapat Didesain, dan Beragam dengan Mendifusikan Awan Residu Berorientasi Secara Ekuivalen (Genie)
Yeqing Lin, Mohammed AlQuraishi
arXiv:2301.12485 (2023)
Model difusi SE(3) dengan aplikasi pada pembuatan tulang punggung protein (FrameDiff)
Jason Yim, Brian L. Trippe, Valentin De Bortoli, Emile Mathieu, Arnaud Doucet, Regina Barzilay, Tommi Jaakkola
ICML 2023
Desain de novo struktur dan fungsi protein dengan RFdiffusion (RFDiffusion)
Joseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile IM Wicky, Nikita Hanikel , Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Sergey Ovchinnikov, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker
Alam 2023
Model Bahasa Protein Dibimbing Metode Desain Tulang Punggung Protein yang Tepat dan Efisien (GPDL)
Bo Zhang, Kexin Liu, Zhuoqi Zheng, Yunfeiyang Liu, Junxi Mu, Ting Wei, Hai-Feng Chen
bioRxiv (2023)
Desain Gabungan Urutan dan Struktur Protein Berdasarkan Motif (GeoPro)
Lagu Zhenqiao, Yunlong Zhao, Lagu Yufei, Wenxian Shi, Yang Yang, Lei Li
arXiv:2310.02546 (2023)
Model generatif protein semua atom (Protpardelle)
Alexander E. Chu, Lucy Cheng, Gina El Nesr, Minkai Xu, Po-Ssu Huang
bioRxiv (2023)
Desain Bersama Urutan dan Struktur Protein dengan Terjemahan Ekuivalen (ProtSeed)
Chence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang
ICLR 2023
Pembelajaran Representasi Antibodi untuk Penemuan Obat (BERTTransformer)
Lin Li, Esther Gupta, John Spaeth, Leslie Shing, Tristan Bepler, Rajmonda Sulo Caceres
arXiv:2210.02881 (2022)
Menguraikan pematangan afinitas antibodi dengan model bahasa dan pembelajaran dengan pengawasan lemah (AntiBERTy)
Jeffrey A. Ruffolo, Jeffrey J. Gray, Jeremias Sulam
arXiv:2112.07782 (2021)
Menguraikan bahasa antibodi menggunakan pembelajaran mandiri (AntiBERTa)
Jinwoo Leem, Laura S. Mitchell, James HR Farmery, Justin Barton, Jacob D. Galson
Pola 2022
AbLang: model bahasa antibodi untuk melengkapi urutan antibodi (AbLang)
Tobias H Olsen, Iain H Moal, Charlotte M Deane
Bioinformatika Maju 2022
Pra-pelatihan dengan Pendekatan Rasional untuk Antibodi (PARA)
Xiangrui Gao, Changling Cao, Lipeng Lai
bioRxiv (2023)
SAbDab: database antibodi struktural (SAbDab)
James Dunbar, Konrad Krawczyk, Jinwoo Leem, Terry Baker, Angelika Fuchs, Guy Georges, Jiye Shi, Charlotte M. Deane
Penelitian Asam Nukleat 2014
RosettaAntibodyDesign (RAbD): Kerangka kerja umum untuk desain antibodi komputasi (RAB)
Jared Adolf-Bryfogle, Oleks Kalyuzhniy, Michael Kubitz, Brian D. Weitzner, Xiaozhen Hu, Yumiko Adachi, William R. Schief, Roland L. Dunbrack, Jr.
Biologi Komputasi PLOS 2018
tFold-Ab: Prediksi Struktur Antibodi yang Cepat dan Akurat tanpa Homolog Urutan (tFold-Ab)
Jiaxiang Wu, Fandi Wu, Biaobin Jiang, Wei Liu, Peilin Zhao
bioRxiv (2022)
xTrimoABFold: Prediksi Struktur Antibodi De novo tanpa MSA (xTrimoABFold)
Yining Wang, Xumeng Gong, Shaochuan Li, Bing Yang, YiWu Sun, Chuan Shi, Yangang Wang, Cheng Yang, Hui Li, Le Song
arXiv:2212.00735 (2022)
ImmuneBuilder: Model Pembelajaran Mendalam untuk memprediksi struktur protein imun (ABodyBuilder)
Brennan Abanades, Wing Ki Wong, Fergus Boyles, Guy Georges, Alexander Bujotzek, Charlotte M. Deane
Alam 2023
ABlooper: prediksi struktur loop CDR antibodi yang cepat dan akurat dengan estimasi akurasi (ABlooper)
Brennan Abanades, Guy Georges, Alexander Bujotzek, Charlotte M Deane
Bioinformatika 2022
Potensi geometris dari pembelajaran mendalam meningkatkan prediksi struktur loop CDR H3 (DeepH3)
Jeffrey A Ruffolo, Carlos Guerra, Sai Pooja Mahajan, Jeremias Sulam, Jeffrey J Gray
Bioinformatika 2020
Model Pembelajaran Mendalam End-to-end Sederhana untuk Prediksi Struktur Loop CDR-H3 (SimpleDH3)
Natalia Zenkova, Ekaterina Sedykh, Tatiana Shugaeva, Vladislav Strashko, Timofei Ermak, Aleksei Shpilman
arXiv:2111.10656 (2021)
Prediksi struktur antibodi menggunakan pembelajaran mendalam yang dapat ditafsirkan (DeepAB)
Jeffrey A Ruffolo, Jeremias Sulam, Jeffrey J Gray
Pola 2021
Prediksi struktur antibodi yang cepat dan akurat dari pembelajaran mendalam pada kumpulan besar antibodi alami (IgFold)
Jeffrey A Ruffolo, Lee-Shin Chu, Sai Pooja Mahajan, Jeffrey J Gray
Komunikasi Alam 2023
SAbDab: database antibodi struktural (SAbDab)
James Dunbar, Konrad Krawczyk, Jinwoo Leem, Terry Baker, Angelika Fuchs, Guy Georges, Jiye Shi, Charlotte M. Deane
Penelitian Asam Nukleat 2014
RosettaAntibodyDesign (RAbD): Kerangka kerja umum untuk desain antibodi komputasi (RAB)
Jared Adolf-Bryfogle, Oleks Kalyuzhniy, Michael Kubitz, Brian D. Weitzner, Xiaozhen Hu, Yumiko Adachi, William R. Schief, Roland L. Dunbrack, Jr.
Biologi Komputasi PLOS 2018
SKEMPI 2.0: tolak ukur terkini perubahan energi pengikatan protein-protein, kinetika dan termodinamika pada saat mutasi (SKEMPI)
Justina Jankauskaite, Brian Jiménez-García, Justas Dapkunas, Juan Fernández-Recio, Iain H Moal
Bioinformatika 2019
Bukti in silico tentang prinsip desain antibodi berbasis pembelajaran mesin pada skala yang tidak dibatasi
Rahmad Akbara, Philippe A. Roberta, Cédric R. Weberb, Michael Widrichc, Robert Franka, Milena Pavlovićd, Lonneke Schefferd, Maria Chernigovskayaa, Igor Snapkova, Andrei Slabodkina, Brij Bhushan Mehtaa, Enkelejda Mihoe, Fridtjof Lund-Johansena, Jan Terje Andersena, f, Sepp Hochreiterc,g, Ingrid Hobæk Haffh, Günter Klambauerc, Geir Kjetil Sandved, Victor Greiff
mAbs 2022https://www.tandfonline.com/doi/full/10.1080/19420862.2022.2031482
Jaringan Neural Grafik Penyempurnaan Iteratif untuk Desain Bersama Struktur Urutan Antibodi (RefineGNN)
Wengong Jin, Jeremy Wohlwend, Regina Barzilay, Tommi Jaakkola
ICLR 2022
Desain Antibodi Bersyarat sebagai Terjemahan Grafik Ekuivalen 3D (MEAN)
Xiangzhe Kong, Wenbing Huang, Yang Liu
ICLR 2023
MLP Lintas Gerbang dengan Penyematan Invarian Kompleks Protein adalah Perancang Antibodi Sekali Pakai (ADesigner)
Cheng Tan, Zhangyang Gao, Lirong Wu, Jun Xia, Jiangbin Zheng, Xihong Yang, Yue Liu, Bozhen Hu, Stan Z. Li
AAAI 2024
Desain dan Optimasi Antibodi Spesifik Antigen dengan Model Generatif Berbasis Difusi untuk Struktur Protein (DiffAb)
Shitong Luo, Yufeng Su, Xingang Peng, Sheng Wang, Jian Peng, Jianzhu Ma
NeuroIPS 2022
Pembelajaran Mendalam untuk Docking dan Desain Protein yang Fleksibel dan Spesifik Lokasi (DockGPT)
Matt McPartlon, Jinbo Xu
bioRxiv (2023)
Docking dan Desain Antibodi-Antigen melalui Hierarchical Equivariant Refinement (HERN)
Wengong Jin, Dr.Regina Barzilay, Tommi Jaakkola
ICML 2022
Desain Antibodi Atom Penuh Ujung-ke-Ujung (dyMEAN)
Xiangzhe Kong, Wenbing Huang, Yang Liu
ICML 2023
Model Difusi Kontrasif Multi-Modal untuk Generasi Peptida Terapeutik (MMCD)
Yongkang Wang, Xuan Liu, Feng Huang, Zhankun Xiong, Wen Zhang
AAAI 2024
PepGB: Memfasilitasi penemuan obat peptida melalui jaringan saraf grafik (PepGB)
Yipin Lei, Xu Wang, Meng Fang, Han Li, Xiang Li, Jianyang Zeng
arXiv:2401.14665 (2024)
PepHarmony: Kerangka Pembelajaran Kontrastif Multi-Tampilan untuk Pengkodean Peptida Berbasis Urutan dan Struktur Terintegrasi (PepHarmony)
Ruochi Zhang, Haoran Wu, Chang Liu, Huaping Li, Yuqian Wu, Kewei Li, Yifan Wang, Yifan Deng, Jiahui Chen, Fengfeng Zhou, Xin Gao
arXiv:2401.11360 (2024)
PEFT-SP: Penyempurnaan Parameter Efisien pada Model Bahasa Protein Besar Meningkatkan Prediksi Peptida Sinyal (PEFT-SP)
Shuai Zeng, Duolin Wang, Dong Xu
bioRxiv (2023)
AdaNovo: Urutan Peptida De Novo Adaptif dengan Informasi Saling Bersyarat (AdaNovo)
Jun Xia, Shaorong Chen, Jingbo Zhou, Tianze Ling, Wenjie Du, Sizhe Liu, Stan Z. Li
arXiv:2403.07013 (2024)