업데이트: 우리 논문이 생물정보학 브리핑에 채택되었습니다!
설문조사 논문 " 새로운 약물 발견을 위한 생성 AI 조사: 분자 및 단백질 설계의 새로운 개척" 저장소입니다.
Xiangru Tang 1 *, Howard Dai 1 *, Elizabeth Knight 1 *, Yunyang Li 1 , Fang Wu 2 , Tianxiao Li 1 , Mark Gerstein 1
1. 예일 대학교; 2. 스탠포드 대학교
(*: 균등기여)
[**]는 부록 섹션을 나타냅니다.
부분 | 일부 | 데이터 세트 | 측정항목 | 모델 |
---|---|---|---|---|
분자 | 대상에 구애받지 않는 생성 | 데이터 세트 | 측정항목 | 모델 |
분자 | 타겟 인식 생성 | 데이터 세트 | 측정항목 | 모델 |
분자 | 형태 생성** | 데이터 세트 | 측정항목 | 모델 |
단백질 | 표현 학습** | 데이터 세트 | 모델 | |
단백질 | 구조 예측 | 데이터 세트 | 측정항목 | 모델 |
단백질 | 시퀀스 생성 | 데이터 세트 | 측정항목 | 모델 |
단백질 | 백본 디자인 | 데이터 세트 | 측정항목 | 모델 |
항독소 | 표현 학습** | 데이터 세트 | 모델 | |
항독소 | 구조 예측** | 데이터 세트 | 측정항목 | 모델 |
항독소 | CDR 생성** | 데이터 세트 | 측정항목 | 모델 |
펩타이드 | 기타 작업** | 모델 |
@article{tang2024survey,
title={A survey of generative ai for de novo drug design: new frontiers in molecule and protein generation},
author={Tang, Xiangru and Dai, Howard and Knight, Elizabeth and Wu, Fang and Li, Yunyang and Li, Tianxiao and Gerstein, Mark},
journal={Briefings in Bioinformatics},
volume={25},
number={4},
year={2024},
publisher={Oxford Academic}
}
우리 논문에서 다루는 주제에 대한 개요입니다. 파란색으로 표시된 부분은 본문에서 볼 수 있고, 보라색 부분은 부록에서 볼 수 있는 확장 부분입니다.
134킬로 분자(QM9)의 양자화학 구조와 특성
Raghunathan Ramakrishnan, Pavlo O. Dral, Matthias Rupp, O. Anatole von Lilienfeld
과학 데이터(2014)
GEOM, 특성 예측 및 분자 생성을 위한 에너지 주석 분자 구조 (GEOM)
사이먼 액설로드, 라파엘 고메즈-봄바렐리
과학 데이터(2022)
데이터 기반 연속 분자 표현(CVAE)을 사용한 자동 화학 설계
Rafael Gómez-Bombarelli, Jennifer N. Wei, David Duvenaud, JoséMiguel Hernández-Lobato, BenjamínSánchez-Lengeling, Dennis Sheberla, Jorge Aguilera-Iparraguirre, Timothy D. Hirzel, Ryan P. Adams 및 Alán Aspuru-Guzik
ACS 중앙과학(2018)
GVAE( 문법 변형 자동 인코더 )
맷 J. 커스너, 브룩스 페이지, 호세 미구엘 에르난데스-로바토
ICML 2017
구조화된 데이터를 위한 구문 지향 변형 자동 인코더 (SD-VAE)
한준 다이, 잉타오 티안, 보다 다이, 스티븐 스키에나, 르 송
ICLR 2018
분자 그래프 생성을 위한 접합 트리 변형 자동 인코더 (JT-VAE)
웬공 진, 레지나 바르질레이, 토미 야콜라
ICML 2018
E(n) 등변 정규화 흐름 (E-NF)
빅터 가르시아 사토라스, 에미엘 후게붐, 파비안 푹스, 잉마르 포즈너, 맥스 웰링
NeurIPS 2021
분자의 표적 발견을 위한 대칭 적응형 3D 포인트 세트 생성 (G-SchNet)
니클라스 게바우어, 마이클 가스테거, 크리스토프 쉬트
NeurIPS 2019
3D 분자 생성을 위한 등변 확산 (EDM)
에미엘 후게붐, 빅터 가르시아 사토라스, 클레망 비냐크, 맥스 웰링
ICML 2022
3D 분자 생성 및 최적화를 위한 기하학적 완전 확산 (GCDM)
알렉스 모어헤드, 지안린 쳉
arXiv:2302.04313 (2023)
MDM: 3차원 분자 생성을 위한 분자 확산 모델 (MDM)
Lei Huang, Hengtong Zhang, Tingyang Xu, Ka-Chun Wong
AAAI 2023
3차원 분자 생성을 위한 기하학적 잠재 확산 모델 (GeoLDM)
Minkai Xu, Alexander S Powers, Ron O. Dror, Stefano Ermon, Jure Leskovec
ICML 2023
완전 분자 생성(JODO)을 위한 공동 2D 및 3D 확산 모델 학습
Han Huang, Leilei Sun, Bowen Du, Weifeng Lv
arXiv:2305.12347 (2023)
MiDi: 분자 생성을 위한 혼합 그래프 및 3D 노이즈 제거 확산 (MiDi)
클레망 비냐크, 나감 오스만, 로라 토니, 파스칼 프로사드
arXiv:2302.09048 (2023)
구조 기반 약물 설계를 위한 3차원 합성곱 신경망 및 크로스 도킹 데이터 세트 (CrossDocked2020)
Paul G. Francoeur, Tomohide Masuda, Jocelyn Sunseri, Andrew Jia, Richard B. Iovanisci, Ian Snyder, David R. Koes
ACS JCIM 2020
ZINC20—리간드 발견을 위한 무료 초대형 화학 데이터베이스 (ZINC20)
John J. Irwin, Khanh G. Tang, Jennifer Young, Chinzorig Dandarchuluun, Benjamin R. Wong, Munkhzul Khurelbaatar, Yurii S. Moroz, John Mayfield, Roger A. Sayle
ACS JCIM 2020
바인딩 MOAD(모든 데이터베이스의 어머니) (바인딩 MOAD)
Liegi Hu, Mark L. Benson, Richard D. Smith, Michael G. Lerner, 헤더 A. 칼슨
단백질 2005
AutoDock Vina: 새로운 채점 기능, 효율적인 최적화, 멀티스레딩으로 도킹 속도와 정확도 향상 (Vina AutoDock)
올렉 트로트, 아서 J. 올슨
JCC 2010
약물의 화학적 아름다움 정량화 (QED) G Richard Bickerton, Gaia V Paolini, Jérémy Besnard, Sorel Muresan, Andrew L Hopkins
자연화학(2012)
분자 복잡성 및 단편 기여도를 기반으로 한 약물 유사 분자의 합성 접근성 점수 추정 (SAScore)
Peter Ertl, Ansgar Schuffenhauer Journal of Cheminformatics 2009
DrugGPT: 특정 단백질을 표적으로 하는 잠재적 리간드 설계를 위한 GPT 기반 전략 (DrugGPT)
Yuesen Li, Chengyi Gao, Xin Song, Xiangyu Wang, Yungang Xu, Suxia Han
바이오Rxiv(2023)
심층 생성 모델(LiGAN)을 사용하여 수용체 결합 부위에 조건부로 3D 분자 구조 생성
마스다 토모히데, 매튜 라고자, 데이빗 라이언 코스
arXiv:2010.14442 (2020)
Pocket2Mol: 3D 단백질 주머니를 기반으로 한 효율적인 분자 샘플링 (Pocket2Mol)
Xingang Peng, Shitong Luo, Jiaqi Guan, Qi Xie, Jian Peng, Jianzhu Ma
ICML 2022
구조 기반 약물 설계를 위한 3D 생성 모델
Shitong Luo, Jiaqi Guan, Jianzhu Ma, Jian Peng
NeurIPS 2021
표적 인식 분자 생성 및 친화도 예측을 위한 3D 등변 확산 (TargetDiff)
Jiaqi Guan, Wesley Wei Qian, Xingang Peng, Yufeng Su, Jian Peng, Jianzhu Ma
ICLR 2023
등변 확산 모델(DiffSBDD)을 사용한 구조 기반 약물 설계
아르네 슈뉴잉, Yuanqi Du, 찰스 해리스, Arian Jamasb, Ilia Igashov, Weitao Du, Tom Blundell, Pietro Lió, Carla Gomes, Max Welling, Michael Bronstein, Bruno Correia
arXiv:2210.13695 (2022)
GEOM, 특성 예측 및 분자 생성을 위한 에너지 주석 분자 구조 (GEOM)
사이먼 액설로드, 라파엘 고메즈-봄바렐리
2022년 과학 데이터
SchNet: 양자 상호 작용 모델링을 위한 연속 필터 컨벌루션 신경망 (ISO17)
크리스토프 쉬트, 피터 얀 킨더만스, 후지엘 에녹 사우세다 펠릭스, 스테판 크미엘라, 알렉상드르 트카첸코, 클라우스-로베르트 뮐러
NeurIPS 2017
심층 생성 그래프 신경망(CVGAE)을 사용한 분자 기하학 예측
엘만 만시모프(Elman Mansimov), 오마르 마흐무드(Omar Mahmood), 강석호, 조경현
2019년 과학 보고서
분자 거리 기하학을 위한 생성 모델 (GraphDG)
그레고르 NC 심, 호세 미구엘 에르난데스-로바토
ICML 2020
분자 형태 생성(CGCF)을 위한 신경 생성 역학 학습
민카이 쉬, 시퉁 루오, 요슈아 벤지오, 지안 펭, 지안 탕
ICLR 2021
GeoMol: 분자 3D 순응체 앙상블의 비틀림 기하학적 생성 (GeoMol)
옥타비안 가네아, 라그나짓 파타나익, 코너 콜리, 레지나 바르질레이, 클라브스 젠슨, 윌리엄 그린, 토미 야콜라
NeurIPS 2021
분자 형태 생성(ConfGF)을 위한 기울기 필드 학습
Chence Shi, Shitong Luo, Minkai Xu, Jian Tang
ICML 2021
동적 그래프 점수 매칭(DGSM)을 통한 분자 형태 예측
Shitong Luo, Chence Shi, Minkai Xu, Jian Tang
NeurIPS 2021
GeoDiff: 분자 형태 생성을 위한 기하학적 확산 모델 (GeoDiff)
Minkai Xu, Lantao Yu, Yang Song, Chence Shi, Stefano Ermon, Jian Tang
ICLR 2022
UniProt: 범용 단백질 지식 베이스 (UniProt)
Rolf Apweiler, Amos Bairoch, Cathy H. Wu, Winona C. Barker, Brigitte Boeckmann, Serenella Ferro, Elisabeth Gasteiger, Hongzhan Huang, Rodrigo Lopez, Michele Magrane, Maria J. Martin, Darren A. Natale, Claire O'Donovan, Nicole Redaschi, 라이수 L. 예
핵산 연구 2004
OntoProtein: 유전자 온톨로지 임베딩을 사용한 단백질 사전 훈련 (ProteinKG)
Ningyu Zhang, Zhen Bi, Xiaozhuan Liang, Siyuan Cheng, Haosen Hong, Shumin Deng, Jiazhang Lian, Qiang Zhang, Huajun Chen
ICLR 2022
단백질 데이터 뱅크 (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
핵산 연구 2000
AlphaFold 단백질 구조 데이터베이스: 고정밀 모델(AlphaFoldDB)을 통해 단백질 서열 공간의 구조적 적용 범위를 대폭 확장합니다.
미하이 바라디, 스티븐 안양고, 만다르 데쉬판데, 스리나스 나이르, 신디 나타시아, 갈라비나 요르다노바, 데이빗 위안, 오아나 스트로, 젬마 우드, 아가타 레이던, 오거스틴 지덱, 팀 그린, 캐서린 투냐수부나쿨, 스티그 피터슨, 존 점퍼, 엘렌 클랜시, 리차드 그린 , Ankur Vora, Mira Lutfi, Michael Figurnov, 앤드류 카위, 니콜 홉스, 푸쉬미트 콜리, 제라드 클레웨그트, 이완 버니, 데미스 허사비스, 사미어 벨란카르
핵산 연구 2022
Pfam: 2021년 단백질 계열 데이터베이스 (Pfam)
Jaina Mistry, Sara Chuguransky, Lowri Williams, Matloob Qureshi, Gustavo A Salazar, Erik LL Sonnhammer, Silvio CE Tosatto, Lisanna Paladin, Shriya Raj, Lorna J Richardson, Robert D Finn, Alex Bateman
핵산 연구 2021
서열 기반 심층 표현 학습(UniRep)을 통한 통합 합리적 단백질 엔지니어링
Ethan C. Alley, Grigory Khimulya, Surojit Biswas, Mohammed AlQuraishi, George M. Church
네이처 메소드 2019
Prottrans: 자기주도학습(ProtBERT)을 통해 삶의 언어를 이해하는 방향
Ahmed Elnaggar, Michael Heinzinger, Christian Dallago, Ghalia Rehawi, Yu Wang, Llion Jones, Tom Gibbs, Tamas Feher, Christoph Angerer, Martin Steinegger, Debsindhu Bhowmik 및 Burkhard Rost
IEEE PAMI 2021
비지도 학습을 2억 5천만 개의 단백질 서열(ESM-1b)로 확장하여 생물학적 구조와 기능이 나타납니다.
Alexander Rives, Joshua Meier, Tom Sercu, Siddharth Goyal, Zeming Lin, Jason Liu, Demi Guo, Myle Ott, C. Lawrence Zitnick, Jerry Ma, Rob Fergus
PNAS 2021
MSA 변압기 (MSA 변압기)
Roshan M Rao, Jason Liu, Robert Verkuil, Joshua Meier, John Canny, Pieter Abbeel, Tom Sercu, Alexander Rives
ICML 2021
단백질 표현 학습(RSA)을 위한 검색된 서열 확대
Chang Ma, Haiteng Zhao, Lin Zheng, Jiayi Xin, Qintong Li, Lijun Wu, Zhihong Deng, Yang Lu, Qi Liu, Lingpeng Kong
바이오Rxiv(2023)
OntoProtein: 유전자 온톨로지 임베딩을 사용한 단백질 사전 훈련 (OntoProtein)
Ningyu Zhang, Zhen Bi, Xiaozhuan Liang, Siyuan Cheng, Haosen Hong, Shumin Deng, Jiazhang Lian, Qiang Zhang, Huajun Chen
ICLR 2022
KeAP( Knowledge Enhanced Primary Structure Modeling)를 통한 단백질 표현 학습
저우홍유, 푸윈샹, 장즈청, 쳉비안, 유이저우
바이오Rxiv(2023)
3D 단백질 구조 학습을 위한 내재적-외적 컨벌루션 및 풀링 (IEConv)
페드로 에르모시야, 마르코 셰퍼, 마테이 랑, 글로리아 파켈만, 페레 파우 바스케스, 바르보라 코즐리코바, 마이클 크로네, 토비아스 리첼, 티모 로핀스키
ICLR 2021
그래프 컨벌루션 네트워크(DeepFRI)를 이용한 구조 기반 단백질 기능 예측
Vladimir Gligorijević, P. Douglas Renfrew, Tomasz Kosciolek, Julia Koehler Leman, Daniel Berenberg, Tommi Vatanen, Chris Chandler, Bryn C. Taylor, Ian M. Fisk, Hera Vlamakis, Ramnik J. Xavier, Rob Knight, 조경현, Richard Bonneau
네이처 커뮤니케이션즈 2021
기하학적 구조 사전 훈련(GearNET)을 통한 단백질 표현 학습
Zuobai Zhang, Minghao Xu, Arian Jamasb, Vijil Chenthamarakshan, Aurelie Lozano, Payel Das, Jian Tang
arXiv:2203.06125 (2022)
단백질 데이터 뱅크 (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
핵산 연구 2000
단백질 구조 예측 방법에 대한 비판적 평가(CASP) - 14차 (CASP14)
안드리 크리슈타포비치, 토르스텐 슈베데, 마야 토프, 크시슈토프 피델리스, 존 몰트
단백질 2021
CASP12(CAMEO)의 구조 예측에 대한 중요한 평가를 보완하는 지속적 자동화 모델 평가(CAMEO)
위르겐 하스, 알레산드로 바르바토, 다리오 베링거, 가브리엘 스튜더, 스티븐 로스, 마르티노 베르토니, 칼레드 모스타기르, 라팔 구미에니, 토르스텐 슈베데
단백질 2017
LGA: 단백질 구조의 3차원 유사성을 찾는 방법 (GDT-TS)
아담 젬라
핵산 2003
단백질 구조 템플릿 품질(TM-점수)의 자동 평가를 위한 채점 기능
양 장, 제프리 스콜닉
단백질 2004
lDDT: 거리차 테스트(lDDT)를 사용하여 단백질 구조와 모델을 비교하기 위한 국소 중첩 없는 점수
발레리오 마리아니, 마르코 비아시니, 알레산드로 바르바토, 토르스텐 슈베데
생물정보학 2013
AlphaFold(AlphaFold)를 이용한 매우 정확한 단백질 구조 예측
존 점퍼, 리처드 에반스, 알렉산더 프리첼, 팀 그린, 마이클 피거노프, 올라프 로네베르거, 캐서린 투냐수부나쿨, 러스 베이츠, 오거스틴 지덱, 안나 포타펜코, 알렉스 브리드글랜드, 클레멘스 메이어, 사이먼 AA 콜, 앤드류 J. 발라드, 앤드루 코위, 베르나르디노 로메라 - 파레데스, 스타니슬라프 니콜로프, 리슈브 제인, 조나스 애들러, 트레버 백, Stig Petersen, David Reiman, Ellen Clancy, Michal Zielinski, Martin Steinegger, Michalina Pacholska, Tamas Berghammer, Sebastian Bodenstein, David Silver, Oriol Vinyals, Andrew W. Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis
네이처 2021)
빠르고 정확한 단백질 구조 예측을 위한 trRosetta 서버 (trRosetta)
Zongyang Du, Hong Su, Wenkai Wang, Lisha Ye, Hong Wei, Zhenling Peng, Ivan Anishchenko, David Baker, Jianyi Yang Nature Protocols 2021
3트랙 신경망(RoseTTAFold)을 이용한 단백질 구조 및 상호작용의 정확한 예측
백민경, Frank DiMaio, Ivan Anishchenko, Justas Dauparas, Sergey Ovchinnikov, 이규리, Jue Wang, Qian Cong, Lisa N. Kinch, R. Dustin Schaeffer, Claudia Millán, 박한범, Carson Adams, Caleb R. Glassman, Andy DeGiovanni, Jose H. Pereira, Andria V. Rodrigues, Alberdina A. van Dijk, Ana C. Ebrecht, Diederik J. Opperman, Theo Sagmeister, Christoph Buhlheller, Tea Pavkov-Keller, Manoj K. Rathinaswamy, Udit Dalwadi, Calvin K. Yip, John E. Burke, K. Christopher Garcia, Nick V. Grishin , 폴 D. 아담스, 랜디 J. 리드, 데이비드 베이커
과학 2021
언어 모델(ESMFold)을 이용한 원자 수준 단백질 구조의 진화적 규모 예측
Zeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Nikita Smetanin, Robert Verkuil, Ori Kabeli, Yaniv Shmueli, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Salvatore Candido, Alexander Rives
과학 2023
EigenFold: 확산 모델을 이용한 생성적 단백질 구조 예측 (EigenFold)
보웬 징, 에즈라 에리브스, 피터 파오-황, 가브리엘 코르소, 보니 버거, 토미 야콜라
arXiv:2304.02198 (2023)
단백질 데이터 뱅크 (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
핵산 연구 2000
UniProt: 범용 단백질 지식 베이스 (UniRef/UniParc)
Rolf Apweiler, Amos Bairoch, Cathy H. Wu, Winona C. Barker, Brigitte Boeckmann, Serenella Ferro, Elisabeth Gasteiger, Hongzhan Huang, Rodrigo Lopez, Michele Magrane, Maria J. Martin, Darren A. Natale, Claire O'Donovan, Nicole Redaschi, 라이수 L. 예
핵산 연구 2004
CATH: 게놈 서열에 대한 포괄적인 구조적 및 기능적 주석 (CATH)
Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A. 오렌고
2015년 핵산 연구
단편 기반 로컬 프로파일과 에너지 기반 비로컬 프로파일을 갖춘 신경망을 통해 단백질 구조와 호환되는 서열 프로파일을 직접 예측 (TS500)
Zhixiu Li, Yuedong Yang, Eshel Faraggi, Jian Zhan, Yaoqi Zhou
단백질 2014
ProteinVAE: 중개 단백질 설계를 위한 변형 자동 인코더 (ProteinVAE)
Suyue Lyu, Shahin Sowlati-Hashjin, 마이클 가튼
바이오Rxiv(2023)
ProT-VAE: 기능성 단백질 설계를 위한 단백질 변환기 변형 자동 인코더 (ProT-VAE)
엠레 세브겐, 조슈아 몰러, 아드리안 랭, 존 파커, 션 퀴글리, 제프 메이어, 푸남 스리바스타바, 시타람 가야트리, 데이비드 호스필드, 마리아 코르슈노바, 미카 리브네, 미셸 길, 라마 랑가나단, 앤서니 B. 코스타, 앤드루 L. 퍼거슨
바이오Rxiv(2023)
생성적 적대 네트워크(ProteinGAN)를 사용하여 기능성 단백질 서열 공간 확장
도나타스 레페카, 비킨타스 야우니스키스, 로우리나스 카르푸스, 엘즈비에타 렘베자, 이르만타스 로카이티스, 얀 즈리멕, 시모나 포빌로니엔, 아우드리우스 로리네나스, 산드라 비크난더, 위삼 아부아와, 오토 사볼라이넨, 롤란다스 메스키스, 마틴 KM 엥크비스트, 알렉세이 젤레즈니악
네이처 머신 인텔리전스(2021)
딥 그래프 신경망을 이용한 빠르고 유연한 단백질 설계 (ProteinSolver)
Alexey Strokach, David Becerra, Carles Corbi-Verge, Albert Perez-Riba, Philip M. Kim
세포 시스템 2020
PiFold: 효과적이고 효율적인 단백질 역폴딩(PiFold)을 향하여
장양 가오(Zhangyang Gao), 쳉 탄(Cheng Tan), 스탠 Z. 리(Stan Z. Li)
ICLR 2023
학습된 잠재력을 지닌 단백질 서열 설계
Namrata Anand, Raphael Eguchi, Irimpan I. Mathews, Carla P. Perez, Alexander Derry, Russ B. Altman, Po-Ssu Huang
네이처 커뮤니케이션즈 2022
딥러닝 및 자기 일관성을 기반으로 한 Rotamer-free 단백질 서열 설계 (ABACUS-R)
Yufeng Liu, Lu Zhang, Weilun Wang, Min Zhu, Chenchen Wang, Fudong Li, Jiahai Zhang, Houqiang Li, Quan Chen, Haiyan Liu
자연계산과학 2022
ProRefiner: 글로벌 그래프에 주목하는 역단백질 접힘을 위한 엔트로피 기반 정제 전략 (ProRefiner)
Xinyi Zhou, Guangyong Chen, Junjie Ye, Ercheng Wang, Jun Zhang, Cong Mao, Zhanwei Li, Jianye Hao, Xingxu Huang, Jin Tang, Pheng Ann Heng
네이처 커뮤니케이션즈 2023
Graphormer가 감독한 새로운 단백질 설계 방법 및 기능 검증 (GPD)
Junxi Mu, Zhengxin Li, Bo Zhang, Qi Zhang, Jamshed Iqbal, Abdul Wadood, Ting Wei, Yan Feng, Hai-Feng Chen
2024년 생물정보학 브리핑
기하학적 벡터 퍼셉트론(GVP-GNN)을 사용한 단백질 구조 학습
보웬 징, 스테판 아이스만, 패트리샤 수리아나, 라파엘 존 라마르 타운센드, 론 드로르
ICLR 2021
수백만 개의 예측 구조로부터 역접힘 학습 (ESM-IF1)
클로이 수, 로버트 버쿠일, 제이슨 리우, 제밍 린, 브라이언 히, 톰 세르쿠, 아담 레러, 알렉산더 리브스
ICML 2022
ProteinMPNN(ProteinMPNN)을 이용한 강력한 딥러닝 기반 단백질 서열 설계
J Dauparas, I Anishchenko, N Bennett, H Bai, RJ Ragotte, LF Milles, BIM Wicky, A Courbet, RJ de Haas, N Bethel, PJY Leung, TF Huddy, S Pellock, D Tischer, F Chan, B Koepnick, H Nguyen, A Kang, B Sankaran, AK Bera, NP King, D Baker
과학 2022
단백질 데이터 뱅크 (PDB)
Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, TN Bhat, Helge Weissig, Ilya N. Shindyalov, Philip E. Bourne
핵산 연구 2000
AlphaFold 단백질 구조 데이터베이스: 고정밀 모델(AlphaFoldDB)을 통해 단백질 서열 공간의 구조적 적용 범위를 대폭 확장합니다.
미하이 바라디, 스티븐 안양고, 만다르 데쉬판데, 스리나스 나이르, 신디 나타시아, 갈라비나 요르다노바, 데이빗 위안, 오아나 스트로, 젬마 우드, 아가타 레이던, 오거스틴 지덱, 팀 그린, 캐서린 투냐수부나쿨, 스티그 피터슨, 존 점퍼, 엘렌 클랜시, 리차드 그린 , Ankur Vora, Mira Lutfi, Michael Figurnov, 앤드류 카위, 니콜 홉스, 푸쉬미트 콜리, 제라드 클레웨그트, 이완 버니, 데미스 허사비스, 사미어 벨란카르
핵산 연구 2022
SCOP: 서열 및 구조 조사를 위한 단백질 데이터베이스의 구조적 분류 (SCOP)
Alexey G. Murzin, Steven E. Brenner, Tim Hubbard, Cyrus Chothia JMB 1995
SCOPe: 단백질의 구조적 분류 개선 – 변형 해석 및 기계 학습(SCOPe)을 용이하게 하는 확장된 데이터베이스
John-Marc Chandonia, Lindsey Guan, Shiangyi Lin, Changhua Yu, Naomi K Fox, Steven E Brenner 핵산 연구 2022
CATH: 게놈 서열에 대한 포괄적인 구조적 및 기능적 주석 (CATH)
Ian Sillitoe, Tony E. Lewis, Alison Cuff, Sayoni Das, Paul Ashford, Natalie L. Dawson, Nicholas Furnham, Roman A. Laskowski, David Lee, Jonathan G. Lees, Sonja Lehtinen, Romain A. Studer, Janet Thornton, Christine A. 오렌고
2015년 핵산 연구
모티프-스캐폴딩 문제에 대한 3D 단백질 백본의 확산 확률 모델링 (ProtDiff)
브라이언 L. 트립, 제이슨 임, 더그 티셔, 데이비드 베이커, 타마라 브로데릭, 레지나 바르질레이, 토미 재콜라
ICLR 2023
접힘 확산(FoldingDiff)을 통한 단백질 구조 생성
Kevin E. Wu, Kevin K. Yang, Rianne van den Berg, Sarah Alamdari, James Y. Zou, Alex X. Lu, Ava P. Amini
네이처 커뮤니케이션즈 2024
단백질 구조 생성을 위한 잠재 확산 모델 (LatentDiff)
콩 푸, 얀 케창, 왕 리메이, 윙 이 오, 마이클 맥스로우, 코미카도 타오, 마루하시 코지, 우치노 칸지, 샤오닝 첸, 지 슈이왕
로그 2023
지향성 잔류 구름을 등변적으로 확산시켜 새롭고 설계 가능하며 다양한 단백질 구조 생성 (Genie)
예칭 린, 모하메드 알쿠라이시
arXiv:2301.12485 (2023)
단백질 백본 생성에 적용되는 SE(3) 확산 모델 (FrameDiff)
제이슨 임, 브라이언 L. 트립, 발렌틴 드 보르톨리, 에밀 마티유, 아르노 두세, 레지나 바르질레이, 토미 야콜라
ICML 2023
RFdiffusion(RFDiffusion)을 이용한 단백질 구조 및 기능의 새로운 설계
Joseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile IM Wicky, Nikita Hanikel , Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana 바스케스 토레스, 안나 라우코, 발렌틴 드 보르톨리, 에밀 마티유, 세르게이 오브친니코프, 레지나 바르질레이, 토미 S. 야콜라, 프랭크 디마이오, 백민경, 데이비드 베이커
자연 2023
단백질 언어 모델 감독된 정확하고 효율적인 단백질 백본 설계 방법 (GPDL)
Bo Zhang, Kexin Liu, Zhuoqi Zheng, Yunfeiyang Liu, Junxi Mu, Ting Wei, Hai-Feng Chen
바이오Rxiv(2023)
모티프 기반의 단백질 서열 및 구조의 공동 설계 (GeoPro)
Zhenqiao Song, Yunlong Zhao, Yufei Song, Wenxian Shi, Yang Yang, Lei Li
arXiv:2310.02546 (2023)
모든 원자 단백질 생성 모델 (Protpardelle)
알렉산더 E. 추, 루시 쳉, 지나 엘 네스르, 민카이 쉬, 포수 황
바이오Rxiv(2023)
등변 번역(ProtSeed)을 사용한 단백질 서열 및 구조 공동 설계
Chence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang
ICLR 2023
약물 발견을 위한 항체 표현 학습 (BERTTransformer)
린 리, 에스더 굽타, 존 스패스, 레슬리 싱, 트리스탄 베플러, 라지몬다 술로 카세레스
arXiv:2210.02881 (2022)
언어 모델 및 약한 지도 학습(AntiBERTy)을 통한 항체 친화도 성숙 해독
제프리 A. 러폴로, 제프리 J. 그레이, 제레미아스 술람
arXiv:2112.07782 (2021)
자기지도 학습(AntiBERTa)을 사용하여 항체의 언어 해독
임진우, 로라 S. 미첼, 제임스 HR 파머리, 저스틴 바튼, 제이콥 D. 갤슨
패턴 2022
AbLang: 항체 서열 완성을 위한 항체 언어 모델 (AbLang)
토비아스 H 올슨, 이안 H 모알, 샬롯 M 딘
생물정보학 발전 2022
항체에 대한 합리적인 접근 방식(PARA)을 사용한 사전 훈련
Xiangrui Gao, Changling Cao, Lipeng Lai
바이오Rxiv(2023)
SAbDab: 구조적 항체 데이터베이스 (SAbDab)
제임스 던바, 콘라드 크로치크, 임진우, 테리 베이커, 안젤리카 푹스, 가이 조지스, 지예, 샬롯 M. 딘
2014년 핵산 연구
RosettaAntibodyDesign(RAbD): 전산 항체 설계(RAB)를 위한 일반 프레임워크
Jared Adolf-Bryfogle, Oleks Kalyuzhniy, Michael Kubitz, Brian D. Weitzner, Xiaozhen Hu, Yumiko Adachi, William R. Schief, Roland L. Dunbrack, Jr.
PLOS 전산 생물학 2018
tFold-Ab: 서열 상동체 없이 빠르고 정확한 항체 구조 예측 (tFold-Ab)
Jiaxiang Wu, Fandi Wu, Biaobin Jiang, Wei Liu, Peilin Zhao
바이오Rxiv(2022)
xTrimoABFold: MSA 없이 새로운 항체 구조 예측 (xTrimoABFold)
Yining Wang, Xumeng Gong, Shaochuan Li, Bing Yang, YiWu Sun, Chuan Shi, Yangang Wang, Cheng Yang, Hui Li, Le Song
arXiv:2212.00735 (2022)
ImmuneBuilder: 면역 단백질의 구조를 예측하기 위한 딥러닝 모델 (ABodyBuilder)
브레넌 아바나데스, 윙기웡, 퍼거스 보일즈, 가이 조지스, 알렉산더 부요체크, 샬롯 M. 딘
자연 2023
ABlooper: 정확도 추정을 통한 빠르고 정확한 항체 CDR 루프 구조 예측 (ABlooper)
브레넌 아바나데스, 가이 조지, 알렉산더 부요체크, 샬롯 M 딘
생물정보학 2022
딥 러닝의 기하학적 전위로 CDR H3 루프 구조 예측 향상 (DeepH3)
제프리 A 러폴로, 카를로스 게라, 사이 푸자 마하잔, 제레미아스 술람, 제프리 J 그레이
생물정보학 2020
CDR-H3 루프 구조 예측을 위한 간단한 엔드투엔드 딥러닝 모델 (SimpleDH3)
나탈리아 젠코바, 예카테리나 세디크, 타티아나 슈가예바, 블라디슬라프 스트라쉬코, 티모페이 에르막, 알렉세이 슈필만
arXiv:2111.10656 (2021)
해석 가능한 딥러닝(DeepAB)을 이용한 항체 구조 예측
제프리 A 러폴로, 제레미아스 술람, 제프리 J 그레이
패턴 2021
대규모 천연 항체 세트(IgFold)에 대한 딥러닝을 통해 빠르고 정확한 항체 구조 예측
제프리 A 러폴로, 리신 추, 사이 푸자 마하잔, 제프리 J 그레이
네이처 커뮤니케이션즈 2023
SAbDab: 구조적 항체 데이터베이스 (SAbDab)
제임스 던바, 콘라드 크로치크, 임진우, 테리 베이커, 안젤리카 푹스, 가이 조지스, 지예, 샬롯 M. 딘
2014년 핵산 연구
RosettaAntibodyDesign(RAbD): 전산 항체 설계(RAB)를 위한 일반 프레임워크
Jared Adolf-Bryfogle, Oleks Kalyuzhniy, Michael Kubitz, Brian D. Weitzner, Xiaozhen Hu, Yumiko Adachi, William R. Schief, Roland L. Dunbrack, Jr.
PLOS 전산 생물학 2018
SKEMPI 2.0: 돌연변이 시 단백질-단백질 결합 에너지, 동역학 및 열역학의 변화에 대한 업데이트된 벤치마크 (SKEMPI)
저스티나 얀카우스카이테, 브라이언 히메네스-가르시아, 유스타스 다프쿠나스, 후안 페르난데스-레시오, 이아인 H 모알
생물정보학 2019
무제한 규모의 기계 학습 기반 항체 설계 원리에 대한 인실리코 증명
Rahmad Akbara, Philippe A. Roberta, Cédric R. Weberb, Michael Widrichc, Robert Franka, Milena Pavlovićd, Lonneke Schefferd, Maria Chernigovskayaa, Igor Snapkova, Andrei Slabodkina, Brij Bhushan Mehtaa, Enkelejda Mihoe, Fridtjof Lund-Johansena, Jan Terje Andersena, f, 9월 Hochreiterc,g, Ingrid Hobæk Haffh, Günter Klambauerc, Geir Kjetil Sandved, Victor Greiff
mAbs 2022https://www.tandfonline.com/doi/full/10.1080/19420862.2022.2031482
항체 서열 구조 공동 설계를 위한 반복적 정제 그래프 신경망 (RefineGNN)
웬공 진, 제레미 월웬드, 레지나 바르질레이, 토미 야콜라
ICLR 2022
3D 등변 그래프 변환(MEAN)을 통한 조건부 항체 설계
Xiangzhe Kong, Wenbing Huang, 양 리우
ICLR 2023
단백질 복합체 불변 임베딩을 사용한 교차 게이트 MLP는 원샷 항체 설계자입니다 (ADesigner)
Cheng Tan, Zhangyang Gao, Lirong Wu, Jun Xia, Jiangbin Zheng, Xihong Yang, Yue Liu, Bozhen Hu, Stan Z. Li
AAAI 2024
단백질 구조에 대한 확산 기반 생성 모델(DiffAb)을 사용한 항원 특이적 항체 설계 및 최적화
Shitong Luo, Yufeng Su, Xingang Peng, Sheng Wang, Jian Peng, Jianzhu Ma
NeurIPS 2022
유연한 사이트별 단백질 도킹 및 설계를 위한 딥 러닝 (DockGPT)
매트 맥파틀론, 진보 쉬
바이오Rxiv(2023)
HERN( Hierarchical Equivariant Refinement)을 통한 항체-항원 도킹 및 설계
Wengong Jin, Dr.Regina Barzilay, Tommi Jaakkola
ICML 2022
엔드투엔드 전체 원자 항체 설계 (dyMEAN)
Xiangzhe Kong, Wenbing Huang, 양 리우
ICML 2023
치료 펩타이드 생성(MMCD)을 위한 다중 모드 대조 확산 모델
왕용캉(Yongkang Wang), 류쑤언(Xuan Liu), 펑황(Feng Huang), 잔쿤 시옹(Zhankun Xiong), 장웬(Wen Zhang)
AAAI 2024
PepGB: 그래프 신경망(PepGB)을 통한 펩타이드 약물 발견 촉진
Yipin Lei, Xu Wang, Meng Fang, Han Li, Xiang Li, Jianyang Zeng
arXiv:2401.14665 (2024)
PepHarmony: 통합 서열 및 구조 기반 펩타이드 인코딩을 위한 다중 뷰 대조 학습 프레임워크 (PepHarmony)
Ruochi Zhang, Haoran Wu, Chang Liu, Huaping Li, Yuqian Wu, Kewei Li, Yifan Wang, Yifan Deng, Jiahui Chen, Fengfeng Zhou, Xin Gao
arXiv:2401.11360 (2024)
PEFT-SP: 대규모 단백질 언어 모델의 매개변수 효율적인 미세 조정으로 신호 펩타이드 예측 향상 (PEFT-SP)
Shuai Zeng, Duolin Wang, Dong Xu
바이오Rxiv(2023)
AdaNovo: 조건부 상호 정보를 사용한 적응형 De Novo 펩타이드 시퀀싱 (AdaNovo)
Jun Xia, Shaorong Chen, Jingbo Zhou, Tianze Ling, Wenjie Du, Sizhe Liu, Stan Z. Li
arXiv:2403.07013 (2024)