更新: 私たちの論文がバイオインフォマティクスのブリーフィングに受理されました!
調査論文「新規創薬のための生成 AI の調査: 分子およびタンパク質設計の新フロンティア」のリポジトリ。
Xiangru Tang 1 *、Howard Dai 1 *、Elizabeth Knight 1 *、Yunyang Li 1 、Fang Wu 2 、Tianxiao Li 1 、Mark Gerstein 1
1. イェール大学; 2. スタンフォード大学
(*: 均等貢献)
[**] は付録セクションを示します。
セクション | サブセクション | データセット | メトリクス | モデル |
---|---|---|---|---|
分子 | ターゲットに依存しない生成 | データセット | メトリクス | モデル |
分子 | ターゲットを意識した世代 | データセット | メトリクス | モデル |
分子 | 立体構造の生成** | データセット | メトリクス | モデル |
タンパク質 | 表現学習** | データセット | モデル | |
タンパク質 | 構造予測 | データセット | メトリクス | モデル |
タンパク質 | シーケンスの生成 | データセット | メトリクス | モデル |
タンパク質 | バックボーン設計 | データセット | メトリクス | モデル |
抗体 | 表現学習** | データセット | モデル | |
抗体 | 構造予測** | データセット | メトリクス | モデル |
抗体 | CDR の生成** | データセット | メトリクス | モデル |
ペプチド | その他タスク** | モデル |
@article{tang2024survey,
title={A survey of generative ai for de novo drug design: new frontiers in molecule and protein generation},
author={Tang, Xiangru and Dai, Howard and Knight, Elizabeth and Wu, Fang and Li, Yunyang and Li, Tianxiao and Gerstein, Mark},
journal={Briefings in Bioinformatics},
volume={25},
number={4},
year={2024},
publisher={Oxford Academic}
}
私たちの論文で取り上げられているトピックの概要。青色で強調表示されているセクションは本文にあり、紫色のセクションは付録にある拡張セクションです。
134キロ分子の量子化学構造と性質(QM9)
ラグナサン・ラマクリシュナン、パブロ・O・ドラル、マティアス・ラップ、O・アナトール・フォン・リリエンフェルト
科学データ (2014)
GEOM、特性予測および分子生成のためのエネルギー注釈付き分子立体配座(GEOM)
サイモン・アクセルロッド、ラファエル・ゴメス=ボンバレリ
科学データ (2022)
データ駆動型の分子の連続表現 (CVAE) を使用した自動化学設計
ラファエル・ゴメス=ボンバレリ、ジェニファー・N・ウェイ、デビッド・ドゥヴノー、ホセミゲル・エルナンデス=ロバト、ベンハミンサンチェス=レンゲリング、デニス・シェベラ、ホルヘ・アギレラ=イパラギーレ、ティモシー・D・ヒルゼル、ライアン・P・アダムス、アラン・アスプル=グジク
ACSセントラルサイエンス (2018)
文法変分オートエンコーダー(GVAE)
マット・J・クスナー、ブルックス・ペイジ、ホセ・ミゲル・エルナンデス=ロバト
ICML2017
構造化データ用の構文指向変分オートエンコーダー(SD-VAE)
Hanjun Dai、Yingtao Tian、Bo Dai、Steven Skiena、Le Song
ICLR 2018
分子グラフ生成用ジャンクション ツリー変分オートエンコーダー(JT-VAE)
ウェンゴン・ジン、レジーナ・バルジライ、トミ・ジャーッコラ
ICML2018
E(n) 等変正規化フロー(E-NF)
ヴィクトル・ガルシア・サトラス、エミエル・フーゲブーム、ファビアン・フックス、イングマール・ポズナー、マックス・ウェリング
NeurIPS 2021
分子の標的発見のための対称性に適応した 3D 点セットの生成(G-SchNet)
ニクラス・ゲバウアー、ミヒャエル・ガステッガー、クリストフ・シュット
NeurIPS 2019
3D での分子生成のための等変拡散(EDM)
エミエル・ホーゲブーム、ビクター・ガルシア・サトラス、クレマン・ヴィニャック、マックス・ウェリング
ICML 2022
3D 分子の生成と最適化のためのジオメトリ完全拡散(GCDM)
アレックス・モアヘッド、ジェンリン・チェン
arXiv:2302.04313 (2023)
MDM: 3D 分子生成のための分子拡散モデル(MDM)
レイ・ファン、ヘントン・チャン、ティンヤン・シュー、カーチュン・ウォン
AAAI 2023
3D 分子生成のための幾何学的潜在拡散モデル(GeoLDM)
ミンカイ・シュー、アレクサンダー・S・パワーズ、ロン・O・ドロール、ステファノ・エルモン、ジュレ・レスコベック
ICML2023
完全な分子生成のための共同 2D および 3D 拡散モデルの学習(JODO)
ハン・ファン、レイレイ・サン、ボーウェン・ドゥ、ウェイフェン・LV
arXiv:2305.12347 (2023)
MiDi: 分子生成のための混合グラフと 3D ノイズ除去拡散(MiDi)
クレメント・ヴィニャック、ナガム・オスマン、ローラ・トーニ、パスカル・フロサール
arXiv:2302.09048 (2023)
構造ベースの医薬品設計のための 3 次元畳み込みニューラル ネットワークとクロスドッキング データセット(CrossDocked2020)
ポール・G・フランクール、増田知秀、ジョセリン・サンセリ、アンドリュー・ジア、リチャード・B・イオヴァニシ、イアン・スナイダー、デヴィッド・R・コス
ACS JCIM 2020
ZINC20—リガンド発見のための無料の超大規模化学データベース(ZINC20)
ジョン・J・アーウィン、カーン・G・タン、ジェニファー・ヤング、チンゾリグ・ダンダルチュルン、ベンジャミン・R・ウォン、ムンクズル・フレルバートル、ユリー・S・モロズ、ジョン・メイフィールド、ロジャー・A・セイル
ACS JCIM 2020
バインディング MOAD (すべてのデータベースのマザー) (バインディング MOAD)
リーギ・フー、マーク・L・ベンソン、リチャード・D・スミス、マイケル・G・ラーナー、ヘザー・A・カールソン
タンパク質 2005
AutoDock Vina: 新しいスコアリング機能、効率的な最適化、マルチスレッド化によりドッキングの速度と精度が向上(Vina AutoDock)
オレグ・トロット、アーサー・J・オルソン
JCC2010
薬物の化学的美しさの定量化(QED) G Richard Bickerton、Gaia V Paolini、Jérémy Besnard、Sorel Muresan、Andrew L Hopkins
自然化学 (2012)
分子の複雑さとフラグメントの寄与に基づく薬物様分子の合成アクセシビリティスコアの推定(SAScore)
Peter Ertl、Ansgar Schuffenhauer Journal of Cheminformatics 2009
DrugGPT: 特定のタンパク質を標的とする潜在的なリガンドを設計するための GPT ベースの戦略(DrugGPT)
Yuesen Li、Chengyi Gao、Xin Song、Xiangyu Wang、Yungang Xu、Suxia Han
バイオRxiv (2023)
深部生成モデルを使用した受容体結合部位を条件とした 3D 分子構造の生成(LiGAN)
増田知英、マシュー・ラゴザ、デヴィッド・ライアン・コス
arXiv:2010.14442 (2020)
Pocket2Mol: 3D タンパク質ポケットに基づく効率的な分子サンプリング(Pocket2Mol)
Xingang Peng、Shitong Luo、Jiaqi Guan、Qi Xie、Jian Peng、Jianzhu Ma
ICML 2022
構造に基づいた医薬品設計のための 3D 生成モデル
Shitong Luo、Jiaqi Guan、Jianzhu Ma、Jian Peng
NeurIPS 2021
ターゲットを認識した分子生成と親和性予測のための 3D 等変拡散(TargetDiff)
Jiaqi Guan、Wesley Wei Qian、Xingang Peng、Yufeng Su、Jian Peng、Jianzhu Ma
ICLR 2023
等変拡散モデルを使用した構造ベースの薬剤設計(DiffSBDD)
アルネ・シュノイング、ユアンキ・ドゥ、チャールズ・ハリス、アリアン・ジャマスブ、イリア・イガショフ、ウェイタオ・ドゥ、トム・ブランデル、ピエトロ・リオ、カーラ・ゴメス、マックス・ウェリング、マイケル・ブロンスタイン、ブルーノ・コレイア
arXiv:2210.13695 (2022)
GEOM、特性予測および分子生成のためのエネルギー注釈付き分子立体配座(GEOM)
サイモン・アクセルロッド、ラファエル・ゴメス=ボンバレリ
科学データ 2022
SchNet: 量子相互作用をモデル化するための連続フィルター畳み込みニューラル ネットワーク(ISO17)
クリストフ・シュット、ピーテル=ヤン・キンダーマンス、フジール・エノク・サウダ・フェリックス、ステファン・クミエラ、アレクサンドル・トカチェンコ、クラウス=ロバート・ミュラー
NeurIPS 2017
ディープ ジェネレーティブ グラフ ニューラル ネットワーク (CVGAE) を使用した分子幾何学予測
エルマン・マンシモフ、オマール・マフムード、カン・ソクホ、チョ・キョンヒョン
科学レポート 2019
分子距離幾何学の生成モデル(GraphDG)
グレゴール NC シム、ホセ ミゲル ヘルナンデス ロバト
ICML 2020
分子立体構造生成のための神経生成ダイナミクスの学習(CGCF)
Minkai Xu、Shitong Luo、Yoshua Bengio、Jian Peng、Jian Tang
ICLR 2021
GeoMol: 分子 3D 配座体アンサンブルのねじり幾何学的生成(GeoMol)
オクタヴィアン ガネア、ラグナジット パタナイク、コナー コーリー、レジーナ バルジレイ、クラフス ジェンセン、ウィリアム グリーン、トミ ジャーッコラ
NeurIPS 2021
分子立体構造生成のための学習勾配場(ConfGF)
Chence Shi、Shitong Luo、Minkai Xu、Jian Tang
ICML 2021
動的グラフスコアマッチング (DGSM) による分子立体構造の予測
Shitong Luo、Chence Shi、Minkai Xu、Jian Tang
NeurIPS 2021
GeoDiff: 分子立体構造生成のための幾何学的拡散モデル(GeoDiff)
ミンカイ・シュー、ランタオ・ユー、ヤン・ソン、チェン・シー、ステファノ・エルモン、ジャン・タン
ICLR 2022
UniProt: ユニバーサルタンパク質知識ベース(UniProt)
ロルフ・アプワイラー、アモス・バイロック、キャシー・H・ウー、ウィノナ・C・バーカー、ブリジット・ベックマン、セレネラ・フェロ、エリザベス・ガスタイガー、ホンジャン・ファン、ロドリゴ・ロペス、ミケーレ・マグラン、マリア・J・マーティン、ダレン・A・ナターレ、クレア・オドノヴァン、ニコールレダスキ、ライス・L・イェー
核酸研究 2004
OntoProtein: 遺伝子オントロジー埋め込みによるタンパク質の事前トレーニング(ProteinKG)
Ningyu Zhang、Zhen Bi、Xiaozhuan Liang、Siyuan Cheng、Haosen Hon、Shumin Deng、Jiazhang Lian、Qiang Zhang、Huajun Chen
ICLR 2022
タンパク質データバンク(PDB)
ヘレン・M・バーマン、ジョン・ウェストブルック、ズカン・フェン、ゲイリー・ギリランド、TN・バート、ヘルゲ・ヴァイシッヒ、イリヤ・N・シンジャロフ、フィリップ・E・ボーン
核酸研究 2000
AlphaFold タンパク質構造データベース: 高精度モデルによりタンパク質配列空間の構造範囲を大幅に拡大(AlphaFoldDB)
ミハイリー・ヴァラディ、スティーヴン・アニャンゴ、マンダール・デシュパンデ、スリーナス・ネール、シンディ・ナターシア、ガラビナ・ヨルダノヴァ、デヴィッド・ユアン、オアナ・ストロー、ジェマ・ウッド、アガタ・レイドン、オーガスティン・ジーデク、ティム・グリーン、キャスリン・トゥニャスヴナクール、スティグ・ピーターセン、ジョン・ジャンパー、エレン・クランシー、リチャード・グリーン、アンクール・ヴォラ、ミラルトフィ、マイケル・フィグルノフ、アンドリュー・コーウィ、ニコール・ホブズ、プッシュミート・コーリ、ジェラルド・クレイウィグト、ユアン・バーニー、デミス・ハサビス、サミール・ヴェランカー
核酸研究 2022
Pfam: 2021 年のタンパク質ファミリー データベース(Pfam)
ジャイナ・ミストリー、サラ・チュグランスキー、ローリ・ウィリアムズ、マトローブ・クレシ、グスタボ・A・サラザール、エリック・LL・ソンハマー、シルビオ・CE・トサット、リサーナ・パラディン、シュリヤ・ラージ、ローナ・J・リチャードソン、ロバート・D・フィン、アレックス・ベイトマン
核酸研究 2021
配列ベースの深層表現学習による統合合理的タンパク質工学(UniRep)
イーサン・C・アレイ、グリゴリー・ヒムルヤ、スラジット・ビスワス、モハメド・アルクライシ、ジョージ・M・チャーチ
ネイチャーメソッド 2019
Prottrans: 自己教師あり学習を通じて生命の言語の理解に向けて(ProtBERT)
アーメド・エルナガー、マイケル・ハインジンガー、クリスチャン・ダラゴ、ガリア・レハウィ、ユー・ワン、ライオン・ジョーンズ、トム・ギブス、タマス・フェヘル、クリストフ・アンゲラー、マーティン・シュタイネッガー、デブシンドゥ・ボーミク、ブルクハルト・ロスト
IEEE PAMI 2021
教師なし学習を 2 億 5,000 万個のタンパク質配列に拡張することで、生物学的な構造と機能が明らかになる(ESM-1b)
アレクサンダー・リヴス、ジョシュア・マイヤー、トム・セルク、シッダース・ゴヤル、ゼミン・リン、ジェイソン・リュー、デミ・グオ、マイル・オット、C・ローレンス・ジトニック、ジェリー・マー、ロブ・ファーガス
PNAS 2021
MSAトランス(MSAトランス)
ロシャン・M・ラオ、ジェイソン・リュー、ロバート・バークイル、ジョシュア・マイヤー、ジョン・キャニー、ピーター・アッビール、トム・セルク、アレクサンダー・リヴス
ICML 2021
タンパク質表現学習のための検索配列拡張(RSA)
Chang Ma、Haiteng Zhao、Lin Zheng、Jiayi Xin、Qintong Li、Lijun Wu、Zhihong Deng、Yang Lu、Qi Liu、Lingpeng Kong
バイオRxiv (2023)
OntoProtein: 遺伝子オントロジー埋め込みによるタンパク質の事前トレーニング(OntoProtein)
Ningyu Zhang、Zhen Bi、Xiaozhuan Liang、Siyuan Cheng、Haosen Hon、Shumin Deng、Jiazhang Lian、Qiang Zhang、Huajun Chen
ICLR 2022
知識強化一次構造モデリング (KeAP) によるタンパク質表現学習
周宏宇、フー・ユンシャン、張志成、チェン・ビアン、余州益
バイオRxiv (2023)
3D タンパク質構造の学習のための内因性-外因性畳み込みとプーリング(IEConv)
ペドロ・エルモシラ、マルコ・シェーファー、マチェジ・ラング、グロリア・ファッケルマン、ペレ・パウ・バスケス、バルボラ・コズリコバ、ミカエル・クローネ、トビアス・リッチェル、ティモ・ロピンスキー
ICLR 2021
グラフ畳み込みネットワークを使用した構造ベースのタンパク質機能予測(DeepFRI)
ウラディミール・グリゴリイェヴィッチ、P・ダグラス・レンフルー、トマシュ・コシオレク、ジュリア・ケーラー・レマン、ダニエル・ベレンバーグ、トミ・バタネン、クリス・チャンドラー、ブリン・C・テイラー、イアン・M・フィスク、ヘラ・ヴラマキス、ラムニク・J・ザビエル、ロブ・ナイト、キョンヒョン・チョー、リチャード・ボノー
ネイチャーコミュニケーションズ 2021
幾何構造事前学習によるタンパク質表現学習(GearNET)
ズオバイ・チャン、ミンハオ・シュー、アリアン・ジャマスブ、ヴィジル・チェンタマラクシャン、オーレリー・ロザーノ、パイエル・ダス、ジャン・タン
arXiv:2203.06125 (2022)
タンパク質データバンク(PDB)
ヘレン・M・バーマン、ジョン・ウェストブルック、ズカン・フェン、ゲイリー・ギリランド、TN・バート、ヘルゲ・ヴァイシッヒ、イリヤ・N・シンジャロフ、フィリップ・E・ボーン
核酸研究 2000
タンパク質構造予測手法の批判的評価 (CASP) — ラウンド XIV (CASP14)
アンドリー・クリシュタフォヴィチ、トルステン・シュヴェーデ、マヤ・トップフ、クシシュトフ・フィデリス、ジョン・モルト
プロテイン 2021
CASP12 における構造予測の重要な評価 (CAMEO) を補完する継続的自動モデル評価 (CAMEO)
ユルゲン・ハース、アレッサンドロ・バルバート、ダリオ・ベリンガー、ガブリエル・ステューダー、スティーヴン・ロス、マルティーノ・ベルトーニ、ハレド・モスタギル、ラファル・グミエニー、トルステン・シュヴェーデ
プロテイン 2017
LGA: タンパク質構造の 3D 類似性を見つける方法(GDT-TS)
アダム・ゼムラ
核酸 2003
タンパク質構造テンプレートの品質を自動評価するスコアリング機能(TM スコア)
ヤン・ジャン、ジェフリー・スコルニック
タンパク質 2004
lDDT: 距離差検定 (lDDT) を使用してタンパク質の構造とモデルを比較するための局所的重ね合わせのないスコア
ヴァレリオ・マリアーニ、マルコ・ビアジーニ、アレッサンドロ・バルバート、トルステン・シュヴェーデ
バイオインフォマティクス 2013
AlphaFold (AlphaFold) による高精度なタンパク質構造予測
ジョン・ジャンパー、リチャード・エヴァンス、アレクサンダー・プリッツェル、ティム・グリーン、マイケル・フィグルノフ、オラフ・ロンネバーガー、キャスリン・トゥニャスヴナクール、ラス・ベイツ、オーギュスティン・ジデク、アンナ・ポタペンコ、アレックス・ブリッジランド、クレメンス・マイヤー、サイモン・AA・コール、アンドリュー・J・バラード、アンドリュー・コーウィ、バーナルディーノ・ロメラ-パレデス、スタニスラフニコロフ、リシュブ・ジェイン、ジョナス・アドラー、トレバー・バック、スティグ・ピーターセン、デヴィッド・ライマン、エレン・クランシー、ミハル・ジエリンスキー、マーティン・シュタイネッガー、ミシャリーナ・パチョルスカ、タマス・ベルガマー、セバスチャン・ボーデンシュタイン、デヴィッド・シルバー、オリオル・ヴィニャルズ、アンドリュー・W・シニア、コライ・カヴククオグル、プッシュミートコーリ、デミス・ハサビス
ネイチャー 2021)
高速かつ正確なタンパク質構造予測のための trRosetta サーバー(trRosetta)
Zongyang Du、Hong Su、Wenkai Wang、Lisha Ye、Hong Wei、Zhenling Peng、Ivan Anishchenko、David Baker、Jianyi Yang Nature Protocols 2021
3 トラック ニューラル ネットワーク (RoseTTAFold) を使用したタンパク質の構造と相互作用の正確な予測
ペク・ミンギョン、フランク・ディマイオ、イワン・アニシチェンコ、ジャスタス・ダウパラス、セルゲイ・オフチニコフ、ギュ・リー・リー、ジュエ・ワン、チェン・コン、リサ・N・キンチ、R・ダスティン・シェーファー、クラウディア・ミラン、ハーンボム・パーク、カーソン・アダムス、ケイレブ・R・グラスマン、アンディデジョバンニ、ホセ・H・ペレイラ、アンドリア・V・ロドリゲス、アルベルディナ・A・ファン・ダイク、アナ・C・エブレヒト、ディーデリク・J・オッパーマン、テオ・サグマイスター、クリストフ・ビュールヘラー、ティー・パブコフ=ケラー、マノージ・K・ラティナスワミ、ウディット・ダルワディ、カルビン・K・イップ、ジョン・E・バーク、K・クリストファー・ガルシア、ニック・V・グリシン、ポール・D・アダムス、ランディ・J・リード、デヴィッド・ベイカー
サイエンス 2021
言語モデルを使用した原子レベルのタンパク質構造の進化スケールの予測(ESMFold)
ゼミン・リン、ハリル・アキン、ロシャン・ラオ、ブライアン・ヒエ、ゾンカイ・ジュー、ウェンティン・ルー、ニキータ・スメタニン、ロバート・ヴェルクイル、オリ・カベリ、ヤニフ・シュムエリ、アラン・ドス・サントス・コスタ、マリアム・ファゼル=ザランディ、トム・セルク、サルヴァトーレ・カンディド、アレクサンダー・リヴス
サイエンス 2023
EigenFold: 拡散モデルを使用した生成タンパク質構造予測(EigenFold)
ボーウェン・ジン、エズラ・エリブス、ピーター・パオ=ファン、ガブリエレ・コルソ、ボニー・バーガー、トミ・ジャーッコラ
arXiv:2304.02198 (2023)
タンパク質データバンク(PDB)
ヘレン・M・バーマン、ジョン・ウェストブルック、ズカン・フェン、ゲイリー・ギリランド、TN・バート、ヘルゲ・ヴァイシッヒ、イリヤ・N・シンジャロフ、フィリップ・E・ボーン
核酸研究 2000
UniProt: ユニバーサルタンパク質知識ベース(UniRef/UniParc)
ロルフ・アプワイラー、アモス・バイロック、キャシー・H・ウー、ウィノナ・C・バーカー、ブリジット・ベックマン、セレネラ・フェロ、エリザベス・ガスタイガー、ホンジャン・ファン、ロドリゴ・ロペス、ミケーレ・マグラン、マリア・J・マーティン、ダレン・A・ナターレ、クレア・オドノヴァン、ニコールレダスキ、ライス・L・イェー
核酸研究 2004
CATH: ゲノム配列の包括的な構造および機能アノテーション(CATH)
イアン・シリトー、トニー・E・ルイス、アリソン・カフ、サヨニ・ダス、ポール・アシュフォード、ナタリー・L・ドーソン、ニコラス・ファーナム、ロマン・A・ラスコウスキー、デヴィッド・リー、ジョナサン・G・リーズ、ソーニャ・レティネン、ロマン・A・スチューダー、ジャネット・ソーントン、クリスティーンA.オレンゴ
核酸研究 2015
フラグメントベースのローカルプロファイルとエネルギーベースの非ローカルプロファイルを備えたニューラルネットワークによる、タンパク質構造に適合する配列プロファイルの直接予測(TS500)
Zhixiu Li、Yuedong Yang、Eshel Faraggi、Jian Zhan、Yaoqi Zhou
プロテイン 2014
ProteinVAE: トランスレーショナルタンパク質設計のための変分オートエンコーダー(ProteinVAE)
スユエ・リュー、シャヒン・ソウラティ=ハジン、マイケル・ガートン
バイオRxiv (2023)
ProT-VAE: 機能性タンパク質設計のためのタンパク質トランスフォーマー変分オートエンコーダー(ProT-VAE)
エムレ・セヴゲン、ジョシュア・モラー、エイドリアン・ラング、ジョン・パーカー、ショーン・クイグリー、ジェフ・メイヤー、プーナム・スリヴァスタヴァ、シタラム・ガヤトリ、デヴィッド・ホスフィールド、マリア・コルシュノワ、ミシャ・リブネ、ミシェル・ギル、ラマ・ランガナサン、アンソニー・B・コスタ、アンドリュー・L・ファーガソン
バイオRxiv (2023)
敵対的生成ネットワークを用いた機能的タンパク質配列空間の拡張(ProteinGAN)
ドナタス・レペッカ、ヴィキンタス・ヤウニスキス、ラウリナス・カルプス、エルズビエタ・レンベザ、イルマンタス・ロカイティス、ヤン・ズリメック、シモナ・ポヴィロニエネ、オードリウス・ラウリネナス、サンドラ・ヴィクナンダー、ウィサム・アブアジュワ、オットー・サヴォライネン、ロランダス・メスキース、マーティン・K・M・エングクヴィスト、アレクセイ・ゼレズニアク
ネイチャーマシンインテリジェンス (2021)
ディープ グラフ ニューラル ネットワーク (ProteinSolver) を使用した高速かつ柔軟なタンパク質設計
アレクセイ・ストロカッハ、デビッド・ベセラ、カルレス・コルビ=ヴァージ、アルバート・ペレス=リバ、フィリップ・M・キム
セルシステム 2020
PiFold: 効果的かつ効率的なタンパク質の逆フォールディング (PiFold) を目指して
Zhangyang Gao、Cheng Tan、Stan Z. Li
ICLR 2023
学習された可能性を備えたタンパク質配列設計
ナムラタ・アナンド、ラファエル・エグチ、イリンパン・I・マシューズ、カーラ・P・ペレス、アレクサンダー・デリー、ラス・B・アルトマン、ポースー・ファン
ネイチャーコミュニケーションズ 2022
深層学習と自己一貫性に基づいたロータマーフリーのタンパク質配列設計(ABACUS-R)
Yufeng Liu、Lu Zhang、Weilun Wang、Min Zhu、Chenchen Wang、Fudong Li、Jiahai Zhang、Houqiang Li、Quan Chen、Haiyan Liu
ネイチャー計算科学 2022
ProRefiner: グローバル グラフ アテンションを使用した逆タンパク質フォールディングのためのエントロピー ベースのリファイン戦略(ProRefiner)
Xinyi Zhou、Guangyong Chen、Junjie Ye、Ercheng Wang、Jun Zhang、Cong Mao、Zhanwei Li、Jianye Hao、Xingxu Huang、Jin Tang、Pheng Ann Heng
ネイチャーコミュニケーションズ 2023
グラフォーマー監修によるデノボタンパク質設計法および機能検証(GPD)
Junxi Mu、Zhengxin Li、Bo Zhang、Qi Zhang、ジャムシェド・イクバル、アブドゥル・ワドゥード、ティン・ウェイ、ヤン・フェン、ハイフェン・チェン
バイオインフォマティクス 2024 の説明会
幾何ベクトルパーセプトロンによるタンパク質構造からの学習(GVP-GNN)
ボーウェン・ジン、ステファン・アイスマン、パトリシア・スリアナ、ラファエル・ジョン・ラマール・タウンゼント、ロン・ドロール
ICLR 2021
数百万の予測構造からの逆折り畳みの学習(ESM-IF1)
クロエ・スー、ロバート・バークイル、ジェイソン・リュー、ゼミン・リン、ブライアン・ヒエ、トム・セルク、アダム・レラー、アレクサンダー・リブス
ICML 2022
ProteinMPNN (ProteinMPNN) を使用した堅牢な深層学習ベースのタンパク質配列設計
J ダウパラス、I アニシチェンコ、N ベネット、H バイ、RJ ラゴット、LF ミルズ、BIM ウィッキー、A クールベ、RJ デ ハース、N ベセル、PJY レオン、TF ハディ、S ペロック、D ティッシャー、F チャン、B ケプニック、Hグエン、A カン、B サンカラン、AK ベラ、NP キング、D ベイカー
サイエンス 2022
タンパク質データバンク(PDB)
ヘレン・M・バーマン、ジョン・ウェストブルック、ズカン・フェン、ゲイリー・ギリランド、TN・バート、ヘルゲ・ヴァイシッヒ、イリヤ・N・シンジャロフ、フィリップ・E・ボーン
核酸研究 2000
AlphaFold タンパク質構造データベース: 高精度モデルによりタンパク質配列空間の構造範囲を大幅に拡大(AlphaFoldDB)
ミハイリー・ヴァラディ、スティーヴン・アニャンゴ、マンダール・デシュパンデ、スリーナス・ネール、シンディ・ナターシア、ガラビナ・ヨルダノヴァ、デヴィッド・ユアン、オアナ・ストロー、ジェマ・ウッド、アガタ・レイドン、オーガスティン・ジーデク、ティム・グリーン、キャスリン・トゥニャスヴナクール、スティグ・ピーターセン、ジョン・ジャンパー、エレン・クランシー、リチャード・グリーン、アンクール・ヴォラ、ミラルトフィ、マイケル・フィグルノフ、アンドリュー・コーウィ、ニコール・ホブズ、プッシュミート・コーリ、ジェラルド・クレイウィグト、ユアン・バーニー、デミス・ハサビス、サミール・ヴェランカー
核酸研究 2022
SCOP: 配列と構造の研究のためのタンパク質の構造分類データベース(SCOP)
アレクセイ・G・マージン、スティーブン・E・ブレナー、ティム・ハバード、サイラス・チョティア JMB 1995
SCOPe: タンパク質の構造分類の改善 – バリアントの解釈と機械学習を容易にする拡張データベース(SCOPe)
John-Marc Chandonia、Lindsey Guan、Shiangyi Lin、Changhua Yu、Naomi K Fox、Steven E Brenner 核酸研究 2022
CATH: ゲノム配列の包括的な構造および機能アノテーション(CATH)
イアン・シリトー、トニー・E・ルイス、アリソン・カフ、サヨニ・ダス、ポール・アシュフォード、ナタリー・L・ドーソン、ニコラス・ファーナム、ロマン・A・ラスコウスキー、デヴィッド・リー、ジョナサン・G・リーズ、ソーニャ・レティネン、ロマン・A・スチューダー、ジャネット・ソーントン、クリスティーンA.オレンゴ
核酸研究 2015
モチーフ足場問題に対する 3D でのタンパク質骨格の拡散確率モデリング(ProtDiff)
ブライアン・L・トリップ、ジェイソン・イム、ダグ・ティッシャー、デヴィッド・ベイカー、タマラ・ブロデリック、レジーナ・バルジレイ、トミ・ジャーッコラ
ICLR 2023
フォールディング拡散によるタンパク質構造生成(FoldingDiff)
ケビン・E・ウー、ケビン・K・ヤン、リアン・ヴァン・デン・バーグ、サラ・アラムダリ、ジェームズ・Y・ゾウ、アレックス・X・ルー、エヴァ・P・アミニ
ネイチャーコミュニケーションズ 2024
タンパク質構造生成のための潜在拡散モデル(LatentDiff)
コン・フー、厳克強、ワン・リーメイ、ウィン・イー・アウ、マイケル・マクスロー、古美門タオ、丸橋康治、内野幹二、銭暁寧、ジー・シュイワン
ログ 2023
等変拡散配向残基雲による新規で設計可能な多様なタンパク質構造の生成(Genie)
Yeqing Lin、モハメド・アルクライシ
arXiv:2301.12485 (2023)
タンパク質骨格生成への応用を備えたSE(3)拡散モデル(FrameDiff)
ジェイソン・イム、ブライアン・L・トリップ、バレンティン・デ・ボルトリ、エミール・マチュー、アルノー・ドゥセ、レジーナ・バルジライ、トミ・ジャーッコラ
ICML2023
RF拡散によるタンパク質の構造と機能のデノボ設計(RFDiffusion)
ジョセフ・L・ワトソン、デヴィッド・ユルゲンス、ナサニエル・R・ベネット、ブライアン・L・トリップ、ジェイソン・イム、ヘレン・E・アイゼナック、ウディ・アハーン、アンドリュー・J・ボースト、ロバート・J・ラゴット、ルーカス・F・ミルズ、バジル・IM・ウィッキー、ニキータ・ハニケル、サミュエル・J・ペロック、アレクシス・クールベ、ウィリアム・シェフラー、ジュエ・ワン、プリーサムヴェンカテシュ、アイザック・サピントン、スサナ・バスケス・トーレス、アンナ・ラウコ、ヴァレンティン・デ・ボルトリ、エミール・マチュー、セルゲイ・オフチニコフ、レジーナ・バルジライ、トミー・S・ジャーコラ、フランク・ディマイオ、ミンギョン・ペク、デヴィッド・ベイカー
ネイチャー 2023
タンパク質言語モデル監視付きの正確かつ効率的なタンパク質バックボーン設計法(GPDL)
Bo Zhang、Kexin Liu、Zhuoqi Zheng、Yunfeiyang Liu、Junxi Mu、Ting Wei、Hai-Feng Chen
バイオRxiv (2023)
モチーフに基づくタンパク質の配列と構造の共同設計(GeoPro)
Zhenqiao Song、Yunlong Zhao、Yufei Song、Wenxian Shi、Yang Yang、Lei Li
arXiv:2310.02546 (2023)
全原子タンパク質生成モデル(Protpardelle)
アレクサンダー E. チュー、ルーシー チェン、ジーナ エル ネスル、ミンカイ シュー、ポースー ファン
バイオRxiv (2023)
等変翻訳によるタンパク質配列と構造の共同設計(ProtSeed)
Chence Shi、Chuanrui Wang、Jiarui Lu、Bozitao Zhong、Jian Tang
ICLR 2023
創薬のための抗体表現学習(BERTTransformer)
リン・リー、エスター・グプタ、ジョン・スペス、レスリー・シン、トリスタン・ベプラー、ラジモンダ・スロ・カセレス
arXiv:2210.02881 (2022)
言語モデルと弱教師学習 (AntiBERTy) を使用した抗体の親和性成熟の解読
ジェフリー・A・ラフォロ、ジェフリー・J・グレイ、ジェレミアス・スラム
arXiv:2112.07782 (2021)
自己教師あり学習を使用した抗体の言語の解読(AntiBERTa)
ジヌ・リーム、ローラ・S・ミッチェル、ジェームズ・HR・ファーマリー、ジャスティン・バートン、ジェイコブ・D・ギャルソン
パターン 2022
AbLang: 抗体配列を完成させるための抗体言語モデル(AbLang)
トビアス・H・オルセン、イアン・H・モール、シャーロット・M・ディーン
バイオインフォマティクスの進歩 2022
抗体に対する合理的なアプローチ (PARA) による事前トレーニング
高香瑞、曹長陵、ライペン・ライ
バイオRxiv (2023)
SAbDab: 構造抗体データベース(SAbDab)
ジェームズ・ダンバー、コンラッド・クラチック、ジヌ・リーム、テリー・ベイカー、アンジェリカ・フックス、ガイ・ジョルジュ、ジイェ・シー、シャーロット・M・ディーン
核酸研究 2014
RosettaAntibodyDesign (RAbD): コンピューターによる抗体設計 (RAB) の一般的なフレームワーク
ジャレッド・アドルフ=ブライフォーグル、オレクス・カリュジニー、マイケル・クビッツ、ブライアン・D・ワイツナー、シャオジェン・フー、安達由美子、ウィリアム・R・シーフ、ローランド・L・ダンブラック・ジュニア
PLOS 計算生物学 2018
tFold-Ab: 配列ホモログを使用しない高速かつ正確な抗体構造予測(tFold-Ab)
Jixiang Wu、Fandi Wu、Biaobin Jiang、Wei Liu、Peilin Zhao
バイオRxiv (2022)
xTrimoABFold: MSA を使用しない De novo 抗体構造予測(xTrimoABFold)
イニン・ワン、シュメン・ゴン、シャオチュアン・リー、ビン・ヤン、イーウー・スン、チュアン・シー、ヤンガン・ワン、チェン・ヤン、ホイ・リー、レ・ソン
arXiv:2212.00735 (2022)
ImmuneBuilder: 免疫タンパク質の構造を予測するための深層学習モデル(ABodyBuilder)
ブレナン・アバナーデス、ウィン・キ・ウォン、ファーガス・ボイルズ、ガイ・ジョルジュ、アレクサンダー・ブジョツェク、シャーロット・M・ディーン
ネイチャー 2023
ABlooper: 正確な推定による高速で正確な抗体 CDR ループ構造予測(ABlooper)
ブレナン・アバナデス、ガイ・ジョルジュ、アレクサンダー・ブヨツェク、シャーロット・M・ディーン
バイオインフォマティクス 2022
深層学習による幾何学的ポテンシャルにより、CDR H3 ループ構造の予測が向上します(DeepH3)
ジェフリー・A・ルフォロ、カルロス・ゲラ、サイ・プージャ・マハジャン、ジェレミアス・スラム、ジェフリー・J・グレイ
バイオインフォマティクス 2020
CDR-H3 ループ構造予測のためのシンプルなエンドツーエンド深層学習モデル(SimpleDH3)
ナタリア・ゼンコワ、エカテリーナ・セディフ、タチアナ・シュガエワ、ウラジスラフ・ストラシコ、ティモフェイ・エルマック、アレクセイ・シュピルマン
arXiv:2111.10656 (2021)
解釈可能な深層学習(DeepAB)を用いた抗体構造予測
ジェフリー・A・ラフォロ、ジェレミアス・スラム、ジェフリー・J・グレイ
パターン 2021
大量の天然抗体 (IgFold) のディープラーニングによる高速かつ正確な抗体構造予測
ジェフリー・A・ラフォロ、リー・シン・チュー、サイ・プージャ・マハジャン、ジェフリー・J・グレイ
ネイチャーコミュニケーションズ 2023
SAbDab: 構造抗体データベース(SAbDab)
ジェームズ・ダンバー、コンラッド・クラチック、ジヌ・リーム、テリー・ベイカー、アンジェリカ・フックス、ガイ・ジョルジュ、ジイェ・シー、シャーロット・M・ディーン
核酸研究 2014
RosettaAntibodyDesign (RAbD): コンピューターによる抗体設計 (RAB) の一般的なフレームワーク
ジャレッド・アドルフ=ブライフォーグル、オレクス・カリュジニー、マイケル・クビッツ、ブライアン・D・ワイツナー、シャオジェン・フー、安達由美子、ウィリアム・R・シーフ、ローランド・L・ダンブラック・ジュニア
PLOS 計算生物学 2018
SKEMPI 2.0: 突然変異時のタンパク質間結合エネルギー、反応速度論、熱力学の変化に関する最新ベンチマーク(SKEMPI)
ジャスティナ・ヤンカウスカイト、ブライアン・ヒメネス=ガルシア、ジャスタス・ダプクナス、フアン・フェルナンデス=レシオ、イアン・H・モアル
バイオインフォマティクス 2019
制約のないスケールでの機械学習ベースの抗体設計の原理をインシリコで証明
ラフマド・アクバラ、フィリップ・A・ロベルタ、セドリック・R・ウェバーブ、マイケル・ヴィドリッチ、ロバート・フランカ、ミレーナ・パヴロヴィッチ、ロネケ・シェフェルド、マリア・チェルニゴフスカヤ、イーゴリ・スナプコワ、アンドレイ・スラボドキナ、ブリジ・ブーシャン・メーター、エンケレイダ・ミホエ、フリチョフ・ルンド=ヨハンセナ、ヤン・テリエアンデルセナ f、ゼップ ホッホライターク g、イングリッド ホベク ハフ、ギュンター クランバウエルク、ゲイル ケティル サンドヴェド、ヴィクトール グライフ
mAbs 2022https://www.tandfonline.com/doi/full/10.1080/19420862.2022.2031482
抗体配列構造協調設計のための反復改良グラフ ニューラル ネットワーク(RefineGNN)
ウェンゴン・ジン、ジェレミー・ウォルウェンド、レジーナ・バルジライ、トミ・ジャーッコラ
ICLR 2022
3D 等変グラフ変換 (MEAN) としての条件付き抗体設計
Xiangzhe Kong、Wenbing Huang、Yang Liu
ICLR 2023
タンパク質複合体不変式埋め込みを備えたクロスゲート MLP はワンショットの抗体デザイナー(ADesigner)
Cheng Tan、Zhangyang Gao、Lirong Wu、Jun Xia、Jiangbin Zheng、Xihong Yang、Yue Liu、Bozhen Hu、Stan Z. Li
AAAI 2024
タンパク質構造の拡散ベースの生成モデル (DiffAb) を使用した抗原特異的抗体の設計と最適化
Shitong Luo、Yufeng Su、Xingang Peng、Sheng Wang、Jian Peng、Jianzhu Ma
NeurIPS 2022
柔軟で部位特異的なタンパク質のドッキングと設計のための深層学習(DockGPT)
マット・マクパートロン、ジンボ・シュー
バイオRxiv (2023)
階層的等変リファインメント (HERN) による抗体-抗原のドッキングと設計
Wengong Jin、Dr.Regina Barzilay、Tommi Jaakkola
ICML 2022
エンドツーエンドの全原子抗体設計(dyMEAN)
Xiangzhe Kong、Wenbing Huang、Yang Liu
ICML2023
治療用ペプチド生成のためのマルチモーダル対照拡散モデル(MMCD)
Yongkang Wang、Xuan Liu、Feng Huang、Zhankun Xiong、Wen Zhang
AAAI 2024
PepGB: グラフ ニューラル ネットワーク (PepGB) によるペプチド創薬の促進
イーピン・レイ、シュー・ワン、メン・ファン、ハン・リー、シャン・リー、ジェンヤン・ゼン
arXiv:2401.14665 (2024)
PepHarmony: 統合された配列および構造ベースのペプチドエンコーディングのためのマルチビュー対照学習フレームワーク(PepHarmony)
Ruochi Zhang、Haoran Wu、Chang Liu、Huaping Li、Yuqian Wu、Kewei Li、Yifan Wang、Yifan Deng、Jiahui Chen、Fengfeng Zhou、Xin Gao
arXiv:2401.11360 (2024)
PEFT-SP: 大規模タンパク質言語モデルでのパラメーター効率の高い微調整によりシグナルペプチド予測が向上(PEFT-SP)
Shuai Zeng、Duolin Wang、Dong Xu
バイオRxiv (2023)
AdaNovo: 条件付き相互情報を使用した適応型 De Novo ペプチド シーケンシング(AdaNovo)
Jun Xia、Shaorong Chen、Jingbo Zhou、Tianze Ling、Wenjie Du、Sizhe Liu、Stan Z. Li
arXiv:2403.07013 (2024)