Conception impressionnante de protéines basée sur l'IA
Il s'agit d'une collection de documents de recherche sur la conception de protéines basée sur l'IA . Et le référentiel sera continuellement mis à jour pour suivre les frontières de la conception de protéines basées sur l’IA.
Bienvenue à suivre et à jouer !
Table des matières
Présentation de la conception des protéines
Les outils d’IA ont résolu le problème de prédiction de la structure des protéines. Ce problème dérive la structure spatiale de la séquence d'acides aminés et atteint une précision de prédiction au niveau atomique, telle qu'AlphaFold 2. Il combine les modèles de prédiction de structure protéique précédents pour apprendre automatiquement les méthodes de conception de protéines, répondant ainsi véritablement aux besoins pharmaceutiques humains.


Les pratiques spécifiques de conception de protéines varient considérablement et les définitions de problèmes applicables aux différents processus de conception sont également très différentes. Voici quelques exemples :
- Un problème de prédiction des séquences d'acides aminés à partir de la structure spatiale (l'inverse d'Alphafold), qui suppose que la structure spatiale de la protéine souhaitée peut être dérivée via des simulations de dynamique moléculaire, etc.
- Un problème de complétion de structure protéique pour une structure partielle donnée, comme le récent Science [1] du célèbre groupe de David Baker. Cela suppose que seules des correspondances structurelles partielles peuvent être trouvées.
- Combinaison de la fonction énergétique ajustée avec la simulation MD pour la conception de protéines, comme le récent Nature [2] de l'équipe de Liu Haiyan en Chine.
De plus, de nombreuses méthodes peuvent être utilisées pour la conception de protéines, et les définitions correspondantes des problèmes d’IA sont également très différentes. Cet article répertorie quelques articles de haut niveau sur la conception de protéines basées sur l’IA, qui seront continuellement mis à jour à l’avenir.
Papiers
format:
- [title](paper link) [links]
- author1, author2, and author3...
- publisher
- keyword
Nature
Prédiction précise de la structure des interactions biomoléculaires avec AlphaFold 3
- Josh Abramson, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Andrew J. Ballard, Joshua Bambrick, Sebastian W. Bodenstein, David A. Evans, Chia-Chun Hung, Michael O' Neill, David Reiman, Kathryn Tunyasuvunakool, Zachary Wu, Akvilė Žemgulytė, Eirini Arvaniti, Charles Beattie, Ottavia Bertolli, Alex Bridgland, Alexey Cherepanov, Miles Congreve, Alexander I. Cowen-Rivers, Andrew Cowie, Michael Figurnov, Fabian B. Fuchs, Hannah Gladman, Rishub Jain, Yousuf A. Khan, Caroline MR Low, Kuba Perlin, Anna Potapenko, Pascal Savy, Sukhdeep Singh, Adrian Stecula, Ashok Thillaisundaram, Catherine Tong, Sergei Yakneen, Ellen D. Zhong, Michal Zielinski, Augustin Žídek, Victor Bapst, Pushmeet Kohli, Max Jaderberg, Demis Hassabis et John M. Jumper
- Mot clé : Architecture basée sur la diffusion, Modélisation de la structure des protéines, Modélisation de l'espace biomoléculaire
Une fonction énergétique centrée sur le squelette des réseaux de neurones pour la conception de protéines
- B Huang, Y Xu, X Hu, Y Liu, S Liao, J Zhang, C Huang
- Mot clé : fonction énergétique, simulation MD, centré sur le squelette
Conception de protéines de novo par hallucination de réseau profond
- Ivan Anishchenko, Samuel J. Pellock, Tamuka M. Chidyausiku, Theresa A. Ramelot, Sergey Ovchinnikov, Jingzhou Hao, Khushboo Bafna, Christoffer Norn, Alex Kang, Asim K. Bera, Frank DiMaio, Lauren Carter, Cameron M. Chow, Gaetano T. Montelione et David Baker
- Mots-clés : hallucination, inpainting, conception de protéines
Conception de protéines liant les protéines à partir de la seule structure cible
- Longxing Cao, Brian Coventry, Inna Goreshnik, Buwei Huang, William Sheffler, Joon Sung Park, Kevin M. Jude, Iva Marković, Rameshwar U. Kadam, Koen HG Verschueren, Kenneth Verstraete, Scott Thomas Russell Walsh, Nathaniel Bennett, Ashish Phal, Aerin Yang, Lisa Kozodoy, Michelle DeWitt, Lora Picton, Lauren Miller, Eva-Maria Strauch, Nicholas D. DeBouver, Allison Pires, Asim K. Bera, Samer Halabiya, Bradley Hammerson, Wei Yang, Steffen Bernard, Lance Stewart, Ian A. Wilson, Hannele Ruohola-Baker, Joseph Schlessinger, Sangwon Lee, Savvas N. Savvides, K. Christopher Garcia et David Baker
- Mots-clés : citation contraignante
Génie biomédical naturel
- Découverte accélérée d’antimicrobiens via des modèles génératifs profonds et des simulations de dynamique moléculaire
- Payel Das, Tom Sercu, Kahini Wadhawan, Inkit Padhi, Sebastian Gehrmann, Flaviu Cipcigan, Vijil Chenthamarakshan, Hendrik Strobelt, Cicero dos Santos, Pin-Yu Chen, Yi Yan Yang, Jeremy PK Tan, James Hedrick, Jason Crain et Aleksandra Mojsilovic
- Mots clés : antimicrobiens, auto-encodeur génératif, dynamique moléculaire
Communications naturelles
Découverte de substrats peptidiques de novo pour les enzymes grâce à l'apprentissage automatique
- Lorillee Tallorin, JiaLei Wang, Woojoo E. Kim, Swagat Sahu, Nicolas M. Kosa, Pu Yang, Matthew Thompson, Michael K. Gilson, Peter I. Frazier, Michael D. Burkart et Nathan C. Gianneschi
- Mots-clés : conception d'enzymes, apprentissage automatique
ECNet est un cadre d'apprentissage profond évolutif intégré au contexte pour l'ingénierie des protéines.
- Yunan Luo, Guangde Jiang, Tianhao Yu, Yang Liu, Lam Vo, Hantian Ding, Yufeng Su, Wesley Wei Qian, Huimin Zhao et Jian Peng
- Mots-clés : forme fonctionnelle, évolutif
Conception de protéines et prédiction de variantes à l'aide de modèles génératifs autorégressifs
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse et Debora S. Marks
- Mots-clés : modèles génératifs autorégressifs, conception de protéines
Conception de séquences protéiques avec un potentiel appris
- Namrata Anand, Raphael Eguchi, Irimpan I. Mathews, Carla P. Perez, Alexander Derry, Russ B. Altman et Po-Ssu Huang
- Mots-clés : conception des protéines, fonction énergétique, réseau neuronal profond
Conception de protéines et prédiction de variantes à l'aide de modèles génératifs autorégressifs
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse et Debora S. Marks
- Mots-clés : modèles génératifs autorégressifs, conception de protéines
Intelligence des machines naturelles
Science
ICML, ICLR ou NeurIPS
Apprentissage par renforcement profond pour la modélisation de complexes protéiques
- Ziqi Gao, Tao Feng, Jiaxuan You, Chenyi Zi, Yan Zhou, Chen Zhang, Jia Li
- Mots-clés : prédiction de la structure d'un complexe protéique, prédiction du chemin d'amarrage, réseau politique, apprentissage par renforcement
La BERTologie rencontre la biologie : interpréter l'attention dans les modèles de langage protéique
- Jesse Vig, Ali Madani, Lav R. Varshney, Caiming Xiong, Richard Socher, Nazneen Fatema Rajani
- Mots-clés : modèle de langage, transformateur, propriété structurelle et fonctionnelle
Conception conditionnelle d'anticorps en tant que traduction de graphiques équivariants 3D
- Xiangzhe Kong, Wenbing Huang, Yang Liu
- Mots-clés : conception d’anticorps, traduction de graphiques
Conditionnement par échantillonnage adaptatif pour une conception robuste
- David Brookes, parc Hahnbeom, Jennifer Listgarten
- Mots-clés : échantillonnage adaptatif, conception de protéines
Les modèles génératifs profonds créent des structures protéiques nouvelles et diverses
- Zeming Lin, Tom Sercu, Yann LeCun
- Mots clés : diversité, modèle génératif, conception de protéines
Affinement profond des caractéristiques topologiques pour la conception de protéines de novo
- Zander Harteveld, Joshua Southern, Michaël Defferrard, Andreas Loukas, Pierre Vandergheynst, Micheal Bronstein, Bruno Correia
- Mots-clés : auto-encodeur variationnel, caractéristiques topologiques, netteté
Fold2Seq : un modèle génératif basé sur l'intégration de séquences conjointes (1D) et Fold (3D) pour la conception de protéines
- Yue Cao, Payel Das, Vijil Chenthamarakshan, Pin-Yu Chen, Igor Melnyk, Yang Shen
- Mots-clés : modèle génératif, conception de protéines
Modélisation générative des structures protéiques
- Namrata Anand, Possu Huang
- Mots-clés : modèle génératif, conception de protéines
Modèles génératifs pour la conception de protéines basées sur des graphiques
- John Ingraham, Vikas Garg, Regina Barzilay, Tommi Jaakkola
- Mots-clés : modèle génératif, conception de protéines
Apprentissage par renforcement basé sur un modèle pour la conception de séquences biologiques
- XChristof Angermueller, David Dohan, David Belanger, Ramya Deshpande, Kevin Murphy, Lucy Colwell
- Mots-clés : apprentissage par renforcement, conception de séquences
Génération de molécules pour la liaison aux protéines cibles avec des motifs structurels
- Zaixi Zhang, Yaosen Min, Shuxin Zheng, Qi Liu
- Mots-clés : protéine cible, motifs structuraux, génération fragment par fragment
Apprentissage de la représentation des protéines par pré-entraînement aux structures géométriques
- Zuobai Zhang, Minghao Xu, Arian Jamasb, Vijil Chenthamarakshan, Aurélie Lozano, Payel Das, Jian Tang
- Mots-clés : découverte de médicaments, conception de médicaments, modèles génératifs de nouvelles structures moléculaires
Arxiv ou bioRxiv
Génération de protéines avec diffusion évolutive : la séquence suffit
- Sarah Alamdari, Nitya Thakkar, Rianne van den Berg, Alex Xijie Lu, Nicolo Fusi, Ava Pardis Amini, Kevin K Yang
- Mots clés : modèle de diffusion, modèle génératif profond, génération de protéines, cadre, conception de séquences
Un langage de programmation de haut niveau pour la conception générative de protéines
- Brian Hie, Salvatore Candido, Zeming Lin, Ori Kabeli, Roshan Rao, Nikita Smetanin, Tom Sercu, Alexander Rives
- Mots-clés : ESMFold, modèle de langage, basé sur l'énergie
Conception de protéines largement applicable et précise en intégrant des réseaux de prédiction de structure et des modèles génératifs de diffusion
- Joseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile IM Wicky, Nikita Hanikel , Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker
- Mots-clés : diffusion, cadre général d'apprentissage profond, conception de liants de novo
Conception de protéines guidée par la fonction par échantillonnage multiple en profondeur
- Vladimir Gligorijević, Daniel Berenberg, Stephen Ra, Simon Kelow, Kyunghyun Cho
- Mots clés : auto-encodeur à débruitage de séquence, échantillonnage multiple profond
Les modèles de langage se généralisent au-delà des protéines naturelles
- Robert Verkuil, Ori Kabeli, Yilun Du, Basile IM Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives
- Mots-clés : ESMFold, modèle de langage, conception de base fixe
Les modèles linguistiques de séquences protéiques à l’échelle de l’évolution permettent une prédiction précise de la structure
- Zeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Sal Candido, Alexander Rives
- Mots-clés : prédiction de structure, modèle de langage
TERMinator : un cadre neuronal pour la conception de protéines basées sur la structure utilisant des motifs répétitifs tertiaires
- Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
- Mots-clés : conception de protéines, motifs tertiaires
Les modèles de langage se généralisent au-delà des protéines naturelles
- Robert Verkuil, Ori Kabeli, Yilun Du, Basile IM Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives
- Mots-clés : modèle de langage, conception de protéines
Autres
Référence
[1] Wang, Jue et coll. "Sites fonctionnels de protéines d'échafaudage à l'aide de l'apprentissage profond." Sciences 377.6604 (2022) : 387-394.
[2] Huang, Bin et coll. "Une fonction énergétique centrée sur le squelette des réseaux neuronaux pour la conception de protéines." Nature 602.7897 (2022) : 523-528.
Contribuer
Notre objectif est de rendre ce dépôt encore meilleur. Si vous souhaitez contribuer, veuillez vous référer à ICI pour les instructions de contribution.
Licence
une superbe conception de protéines basée sur l'IA est publiée sous la licence Apache 2.0.