Design incrível de proteínas baseado em IA
Esta é uma coleção de artigos de pesquisa para Design de Proteínas baseado em IA . E o repositório será continuamente atualizado para rastrear a fronteira do design de proteínas baseado em IA.
Bem-vindo a seguir e estrelar!
Índice
Visão geral do design de proteínas
As ferramentas de IA resolveram o problema de previsão da estrutura das proteínas. Este problema deriva a estrutura espacial da sequência de aminoácidos e atinge precisão de previsão em nível atômico, como AlphaFold 2. Ele combina modelos anteriores de previsão de estrutura de proteínas para aprender automaticamente métodos de design de proteínas, atendendo verdadeiramente às necessidades farmacêuticas humanas.
As práticas específicas de design de proteínas variam amplamente, e as definições de problemas aplicáveis a diferentes processos de design também são muito diferentes. Aqui estão alguns exemplos:
- Um problema de previsão de sequências de aminoácidos a partir da estrutura espacial (o inverso de Alphafold), que assume que a estrutura espacial da proteína desejada pode ser derivada através de simulações de dinâmica molecular, etc.
- Um problema de conclusão da estrutura da proteína para uma determinada estrutura parcial, como o recente Science [1] do famoso grupo David Baker. Isto pressupõe que apenas correspondências estruturais parciais podem ser encontradas.
- Combinação da função de energia ajustada com simulação MD para projeto de proteínas, como o recente Nature [2] da equipe de Liu Haiyan na China.
Além disso, muitos métodos podem ser usados para projetar proteínas, e as definições correspondentes do problema de IA também são muito diferentes. Este artigo lista alguns artigos de alto nível em design de proteínas baseadas em IA, que serão continuamente atualizados no futuro.
Artigos
format:
- [title](paper link) [links]
- author1, author2, and author3...
- publisher
- keyword
Natureza
Previsão precisa da estrutura de interações biomoleculares com AlphaFold 3
- Josh Abramson, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Andrew J. Ballard, Joshua Bambrick, Sebastian W. Bodenstein, David A. Evans, Chia-Chun Hung, Michael O' Neill, David Reiman, Kathryn Tunyasuvunakool, Zachary Wu, Akvilė Žemgulytė, Eirini Arvaniti, Charles Beattie, Ottavia Bertolli, Alex Bridgland, Alexey Cherepanov, Miles Congreve, Alexander I. Cowen-Rivers, Andrew Cowie, Michael Figurnov, Fabian B. Fuchs, Hannah Gladman, Rishub Jain, Yousuf A. Khan, Caroline MR Low, Kuba Perlin , Anna Potapenko, Pascal Savy, Sukhdeep Singh, Adrian Stecula, Ashok Thillaisundaram, Catherine Tong, Sergei Yakneen, Ellen D. Zhong, Michal Zielinski, Augustin Žídek, Victor Bapst, Pushmeet Kohli, Max Jaderberg, Demis Hassabis e John M. Jumper
- Palavras-chave: Arquitetura baseada em difusão, Modelagem de estrutura de proteínas, Modelagem de espaço biomolecular
Uma função energética de redes neurais centrada na espinha dorsal para design de proteínas
- B Huang, Y Xu, X Hu, Y Liu, S Liao, J Zhang, C Huang
- Palavra-chave: função de energia, simulação MD, centrada no backbone
Projeto de proteína de novo por alucinação de rede profunda
- Ivan Anishchenko, Samuel J. Pellock, Tamuka M. Chidyausiku, Theresa A. Ramelot, Sergey Ovchinnikov, Jingzhou Hao, Khushboo Bafna, Christoffer Norn, Alex Kang, Asim K. Bera, Frank DiMaio, Lauren Carter, Cameron M. Chow, Gaetano T. Montelione e David Baker
- Palavras-chave: alucinação, pintura interna, design de proteínas
Projeto de proteínas de ligação a proteínas apenas a partir da estrutura alvo
- Longxing Cao, Brian Coventry, Inna Goreshnik, Buwei Huang, William Sheffler, Joon Sung Park, Kevin M. Jude, Iva Marković, Rameshwar U. Kadam, Koen HG Verschueren, Kenneth Verstraete, Scott Thomas Russell Walsh, Nathaniel Bennett, Ashish Phal, Aerin Yang, Lisa Kozodoy, Michelle DeWitt, Lora Picton, Lauren Miller, Eva-Maria Strauch, Nicholas D. DeBouver, Allison Pires, Asim K. Bera, Samer Halabiya, Bradley Hammerson, Wei Yang, Steffen Bernard, Lance Stewart, Ian A. Wilson, Hannele Ruohola-Baker, Joseph Schlessinger, Sangwon Lee, Savvas N. Savvides , K. Christopher Garcia e David Baker
- Palavras-chave: citação vinculativa
Engenharia Biomédica da Natureza
- Descoberta acelerada de antimicrobianos por meio de modelos generativos profundos e simulações de dinâmica molecular
- Payel Das, Tom Sercu, Kahini Wadhawan, Inkit Padhi, Sebastian Gehrmann, Flaviu Cipcigan, Vijil Chenthamarakshan, Hendrik Strobelt, Cícero dos Santos, Pin-Yu Chen, Yi Yan Yang, Jeremy PK Tan, James Hedrick, Jason Crain e Aleksandra Mojsilovic
- Palavras-chave: antimicrobianos, autoencoder generativo, dinâmica molecular
Comunicações da Natureza
Descobrindo substratos peptídicos de novo para enzimas usando aprendizado de máquina
- Lorillee Tallorin, JiaLei Wang, Woojoo E. Kim, Swagat Sahu, Nicolas M. Kosa, Pu Yang, Matthew Thompson, Michael K. Gilson, Peter I. Frazier, Michael D. Burkart e Nathan C. Gianneschi
- Palavras-chave: projeto de enzimas, aprendizado de máquina
ECNet é uma estrutura evolucionária de aprendizagem profunda integrada ao contexto para engenharia de proteínas
- Yunan Luo, Guangde Jiang, Tianhao Yu, Yang Liu, Lam Vo, Hantian Ding, Yufeng Su, Wesley Wei Qian, Huimin Zhao e Jian Peng
- Palavras-chave: aptidão funcional, evolutiva
Projeto de proteínas e previsão de variantes usando modelos generativos autorregressivos
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse e Debora S. Marks
- Palavras-chave: modelos generativos autorregressivos, design de proteínas
Projeto de sequência de proteínas com potencial aprendido
- Namrata Anand, Raphael Eguchi, Irimpan I. Mathews, Carla P. Perez, Alexander Derry, Russ B. Altman e Po-Ssu Huang
- Palavras-chave: design de proteínas, função energética, rede neural profunda
Projeto de proteínas e previsão de variantes usando modelos generativos autorregressivos
- Jung-Eun Shin, Adam J. Riesselman, Aaron W. Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew C. Kruse e Debora S. Marks
- Palavras-chave: modelos generativos autorregressivos, design de proteínas
Inteligência da Máquina da Natureza
Ciência
ICML, ICLR ou NeurIPS
Aprendizado de Reforço Profundo para Modelagem de Complexos de Proteínas
- Ziqi Gao, Tao Feng, Jiaxuan You, Chenyi Zi, Yan Zhou, Chen Zhang, Jia Li
- Palavras-chave: previsão de estruturas complexas de proteínas, previsão de caminhos de acoplamento, rede política, aprendizagem por reforço
BERTology encontra a biologia: interpretando a atenção em modelos de linguagem de proteínas
- Jesse Vig, Ali Madani, Lav R. Varshney, Caiming Xiong, Richard Socher, Nazneen Fatema Rajani
- Palavras-chave: modelo de linguagem, transformador, propriedade estrutural e funcional
Projeto condicional de anticorpos como tradução de gráfico equivalente em 3D
- Xiangzhe Kong, Wenbing Huang, Yang Liu
- Palavras-chave: design de anticorpos, tradução de gráficos
Condicionamento por amostragem adaptativa para design robusto
- David Brookes, Hahnbeom Park, Jennifer Listgarten
- Palavras-chave: amostragem adaptativa, design de proteínas
Modelos generativos profundos criam estruturas proteicas novas e diversas
- Zeming Lin, Tom Sercu, Yann LeCun
- Palavras-chave: diversidade, modelo generativo, design de proteínas
Afiação profunda de características topológicas para design de proteínas de novo
- Zander Harteveld, Joshua Southern, Michaël Defferrard, Andreas Loukas, Pierre Vandergheynst, Micheal Bronstein, Bruno Correia
- Palavras-chave: autoencoder variacional, características topológicas, nitidez
Fold2Seq: Um modelo generativo baseado em incorporação de sequência conjunta (1D) -Fold (3D) para design de proteínas
- Yue Cao, Payel Das, Vijil Chenthamarakshan, Pin-Yu Chen, Igor Melnyk, Yang Shen
- Palavras-chave: modelo generativo, design de proteínas
Modelagem generativa para estruturas de proteínas
- Namrata Anand, Possu Huang
- Palavras-chave: modelo generativo, design de proteínas
Modelos generativos para design de proteínas baseado em gráficos
- John Ingraham, Vikas Garg, Regina Barzilay, Tommi Jaakkola
- Palavras-chave: modelo generativo, design de proteínas
Aprendizagem por reforço baseada em modelo para projeto de sequência biológica
- XChristof Angermueller, David Dohan, David Belanger, Ramya Deshpande, Kevin Murphy, Lucy Colwell
- Palavras-chave: aprendizagem por reforço, design de sequência
Geração de moléculas para ligação de proteínas alvo com motivos estruturais
- Zaixi Zhang, Yaosen Min, Shuxin Zheng, Qi Liu
- Palavras-chave: proteína alvo, motivos estruturais, geração fragmento por fragmento
Aprendizagem de representação de proteínas por pré-treinamento de estrutura geométrica
- Zuobai Zhang, Minghao Xu, Arian Jamasb, Vijil Chenthamarakshan, Aurelie Lozano, Payel Das, Jian Tang
- Palavras-chave: descoberta de medicamentos, design de medicamentos, modelos generativos de novas estruturas moleculares
Arxiv ou bioRxiv
Geração de proteínas com difusão evolutiva: sequência é tudo que você precisa
- Sarah Alamdari, Nitya Thakkar, Rianne van den Berg, Alex Xijie Lu, Nicolo Fusi, Ava Pardis Amini, Kevin K Yang
- Palavras-chave: modelo de difusão, modelo generativo profundo, geração de proteínas, estrutura, desenho de sequência
Uma linguagem de programação de alto nível para design generativo de proteínas
- Brian Hie, Salvatore Candido, Zeming Lin, Ori Kabeli, Roshan Rao, Nikita Smetanin, Tom Sercu, Alexander Rives
- Palavras-chave: ESMFold, modelo de linguagem, baseado em energia
Projeto de proteínas amplamente aplicável e preciso, integrando redes de predição de estrutura e modelos geradores de difusão
- Joseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile IM Wicky, Nikita Hanikel , Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker
- Palavras-chave: difusão, estrutura geral de aprendizagem profunda, design de fichário de novo
Projeto de proteína guiado por função por amostragem profunda e múltipla
- Vladimir Gligorijević, Daniel Berenberg, Stephen Ra, Simon Kelow, Kyunghyun Cho
- Palavras-chave: autoencoder de eliminação de ruído de sequência, amostragem profunda de variedades
Os modelos de linguagem generalizam além das proteínas naturais
- Robert Verkuil, Ori Kabeli, Yilun Du, Basile IM Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives
- Palavras-chave: ESMFold, modelo de linguagem, design de backbone fixo
Modelos de linguagem de sequências de proteínas na escala da evolução permitem uma previsão precisa da estrutura
- Zeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Sal Candido, Alexander Rives
- Palavras-chave: previsão de estrutura, modelo de linguagem
TERMinator: Uma Estrutura Neural para Projeto de Proteína Baseado em Estrutura usando Motivos de Repetição Terciária
- Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
- Palavras-chave: design de proteínas, motivos terciários
Os modelos de linguagem generalizam além das proteínas naturais
- Robert Verkuil, Ori Kabeli, Yilun Du, Basile IM Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives
- Palavras-chave: modelo de linguagem, design de proteínas
Outros
Referência
[1] Wang, Jue, et al. "Andaime de locais funcionais de proteínas usando aprendizado profundo." Ciência 377.6604 (2022): 387-394.
[2] Huang, Bin, et al. "Uma função energética de redes neurais centrada na espinha dorsal para o design de proteínas." Natureza 602.7897 (2022): 523-528.
Contribuindo
Nosso objetivo é tornar este repositório ainda melhor. Se você estiver interessado em contribuir, consulte AQUI para obter instruções sobre contribuição.
Licença
incrível design de proteína baseado em IA é lançado sob a licença Apache 2.0.