AlphaFold3, um modelo de previsão da estrutura de proteínas que causou grandes ondas no campo das ciências biológicas, desencadeou tentativas generalizadas de reproduzi-lo porque apenas publicou o artigo, mas não forneceu o código. A estratégia da DeepMind permite que muitos cientistas usem o AlphaFold3 apenas um número limitado de vezes em servidores específicos, o que sem dúvida estimula o apetite de todos. No entanto, a equipe do Ligo, composta por três alunos de graduação da Universidade de Oxford, reproduziu com sucesso o AlphaFold3 em apenas quatro meses e planeja abri-lo, trazendo novidades interessantes para a comunidade científica. O editor de Downcodes lhe dará uma compreensão aprofundada dessa notável conquista da equipe Ligo.
Na intersecção da ciência biológica e da ciência da computação, AlphaFold3 tem sido uma estrela desde o seu lançamento, atraindo inúmeras atenções. É uma pena que o Google DeepMind nos deu apenas um papel, mas não forneceu nenhum código ou peso de modelo. É como um bolo delicioso, mas só permite que todos vejam a aparência sem poder prová-lo. Diante dessa abordagem “a portas fechadas”, muitas equipes estão se esforçando para realizar trabalhos de reprodução.
Nesse ambiente acalorado, uma empresa start-up chamada Ligo se destacou e se tornou a primeira equipe a reproduzir o AlphaFold3. Os três fundadores dessa equipe eram todos estudantes de graduação da Universidade de Oxford. Conseguiram esse feito em apenas quatro meses, o que é um grande presente para a comunidade científica.
AlphaFold3 é considerado um marco no campo das ciências biológicas, especialmente na previsão da estrutura de proteínas, e seu potencial de aplicação é enorme. No entanto, a estratégia da DeepMind é bastante decepcionante. Os seus trabalhos só estão disponíveis para cientistas em servidores específicos e têm um número limitado de chamadas por dia, o que parece estar a abrir caminho para futuros interesses comerciais. Mesmo assim, os investigadores estão entusiasmados com esta conquista porque tem o potencial de mudar completamente as regras do jogo da descoberta de medicamentos.
Justamente quando muitos cientistas se sentiam frustrados, a equipe do Ligo corajosamente deu o primeiro passo. Eles não apenas reproduziram o modelo AlphaFold3, mas também planejaram abri-lo para que mais pessoas pudessem se beneficiar. A equipe do Ligo afirma que seu modelo é atualmente eficaz na previsão de estruturas de proteínas, e outras capacidades surgirão em breve.
O processo de reprodução não é simples. A equipe converteu completamente a arquitetura do modelo no artigo DeepMind em código PyTorch. No processo, eles descobriram alguns problemas no artigo original, como o erro de fórmula da função de perda, que pode afetar o efeito do treinamento. Além disso, eles também otimizaram o modelo original, como a introdução de uma camada residual para melhorar o fluxo gradiente.
O que é interessante é que a equipe do Ligo não apenas seguiu as ideias do modelo original neste trabalho, mas também inovou e tentou um método de implementação mais eficiente. Eles até usaram apenas 8 GPUs A100 durante o processo de treinamento para gerar o modelo correspondente, e a eficiência é atraente.
Embora a DeepMind tenha fechado temporariamente os resultados por motivos comerciais, a reprodução bem-sucedida do Ligo deu esperança às pessoas e desencadeou mais equipes para fazer o acompanhamento. Além do Ligo, a equipe OpenFold da Universidade de Columbia e o desenvolvedor independente Phil Wang também participam ativamente desse movimento de código aberto, formando um ecossistema de pesquisa científica vívido.
Endereço do projeto: https://github.com/Ligo-Biosciences/AlphaFold3
A reprodução bem-sucedida da equipe Ligo não apenas quebrou a estratégia fechada da DeepMind, mas também forneceu ferramentas de pesquisa mais convenientes para cientistas de todo o mundo. Esta não é apenas uma vitória para AlphaFold3, mas também uma vitória para o espírito de código aberto, que anuncia o desenvolvimento vigoroso do campo de previsão da estrutura de proteínas no futuro. Esperamos que mais equipes se juntem para promover conjuntamente o progresso das ciências biológicas!