AlphaFold3, un modelo de predicción de la estructura de proteínas que ha causado gran revuelo en el campo de las ciencias biológicas, ha provocado intentos generalizados de reproducirlo porque solo publicó el artículo pero no proporcionó el código. La estrategia de DeepMind permite a muchos científicos utilizar AlphaFold3 sólo un número limitado de veces en servidores específicos, lo que sin duda abre el apetito de todos. Sin embargo, el equipo de Ligo, compuesto por tres estudiantes universitarios de la Universidad de Oxford, reprodujo con éxito AlphaFold3 en solo cuatro meses y planea abrirlo, trayendo noticias interesantes a la comunidad científica. El editor de Downcodes le brindará una comprensión profunda de este destacado logro del equipo de Ligo.
En la intersección de las ciencias biológicas y la informática, AlphaFold3 ha sido como una superestrella desde su lanzamiento, atrayendo innumerables atenciones. Es una pena que Google DeepMind solo nos haya dado un documento, pero no haya proporcionado ningún código ni peso de modelo. Es como un pastel delicioso, pero solo permite que todos miren la apariencia sin poder probarlo. Ante esta actitud "a puerta cerrada", muchos equipos se apresuran a realizar trabajos de reproducción.
En este ambiente acalorado, una nueva empresa llamada Ligo se destacó y se convirtió en el primer equipo en reproducir AlphaFold3. Los tres fundadores de este equipo eran todos estudiantes universitarios de la Universidad de Oxford. Lograron esta hazaña en sólo cuatro meses, lo que supone un gran regalo para la comunidad científica.
AlphaFold3 se considera un hito en el campo de las ciencias biológicas, especialmente en la predicción de la estructura de las proteínas, y su potencial de aplicación es enorme. Sin embargo, la estrategia de DeepMind es bastante decepcionante. Sus trabajos sólo están disponibles para los científicos en servidores específicos y tienen un número limitado de llamadas por día, lo que parece estar allanando el camino para futuros intereses comerciales. Aun así, los investigadores están entusiasmados con este logro porque tiene el potencial de cambiar completamente las reglas del juego del descubrimiento de fármacos.
Justo cuando muchos científicos se sentían frustrados, el equipo de Ligo dio con valentía el primer paso. No sólo reprodujeron el modelo AlphaFold3, sino que también planearon abrirlo para que más personas pudieran beneficiarse. El equipo de Ligo dice que su modelo es actualmente eficaz para predecir estructuras de proteínas y que en breve aparecerán otras capacidades.
El proceso de reproducción no es simple. El equipo convirtió completamente la arquitectura del modelo en el artículo de DeepMind al código PyTorch. En el proceso, descubrieron algunos problemas en el artículo original, como el error de fórmula de la función de pérdida, que puede afectar el efecto del entrenamiento. Además, también optimizaron el modelo original, como la introducción de una capa residual para mejorar el flujo de gradiente.
Lo interesante es que el equipo de Ligo no sólo siguió las ideas del modelo original en este trabajo, sino que también innovó y probó un método de implementación más eficiente. Incluso utilizaron solo 8 GPU A100 durante el proceso de capacitación para generar el modelo correspondiente, y la eficiencia es llamativa.
Aunque DeepMind cerró temporalmente los resultados por motivos comerciales, la reproducción exitosa de Ligo dio esperanza a la gente y provocó que más equipos hicieran un seguimiento. Además de Ligo, el equipo OpenFold de la Universidad de Columbia y el desarrollador independiente Phil Wang también participan activamente en este movimiento de código abierto, formando un vívido ecosistema de investigación científica.
Dirección del proyecto: https://github.com/Ligo-Biosciences/AlphaFold3
La reproducción exitosa del equipo Ligo no solo rompió la estrategia cerrada de DeepMind, sino que también proporcionó herramientas de investigación más convenientes para los científicos de todo el mundo. Esta no es solo una victoria para AlphaFold3, sino también una victoria para el espíritu de código abierto, que presagia el vigoroso desarrollo del campo de la predicción de la estructura de proteínas en el futuro. ¡Esperamos que se unan más equipos para promover conjuntamente el progreso de las ciencias biológicas!