AlphaFold3, un modèle de prédiction de la structure des protéines qui a fait d'énormes vagues dans le domaine des sciences biologiques, a déclenché de nombreuses tentatives de reproduction car il n'a publié que l'article mais n'a pas fourni de code. La stratégie de DeepMind permet à de nombreux scientifiques de n'utiliser AlphaFold3 qu'un nombre limité de fois sur des serveurs spécifiques, ce qui aiguise sans aucun doute l'appétit de tous. Cependant, l’équipe Ligo composée de trois étudiants de premier cycle de l’Université d’Oxford a réussi à reproduire AlphaFold3 en seulement quatre mois et prévoit de le rendre open source, apportant ainsi des nouvelles passionnantes à la communauté scientifique. L'éditeur de Downcodes vous fera comprendre en profondeur cette réalisation exceptionnelle de l'équipe Ligo.
À l’intersection des sciences biologiques et de l’informatique, AlphaFold3 est comme une superstar depuis sa sortie, attirant d’innombrables attentions. C'est dommage que Google DeepMind ne nous ait donné qu'un seul article, mais n'a fourni aucun code ni modèle de poids. C'est comme un délicieux gâteau, mais cela permet seulement à tout le monde de regarder l'apparence sans pouvoir le goûter. Face à ce « huis clos », de nombreuses équipes se bousculent pour réaliser un travail de reproduction.
Dans cette ambiance houleuse, une start-up appelée Ligo s'est démarquée et est devenue la première équipe à reproduire AlphaFold3. Les trois fondateurs de cette équipe étaient tous étudiants de premier cycle à l'université d'Oxford. Ils ont réalisé cet exploit en seulement quatre mois, ce qui est un beau cadeau pour la communauté scientifique.
AlphaFold3 est considéré comme une étape importante dans le domaine des sciences biologiques, en particulier dans la prédiction de la structure des protéines, et son potentiel d'application est énorme. Cependant, la stratégie de DeepMind est assez décevante. Leurs travaux ne sont accessibles aux scientifiques que sur des serveurs spécifiques et comportent un nombre limité d’appels par jour, ce qui semble ouvrir la voie à de futurs intérêts commerciaux. Malgré cela, les chercheurs sont enthousiasmés par cette réalisation car elle pourrait potentiellement changer complètement les règles du jeu de la découverte de médicaments.
Alors que de nombreux scientifiques se sentaient frustrés, l’équipe Ligo a courageusement fait le premier pas. Non seulement ils ont reproduit le modèle AlphaFold3, mais ils ont également prévu de le rendre open source afin que davantage de personnes puissent en bénéficier. L’équipe Ligo affirme que son modèle est actuellement efficace pour prédire les structures des protéines et que d’autres capacités suivront sous peu.
Le processus de reproduction n'est pas simple. L'équipe a complètement converti l'architecture du modèle de l'article DeepMind en code PyTorch. Au cours du processus, ils ont découvert certains problèmes dans l'article original, tels que l'erreur de formule de la fonction de perte, qui peut affecter l'effet d'entraînement. En outre, ils ont également optimisé le modèle original, par exemple en introduisant une couche résiduelle pour améliorer l'écoulement graduel.
Ce qui est passionnant, c'est que l'équipe Ligo a non seulement suivi les idées du modèle original dans ce travail, mais a également innové et essayé une méthode de mise en œuvre plus efficace. Ils n'ont même utilisé que 8 A100GPU pendant le processus de formation pour générer le modèle correspondant, et l'efficacité est accrocheuse.
Bien que DeepMind ait temporairement fermé les résultats pour des raisons commerciales, la reproduction réussie de Ligo a donné de l'espoir aux gens et a incité davantage d'équipes à suivre. Outre Ligo, l'équipe OpenFold de l'Université Columbia et le développeur indépendant Phil Wang participent également activement à ce mouvement open source, formant un écosystème de recherche scientifique dynamique.
Adresse du projet : https://github.com/Ligo-Biosciences/AlphaFold3
La reproduction réussie de l'équipe Ligo a non seulement brisé la stratégie fermée de DeepMind, mais a également fourni des outils de recherche plus pratiques aux scientifiques du monde entier. Ce n’est pas seulement une victoire pour AlphaFold3, mais aussi une victoire pour l’esprit open source, qui annonce le développement vigoureux du domaine de la prédiction de la structure des protéines à l’avenir. Nous attendons avec impatience que davantage d’équipes se joignent pour promouvoir conjointement le progrès des sciences biologiques !