AlphaFold3, ein Modell zur Vorhersage der Proteinstruktur, das in den Biowissenschaften großes Aufsehen erregt hat, hat weit verbreitete Versuche ausgelöst, es zu reproduzieren, da es nur die Arbeit veröffentlichte, aber keinen Code bereitstellte. Die Strategie von DeepMind ermöglicht es vielen Wissenschaftlern, AlphaFold3 nur eine begrenzte Anzahl von Malen auf bestimmten Servern zu verwenden, was zweifellos jedermanns Appetit weckt. Das aus drei Studenten der Universität Oxford bestehende Ligo-Team hat AlphaFold3 jedoch in nur vier Monaten erfolgreich reproduziert und plant, es als Open Source bereitzustellen, was der wissenschaftlichen Gemeinschaft aufregende Neuigkeiten bringen wird. Der Herausgeber von Downcodes wird Ihnen einen detaillierten Einblick in diese herausragende Leistung des Ligo-Teams geben.
An der Schnittstelle zwischen Biowissenschaft und Informatik ist AlphaFold3 seit seiner Veröffentlichung wie ein Superstar und hat unzählige Aufmerksamkeit erregt. Schade, dass Google DeepMind uns nur ein Papier gegeben hat, aber keinen Code oder Modellgewichte bereitgestellt hat. Es ist wie ein köstlicher Kuchen, aber jeder kann nur das Aussehen betrachten, ohne ihn probieren zu können. Angesichts dieses „hinter verschlossenen Türen“-Ansatzes bemühen sich viele Teams darum, Reproduktionsarbeiten durchzuführen.
In dieser hitzigen Atmosphäre stach ein Start-up-Unternehmen namens Ligo hervor und war das erste Team, das AlphaFold3 reproduzierte. Die drei Gründer dieses Teams waren alle Studenten der Universität Oxford. Diese Leistung gelang ihnen in nur vier Monaten, was ein großes Geschenk für die wissenschaftliche Gemeinschaft ist.
AlphaFold3 gilt als Meilenstein auf dem Gebiet der Biowissenschaften, insbesondere der Proteinstrukturvorhersage, und sein Anwendungspotenzial ist enorm. Die Strategie von DeepMind ist jedoch ziemlich enttäuschend. Ihre Arbeiten stehen Wissenschaftlern nur auf bestimmten Servern zur Verfügung und die Anzahl der Aufrufe pro Tag ist begrenzt, was den Weg für zukünftige kommerzielle Interessen zu ebnen scheint. Dennoch freuen sich die Forscher über diese Errungenschaft, denn sie hat das Potenzial, die Regeln der Arzneimittelforschung völlig zu verändern.
Gerade als viele Wissenschaftler frustriert waren, machte das Ligo-Team mutig den ersten Schritt. Sie haben nicht nur das AlphaFold3-Modell reproduziert, sondern auch geplant, es als Open Source bereitzustellen, damit mehr Menschen davon profitieren können. Das Ligo-Team sagt, dass ihr Modell derzeit bei der Vorhersage von Proteinstrukturen effektiv ist und weitere Funktionen in Kürze folgen werden.
Der Reproduktionsprozess ist nicht einfach. Das Team hat die Modellarchitektur im DeepMind-Artikel vollständig in PyTorch-Code umgewandelt. Dabei entdeckten sie einige Probleme in der Originalarbeit, beispielsweise den Formelfehler der Verlustfunktion, der sich auf den Trainingseffekt auswirken kann. Darüber hinaus optimierten sie auch das ursprüngliche Modell, indem sie beispielsweise eine Restschicht einführten, um den Gradientenfluss zu verbessern.
Spannend ist, dass das Ligo-Team in dieser Arbeit nicht nur den Ideen des ursprünglichen Modells gefolgt ist, sondern auch Innovationen entwickelt und eine effizientere Implementierungsmethode ausprobiert hat. Sie verwendeten während des Trainingsprozesses sogar nur 8 A100GPUs, um das entsprechende Modell zu generieren, und die Effizienz ist beeindruckend.
Obwohl DeepMind die Ergebnisse aus kommerziellen Gründen vorübergehend schloss, gab die erfolgreiche Reproduktion von Ligo den Menschen Hoffnung und veranlasste weitere Teams, weiterzumachen. Neben Ligo beteiligen sich auch das OpenFold-Team der Columbia University und der unabhängige Entwickler Phil Wang aktiv an dieser Open-Source-Bewegung und bilden ein lebendiges wissenschaftliches Forschungsökosystem.
Projektadresse: https://github.com/Ligo-Biosciences/AlphaFold3
Die erfolgreiche Reproduktion des Ligo-Teams durchbrach nicht nur die geschlossene Strategie von DeepMind, sondern stellte auch praktischere Forschungswerkzeuge für Wissenschaftler auf der ganzen Welt bereit. Dies ist nicht nur ein Sieg für AlphaFold3, sondern auch ein Sieg für den Open-Source-Geist, der die starke Entwicklung des Bereichs der Proteinstrukturvorhersage in der Zukunft ankündigt. Wir freuen uns auf weitere Teams, die gemeinsam den Fortschritt der Biowissenschaften vorantreiben!