AlphaFold3,這款在生物科學領域掀起巨大波瀾的蛋白質結構預測模型,因其僅公佈論文而未提供程式碼,引發了廣泛的復現嘗試。 DeepMind的策略,使得許多科學家只能在特定伺服器上有限次地使用AlphaFold3,無疑地吊足了大家的胃口。然而,來自牛津大學的三位本科生組成的Ligo團隊,卻在短短四個月內成功復現了AlphaFold3,併計劃開源,為科學界帶來了令人振奮的消息。 Downcodes小編將帶你深入了解Ligo團隊的這項傑出成就。
在生物科學和電腦科學的交會點上,AlphaFold3自發布以來,就如同一顆超級明星,吸引了無數目光。可惜的是,GoogleDeepMind 只給了我們一篇論文,卻沒有提供任何程式碼或模型權重,像是一道美味的蛋糕,卻只讓大家看看外觀,沒法動手嚐嚐。面對這種「閉門造車」 的做法,許多團隊都在爭先恐後地進行復現工作。
就在這熱火朝天的氛圍中,一家名為Ligo 的新創公司脫穎而出,成為首個復現AlphaFold3的團隊,而這個團隊的三位創辦人全都是牛津大學的本科生。他們在短短四個月內就實現了這項壯舉,簡直是給科學界送上了一份大禮。
AlphaFold3被視為生物科學領域的里程碑,尤其在蛋白質結構預測方面,它的應用潛力巨大。然而,DeepMind 的策略讓人頗感失望,他們的作品只在特定伺服器上供科學家使用,每天調用次數有限,似乎在為未來的商業利益埋下伏筆。即便如此,研究人員卻對這項成果充滿期待,因為它有可能徹底改變藥物發現的遊戲規則。
就在眾多科學家感到挫敗的時候,Ligo 團隊卻勇敢地踏出了第一步。他們不僅復現了AlphaFold3的模型,還計劃將其開源,讓更多人受益。 Ligo 團隊表示,他們的模型目前可以有效預測蛋白質結構,而其他功能將在不久後跟進。
復現的過程並不簡單,團隊將DeepMind 論文中的模型架構完全轉化為PyTorch 程式碼。在這個過程中,他們發現了一些原始論文中的問題,例如損失函數的公式錯誤,這可能會影響訓練效果。此外,他們也對原有模型進行了最佳化,例如引入了殘差層來改善梯度流。
令人興奮的是,Ligo 團隊在這項工作中不僅遵循了原始模型的思路,還進行了創新,嘗試了更有效率的實現方式。他們甚至在訓練過程中只用了8個A100GPU,便產生了對應的模型,效率之高令人矚目。
儘管DeepMind 因商業原因暫時將成果封閉,但Ligo 的成功復現讓人們看到了希望,也引發了更多團隊的跟進。除了Ligo,哥倫比亞大學的OpenFold 團隊和獨立開發者Phil Wang 也積極參與這項開源運動,形成了一個生動的科學研究生態。
專案網址:https://github.com/Ligo-Biosciences/AlphaFold3
Ligo團隊的成功復現不僅打破了DeepMind的封閉策略,也為全球科學家提供了更便利的研究工具。 這不僅是AlphaFold3的勝利,更是開源精神的勝利,預示著未來蛋白質結構預測領域的蓬勃發展。期待更多團隊加入,共同推動生物科學的進步!