AlphaFold3, модель прогнозирования структуры белка, которая произвела огромный фурор в области биологических наук, вызвала широкомасштабные попытки воспроизвести ее, поскольку она лишь опубликовала статью, но не предоставила код. Стратегия DeepMind позволяет многим ученым использовать AlphaFold3 только ограниченное количество раз на определенных серверах, что, несомненно, разжигает у всех аппетит. Однако команда Ligo, состоящая из трех студентов Оксфордского университета, успешно воспроизвела AlphaFold3 всего за четыре месяца и планирует открыть его исходный код, принеся научному сообществу захватывающие новости. Редактор Downcodes даст вам более глубокое понимание этого выдающегося достижения команды Ligo.
На стыке биологии и информатики AlphaFold3 с момента своего выпуска стал суперзвездой, привлекая бесчисленное внимание. Жаль, что Google DeepMind предоставил нам только одну статью, но не предоставил ни кода, ни веса модели. Это похоже на вкусный торт, но он позволяет каждому только посмотреть на внешний вид, не имея возможности его попробовать. Столкнувшись с таким подходом «за закрытой дверью», многие команды изо всех сил пытаются выполнить работу по воспроизводству.
В этой накаленной атмосфере стартап-компания Ligo выделилась и стала первой командой, воспроизведшей AlphaFold3. Все трое основателей этой команды были студентами Оксфордского университета. Они достигли этого результата всего за четыре месяца, что является большим подарком научному сообществу.
AlphaFold3 считается важной вехой в области биологических наук, особенно в предсказании структуры белков, и потенциал его применения огромен. Однако стратегия DeepMind весьма разочаровывает. Их работы доступны ученым только на определенных серверах и имеют ограниченное количество обращений в день, что, похоже, открывает путь для будущих коммерческих интересов. Несмотря на это, исследователи воодушевлены этим достижением, поскольку оно потенциально может полностью изменить правила игры в области открытия лекарств.
Когда многие учёные почувствовали разочарование, команда Лиго смело сделала первый шаг. Они не только воспроизвели модель AlphaFold3, но и планировали открыть ее исходный код, чтобы ею могло воспользоваться больше людей. Команда Ligo утверждает, что их модель в настоящее время эффективна для прогнозирования белковых структур, а вскоре появятся и другие возможности.
Процесс воспроизведения непрост. Команда полностью преобразовала архитектуру модели из статьи DeepMind в код PyTorch. В процессе они обнаружили некоторые проблемы в оригинальной статье, такие как ошибка формулы функции потерь, которая может повлиять на эффект обучения. Кроме того, они также оптимизировали исходную модель, например, введя остаточный слой для улучшения градиентного потока.
Что интересно, команда Ligo не только следовала идеям исходной модели в этой работе, но также ввела новшества и попробовала более эффективный метод реализации. В процессе обучения они даже использовали всего 8 графических процессоров A100 для создания соответствующей модели, и эффективность впечатляет.
Хотя DeepMind временно закрыла результаты по коммерческим причинам, успешное воспроизведение Ligo вселило в людей надежду и побудило больше команд заняться исследованиями. Помимо Ligo, в этом движении за открытый исходный код активно участвуют команда OpenFold Колумбийского университета и независимый разработчик Фил Ванг, формируя яркую экосистему научных исследований.
Адрес проекта: https://github.com/Ligo-Biosciences/AlphaFold3
Успешное воспроизводство команды Ligo не только сломало закрытую стратегию DeepMind, но и предоставило учёным всего мира более удобные инструменты исследований. Это не только победа AlphaFold3, но и победа духа открытого исходного кода, который предвещает энергичное развитие области прогнозирования структуры белков в будущем. Мы с нетерпением ждем, когда к нам присоединятся новые команды, чтобы вместе способствовать прогрессу биологических наук!