В этом году Нобелевские премии по физике и химии были присуждены областям, связанным с искусственным интеллектом. Концепция искусственного интеллекта для науки (ИИ для научных исследований), упрощенно называемая «AI4S», также привлекла внимание отечественных ученых. и за рубежом.
С 4 по 6 ноября в Пекинском университете прошел Саммит научной разведки 2024 года. Чжан Цзинь, Гун Сингао, Тан Чао и другие академики Китайской академии наук, а также многие эксперты и ученые, имеющие практический опыт научных исследований в области искусственного интеллекта. поделился и обсудил текущее применение ИИ в научных исследованиях, конкретные применения ИИ в области научных исследований, ограничения и нерешенные проблемы ИИ, а также влияние, которое ИИ для науки может оказать на парадигму научных исследований в будущем.
Успех AlphaFold — это лишь первый шаг на долгом пути. Традиционные системы искусственного интеллекта все еще имеют ограничения.
Хассабис, нынешний лауреат Нобелевской премии по химии, получил награду за разработку модели искусственного интеллекта AlphaFold, которая решила проблему 50-летней давности и может предсказывать сложные структуры примерно 200 миллионов известных белков. более чем 2 миллионами человек по всему миру. По мнению Тан Чао, академика Китайской академии наук и директора Объединенного центра наук о жизни Пекинского университета и Университета Цинхуа, успех AlphaFold не равен успеху в области наук о жизни. Это только «первый шаг в этом направлении». долгий марш в тысячи миль».
Тан Чао, академик Китайской академии наук и директор Объединенного центра наук о жизни Пекинского университета и Университета Цинхуа, выступает с речью (фотографировал Ло Идань, репортер Beijing News Shell Finance)
Тан Чао сообщил, что большинство моделей в области наук о жизни в настоящее время ограничены одной модальностью, такой как транскрипция одной клетки, последовательность РНК, структура белка и т. д. Однако наука о жизни — это сложная и огромная система. наука должна начать с молекул и клеток, органов к многоуровневой и многомерной интерактивной композиции всей жизни.
«Жизнь — это сложная система с множеством масштабов и уровней, от макро до микро. Каждый уровень имеет свой собственный язык и логику, которые влияют друг на друга», — сказал Тан Чао: «Традиционные структуры искусственного интеллекта хорошо справляются с обработкой структурированных и линейных данных, но жизнь — это сложная система. Системы Данные являются динамическими и многобитными интерактивными, поэтому традиционная структура искусственного интеллекта демонстрирует очевидные ограничения при работе с многомерными нелинейными данными медико-биологических наук».
Кроме того, даже одномодальные исследования ИИ требуют хорошей базы данных. В настоящее время некоторые области научных исследований сталкиваются с проблемами недостаточности экспериментальных данных и недостаточной стандартизации экспериментальных данных.
Тан Чао сказал, что создание систем данных по наукам о жизни началось поздно, из-за недостаточных инвестиций, отсутствия полноценной экосистемы полной цепочки, а также отсутствия систематического стратегического планирования и механизмов совместного использования на ранней стадии. готовые наборы данных, а уровень использования данных отстает в Европе и Америке.
Чжан Цзиньцзе, академик Китайской академии наук, член Постоянного комитета партийного комитета и вице-президент Пекинского университета, при представлении использования искусственного интеллекта для исследования материалов отметил, что текущий процесс сбора данных не является единообразным, и данные полученные с помощью разного оборудования, условий и операторов, сильно различаются. Кроме того, данные, полученные в результате различных типов экспериментов, включают изображения, спектральные данные, структурные данные и т. д. в разных форматах.
Моделирование и обучение ИИ требуют поддержки больших данных, сказал Чжан Цзинь: «Стандартизация является основой для реализации совместного использования данных, воспроизводимости и итерации научных знаний».
Чжан Цзинь, академик Китайской академии наук, член Постоянного комитета партийного комитета и вице-президент Пекинского университета, выступает с речью. Фото: Ло Идань, репортер газеты Beijing News Shell Finance.
По мнению Тан Чао, проблемы, которые необходимо срочно решить в рамках исследования структуры больших моделей медико-биологических наук, включают: оптимизацию конструкции кодировщика последовательностей, изображений и матричных данных на основе характеристик данных медико-биологических наук, корректировку архитектуры модуля и данных для объединения; различных модальных данных Выбор набора и стратегии предварительного обучения. Что действительно может вызвать «революционные изменения», так это то, как построить новую модельную архитектуру языковой логики, самоорганизации, иерархической возникновения, механизма обратной связи, адаптивности и т. д. жизненных явлений.
Тан Чао отметил, что исследовательский процесс в науках о жизни часто представляет собой цикл: проведение экспериментальных наблюдений – подбор модели для объяснения явлений – обобщение свойств – прогнозирование поведения – и затем проведение экспериментальных наблюдений. Он считает, что подбор модели может быть завершен с помощью ИИ. будущее: «Мы. Цель состоит в том, чтобы построить мультимодальную, межуровневую модель науки о жизни и, в конечном итоге, надеяться открыть новые законы и принципы в науке о жизни».
ИИ совершает революцию в исследовательской парадигме: больше не нужно зацикливаться на четкой «объясняемости» посредством обширной экспериментальной калибровки
Хотя «AI4S» все еще имеет много проблем, которые необходимо решить, в настоящее время ИИ добился успехов во многих различных областях научных исследований. контролирует форму плазмы в термоядерном устройстве Токмак, FraphCast предсказывает глобальную погоду на ближайшие десять дней и превосходит человеческую систему HRES по 90% показателей.
Кроме того, ИИ также ускоряет процесс экспериментальных исследований. Чжан Цзинь сказал, что студенту практически невозможно повторить 3 серии одного и того же эксперимента за один день, но с помощью автоматизированной платформы можно провести 150 серий автоматических экспериментов за один день, что значительно повышает повторяемость эксперимента. а качественные экспериментальные данные являются ключом к симуляционному обучению.
Цзян Цзюнь, заведующий кафедрой Университета науки и технологий Китая, рассказал об опыте своего опыта и опыта его команды в использовании платформы робота-химика Университета науки и технологий Китая для экспериментов. В своей видеопрезентации репортер Beijing News Shell Finance заметил это устройство. с всенаправленным мобильным шасси и интеллектуальным оборудованием Arm, полностью автономным экспериментальным роботом, похожим на «подвижный стол».
Цзян Цзюнь, профессор Университета науки и технологий Китая, представляет систему машинного эксперимента. Фото Ло Иданя, репортера Beijing News Shell Finance.
Цзян Цзюнь представил платформу машинного химика Китайского университета науки и технологий как «способную читать, уметь рассчитывать и усердно работать». «Благодаря системе машинного чтения возможности обработки естественного языка используются для анализа статей и патентов». , учебники, экспериментальные электронные тетради и сбор нейтральных данных на месте; физические модели/интеллектуальные прогнозы с помощью машинных вычислительных систем с помощью машинных экспериментальных систем для получения калибровки обратной связи в реальном мире».
Он сообщил, что тенденция развития «AI4S» внутри страны и за рубежом — это крупные модели + роботы + экологические альянсы. Например, британский альянс AI-Hub потратил 3,2 миллиарда юаней на строительство интеллектуальной инновационной фабрики площадью 11 000 квадратных метров, в которой работают 200 ученых и сотрудники. 100 инженеров. Он обслуживает компанию Unilever и обеспечивает 60% ее ежегодного финансирования исследований и разработок.
Многие ученые, присутствовавшие на месте происшествия, заявили, что ИИ вывел научные исследования на новый этап.
Гун Сингао, академик Китайской академии наук и профессор Фуданьского университета, рассказал, что парадигма физических исследований делится на четыре этапа: экспериментальная физика, теоретическая физика, вычислительная физика и математическая физика. В настоящее время она достигла стадии цифровой физики, используя в качестве инструментов интеллектуальный анализ данных, искусственный интеллект и машинное обучение.
С точки зрения Чжан Цзиня, присуждение Нобелевской премии областям, связанным с искусственным интеллектом, является эталоном: «Научные исследования, такие как физика и химия, станут более открытыми. коробочные предсказания должны быть приняты и постоянно калиброваться посредством экспериментов, что в конечном итоге приведет к более точному и всестороннему пониманию».