今年はノーベル物理学賞と化学賞がともにAI関連分野に授与され、「AI4S」と簡略化されたAI for Science(科学研究用AI)の概念も国内の科学者の注目を集めている。そして海外。
11月4日から6日まで、北京大学で2024年科学インテリジェンスサミットが開催され、張金氏、鞏興高氏、唐超氏ら中国科学院の学者のほか、AI科学研究の実践経験を持つ多くの専門家や学者が出席した。科学研究における AI の現在の応用、AI の限界と未解決の問題、科学のための AI が将来の科学研究パラダイムに与える可能性のある影響について共有し、議論しました。
AlphaFold の成功は、長い道のりの第一歩にすぎません。従来の AI フレームワークにはまだ限界があります。
現在のノーベル化学賞受賞者であるハサビス氏は、50年来の問題を解決し、約2億個の既知のタンパク質の複雑な構造を予測できるAlphaFold人工知能モデルの開発で受賞した。世界中の200万人以上の人々によって。中国科学院の学者であり、北京大学と清華大学の共同生命科学センター所長であるタン・チャオ氏の見解では、アルファフォールドの成功は生命科学分野での成功と同等ではなく、それは単なる「第一歩」にすぎない。何千マイルにもわたる長い行進だ。」
中国科学院院士で北京大学・清華大学共同生命科学センター所長の唐超氏が講演/北京ニュースシェルファイナンス記者の羅宜丹氏撮影
Tang Chao氏は、生命科学分野のほとんどのモデルは現在、単一細胞の転写、RNA配列、タンパク質構造などの単一モダリティに限定されていると紹介しました。しかし、生命科学は生命の本質は複雑で巨大なシステムです。科学とは、分子や細胞、器官から始まり、生命全体の多層的かつ多次元的なインタラクティブな構成に至ることです。
「生命は、マクロからミクロまで複数のスケールとレベルを持つ複雑なシステムです。各レベルには独自の言語とロジックがあり、それらは相互に影響を与えます。」と Tang Chao 氏は言います。「従来の AI フレームワークは、構造化された線形データの処理ではうまく機能しますが、生命はデータは動的でマルチビットインタラクティブであるため、高次元の非線形ライフサイエンスデータを扱う場合、従来の AI フレームワークには明らかな限界があります。」
さらに、単一モードの AI 研究であっても、優れたデータ基盤が必要となるのが現状です。現在、一部の科学研究分野では、実験データの不足や実験データの標準化が不十分であるという問題に直面しています。
Tang Chao氏は、ライフサイエンスデータシステムの構築は遅れて開始され、投資が不十分であり、完全なフルチェーンエコシステムが欠如しており、初期段階で体系的な戦略計画と共有メカニズムが欠如しているため、大きな影響力と共有メカニズムを形成することが困難であると述べた。原稿に対応したデータセットが多く、データ利用率はヨーロッパやアメリカに比べて遅れています。
中国科学院院士、党委員会常務委員、北京大学副学長の張金澤氏は、材料研究におけるAIの利用を紹介する際、現在のデータ収集プロセスは均一ではなく、データは異なる機器、環境、オペレータによって得られるデータは大きく異なります。さらに、さまざまな種類の実験によって生成されるデータには、さまざまな形式の画像、スペクトル データ、構造データなどが含まれます。
AI のモデリングとトレーニングにはビッグデータのサポートが必要です。「標準化はデータの共有、再現性、科学的知識の反復を実現するための基礎です」と Zhang Jin 氏は述べています。
中国科学院院士、党委員会常務委員、北京大学副学長の張金氏が講演する。写真提供:北京ニュースシェルファイナンスの記者、ルオ・イーダン氏。
Tang Chao氏の見解では、ライフサイエンスの大規模モデルフレームワーク研究において早急に解決する必要がある問題には、ライフサイエンスデータの特性に基づいたシーケンス、画像、行列データのエンコーダー設計の最適化、融合のためのモジュールアーキテクチャとデータの調整が含まれる。さまざまなモーダル データのセットの選択と事前トレーニング戦略。本当に「革命的変化」を起こすことができるのは、生命現象の言語論理、自己組織化、階層創発、フィードバック機構、適応性などについて、新たなモデルアーキテクチャをいかに構築するかである。
Tang Chao 氏は、生命科学における研究プロセスは、多くの場合、実験観察の実施 - 現象を説明するためのモデル フィッティング - 特性の要約 - 挙動の予測 - その後、実験観察の実施というサイクルであると紹介しました。彼は、モデル フィッティングは AI によって完了する可能性があると考えています。将来的には、「私たちの目標は、マルチモーダルでクロスレベルの生命科学モデルを構築することであり、最終的には生命科学における新しい法則と原理を発見したいと考えています。」
AI は研究パラダイムに革命をもたらします: 広範な実験的キャリブレーションを通じて、明確な「説明可能性」にこだわる必要はなくなりました
「AI4S」にはまだ解決すべき課題が多いが、現在、AIは前述のノーベル賞関連のAlphaFold以外にも、DeepMindのAI技術など、さまざまな科学研究分野で成果をあげている。核融合トクマク装置内のプラズマの形状を制御する FraphCast は、今後 10 日間の世界の天気を予測し、指標の 90% において人間のシステム HRES を上回ります。
さらに、AI は実験研究のプロセスも加速します。 Zhang Jin氏は、学生が1日に同じ実験を3セット繰り返すことは基本的に不可能であるが、自動化されたプラットフォームを通じて1日に150セットの自動実験を行うことができ、実験の再現性が大幅に向上すると述べた。高品質の実験データがシミュレーション トレーニングの基礎となります。
中国科学技術大学の首席教授であるJiang Jun氏は、中国科学技術大学のロボット化学プラットフォームを実験に使用した自身と彼のチームの経験を紹介し、彼のビデオプレゼンテーションを通じて、北京ニュースシェルファイナンスの記者はこの装置に気づきました。全方位移動シャーシと知能アームを搭載した「動くテーブル」のような完全自律型実験操作ロボット。
機械実験システムを紹介する中国科学技術大学の蒋軍主席教授、写真提供:北京ニュースシェルファイナンスの記者、羅宜丹氏
Jiang Jun 氏は、中国科学技術大学の機械化学プラットフォームを「読み書きができ、計算ができ、勤勉に働くことができる」と紹介し、「機械読み取りシステムを通じて、自然言語処理機能が論文や特許の分析に使用されます。」 、教科書、実験用電子ノートを使用し、現場で中立データを収集します。機械コンピューティング システムを介した物理モデル/インテリジェント予測を行い、実世界のフィードバック校正を取得します。」
同氏は、国内外の「AI4S」の開発トレンドは大型モデル+ロボット+エコロジーアライアンスであると紹介し、例えば英国のAIハブ同盟は32億元を投じて1万1000平方メートル、200人の科学者と技術者を擁するインテリジェントイノベーション工場を建設したと紹介した。 100 人のエンジニアがユニリーバにサービスを提供しており、年間研究開発資金の 60% を占めています。
現場にいた多くの科学者は、AIが科学研究を新たな段階に押し上げたと語った。
中国科学院院士で復丹大学教授の龐興高氏は、物理学研究のパラダイムは実験物理学、理論物理学、計算物理学、数理物理学の4段階に分かれていると述べた。現在では、データマイニング、人工知能、機械学習をツールとしたデジタル物理学の段階に達しています。
張金氏の観点から見ると、AI関連分野へのノーベル賞授与はベンチマークだ。「物理学や化学などの厳密さの科学的追求は、よりオープンなものになるだろう。私たちはもはや明確な『解釈可能性』に執着することはないが、黒を許容する――」ボックス予測は受け入れられ、実験を通じて継続的に調整され、最終的にはより正確で包括的な理解につながります。」