Cette année, les prix Nobel de physique et de chimie ont tous deux été décernés à des domaines liés à l'IA. Le concept d'IA pour la science (IA pour la recherche scientifique), simplifié sous le nom de « AI4S », a également attiré l'attention des scientifiques nationaux. et à l'étranger.
Du 4 au 6 novembre, le Sommet sur l'intelligence scientifique 2024 s'est tenu à l'Université de Pékin. Zhang Jin, Gong Xingao, Tang Chao et d'autres académiciens de l'Académie chinoise des sciences, ainsi que de nombreux experts et universitaires ayant une expérience pratique dans la recherche scientifique sur l'IA. a partagé et discuté de l'application actuelle de l'IA dans la recherche scientifique, des applications spécifiques de l'IA dans le domaine de la recherche scientifique, des limites et des problèmes non résolus de l'IA, ainsi que de l'impact que l'IA pour la science pourrait avoir sur le paradigme de la recherche scientifique à l'avenir.
Le succès d’AlphaFold n’est que la première étape d’un long voyage. Les frameworks d’IA traditionnels ont encore des limites.
Hassabis, l'actuel lauréat du prix Nobel de chimie, a remporté le prix pour son développement du modèle d'intelligence artificielle AlphaFold, qui a résolu un problème vieux de 50 ans et peut prédire les structures complexes d'environ 200 millions de protéines connues, et a été utilisé. par plus de 2 millions de personnes dans le monde. Selon Tang Chao, académicien de l'Académie chinoise des sciences et directeur du Centre commun des sciences de la vie de l'Université de Pékin et de l'Université Tsinghua, le succès d'AlphaFold n'est pas égal au succès dans le domaine des sciences de la vie. Il ne s'agit que de la « première étape ». une longue marche de milliers de kilomètres.
Tang Chao, académicien de l'Académie chinoise des sciences et directeur du Centre commun des sciences de la vie de l'Université de Pékin et de l'Université Tsinghua, prononce un discours/photographié par Luo Yidan, journaliste de Beijing News Shell Finance
Tang Chao a introduit que la plupart des modèles dans le domaine des sciences de la vie sont actuellement limités à une seule modalité, telle que la transcription unicellulaire, la séquence d'ARN, la structure des protéines, etc. Cependant, les sciences de la vie sont un système complexe et immense. la science doit commencer par les molécules et les cellules, les organes jusqu'à la composition interactive à plusieurs niveaux et multidimensionnelle de la vie globale.
« La vie est un système complexe avec plusieurs échelles et niveaux, du macro au micro. Chaque niveau a son propre langage et sa propre logique, qui s'influencent mutuellement. » Tang Chao a déclaré : « Les cadres d'IA traditionnels fonctionnent bien dans le traitement des données structurées et linéaires, mais la vie est systèmes Les données sont dynamiques et interactives sur plusieurs bits, de sorte que le cadre d'IA traditionnel présente des limites évidentes lorsqu'il s'agit de données de haute dimension et non linéaires des sciences de la vie.
De plus, même la recherche monomodale sur l’IA nécessite une bonne base de données. Actuellement, certains domaines de recherche scientifique sont confrontés à des problèmes de données expérimentales insuffisantes et de standardisation insuffisante des données expérimentales.
Tang Chao a déclaré que la construction de systèmes de données sur les sciences de la vie a commencé tardivement, avec des investissements insuffisants, l'absence d'un écosystème complet et l'absence de mécanismes systématiques de planification stratégique et de partage au début. des ensembles de données prêts à être manuscrits, et le taux d’utilisation des données est à la traîne en Europe et en Amérique.
Zhang Jinze, académicien de l'Académie chinoise des sciences, membre du Comité permanent du Comité du Parti et vice-président de l'Université de Pékin, a mentionné lors de l'introduction de l'utilisation de l'IA pour la recherche sur les matériaux que le processus actuel de collecte de données n'est pas uniforme et que les données obtenus par différents équipements, environnements et opérateurs sont très différents. De plus, les données générées par différents types d'expériences comprennent des images, des données spectrales, des données structurelles, etc., dans différents formats.
La modélisation et la formation de l'IA nécessitent le soutien du Big Data, a déclaré Zhang Jin : « La normalisation est la base pour réaliser le partage des données, la reproductibilité et l'itération des connaissances scientifiques. »
Zhang Jin, académicien de l'Académie chinoise des sciences, membre du Comité permanent du Comité du Parti et vice-président de l'Université de Pékin, prononce un discours. Photo de Luo Yidan, journaliste de Beijing News Shell Finance.
Selon Tang Chao, les problèmes qui doivent être résolus de toute urgence dans la recherche sur le cadre de grands modèles des sciences de la vie comprennent : l'optimisation de la conception de l'encodeur des données de séquence, d'image et matricielles en fonction des caractéristiques des données des sciences de la vie, l'ajustement de l'architecture des modules et des données pour la fusion ; de différentes données modales Sélection d'ensembles et stratégies de pré-formation. Ce qui peut réellement provoquer des « changements révolutionnaires », c'est comment construire une nouvelle architecture de modèle pour la logique du langage, l'auto-organisation, l'émergence hiérarchique, le mécanisme de rétroaction, l'adaptabilité, etc. des phénomènes de la vie.
Tang Chao a expliqué que le processus de recherche en sciences de la vie est souvent un cycle consistant à : effectuer des observations expérimentales - ajuster un modèle pour expliquer des phénomènes - résumer des propriétés - prédire des comportements - puis effectuer des observations expérimentales. Il pense que l'ajustement du modèle peut être complété par l'IA dans le domaine. l'avenir, "Nous avons pour objectif de construire un modèle multimodal et inter-niveaux des sciences de la vie et, à terme, espérons découvrir de nouvelles lois et principes dans les sciences de la vie."
L’IA révolutionne le paradigme de la recherche : elle n’est plus obsédée par une « explicabilité » claire grâce à un étalonnage expérimental approfondi
Bien que "AI4S" ait encore de nombreux problèmes à résoudre, l'IA a actuellement réalisé des progrès dans de nombreux domaines de recherche scientifique. En plus de l'AlphaFold lié au prix Nobel mentionné ci-dessus, des applications spécifiques incluent également des applications telles que la technologie DeepMind AI. contrôle la forme du plasma dans le dispositif à fusion nucléaire-Tokmak, FraphCast prédit la météo mondiale dans les dix prochains jours et surpasse le système humain HRES dans 90 % des indicateurs.
En outre, l’IA accélère également le processus de recherche expérimentale. Zhang Jin a déclaré qu'il est fondamentalement impossible pour un étudiant de répéter 3 séries de la même expérience en une journée, mais grâce à la plate-forme automatisée, 150 séries d'expériences automatisées peuvent être réalisées en une journée, ce qui améliore considérablement la répétabilité de l'expérience. et des données expérimentales de haute qualité sont la clé de la formation par simulation.
Jiang Jun, professeur titulaire à l'Université des sciences et technologies de Chine, a présenté son expérience et celle de son équipe en utilisant la plate-forme de chimie robotique de l'Université des sciences et technologies de Chine pour des expériences. À travers sa présentation vidéo, le journaliste de Beijing News Shell Finance a remarqué cet appareil. avec un châssis mobile omnidirectionnel et une machinerie intelligente, Arm, un robot opérationnel expérimental entièrement autonome qui ressemble à une « table mobile ».
Jiang Jun, professeur titulaire à l'Université des sciences et technologies de Chine, présente le système d'expérimentation machine. Photo de Luo Yidan, journaliste de Beijing News Shell Finance.
Jiang Jun a présenté la plate-forme de chimiste automatique de l'Université des sciences et technologies de Chine comme étant « capable de lire, de calculer et de travailler avec diligence ». « Grâce au système de lecture automatique, les capacités de traitement du langage naturel sont utilisées pour analyser les articles et les brevets. , manuels, cahiers électroniques expérimentaux et collecte de données neutres sur site ; modèles physiques/prédictions intelligentes via des systèmes informatiques automatisés ; expériences via des systèmes expérimentaux de machines pour obtenir un étalonnage de rétroaction dans le monde réel. »
Il a expliqué que la tendance de développement de « AI4S » au pays et à l'étranger est celle des grands modèles + robots + alliances écologiques. Par exemple, l'Alliance britannique AI-Hub a dépensé 3,2 milliards de yuans pour construire une usine d'innovation intelligente de 11 000 mètres carrés, 200 scientifiques et. 100 ingénieurs. Il dessert Unilever et représente 60 % de son financement annuel en R&D.
De nombreux scientifiques présents sur place ont déclaré que l’IA avait fait entrer la recherche scientifique dans une nouvelle étape.
Gong Xingao, académicien de l'Académie chinoise des sciences et professeur à l'Université de Fudan, a déclaré que le paradigme de la recherche en physique est divisé en quatre étapes : physique expérimentale, physique théorique, physique computationnelle et physique mathématique. À l’heure actuelle, elle a atteint le stade de la physique numérique utilisant l’exploration de données, l’intelligence artificielle et l’apprentissage automatique comme outils.
Du point de vue de Zhang Jin, l'attribution du prix Nobel à des domaines liés à l'IA est une référence : « Les recherches scientifiques rigoureuses telles que la physique et la chimie deviendront plus ouvertes. les prédictions des boîtes doivent être acceptées et continuellement calibrées par le biais d’expériences, conduisant finalement à une compréhension plus précise et plus complète.