Este ano, o Prêmio Nobel de Física e Química foi concedido a áreas relacionadas à IA. O conceito de IA para a Ciência (IA para pesquisa científica), que foi simplificado como "AI4S", também atraiu a atenção dos cientistas em casa. e no exterior.
De 4 a 6 de novembro, a Cúpula de Inteligência Científica de 2024 foi realizada na Universidade de Pequim, Zhang Jin, Gong Xingao, Tang Chao e outros acadêmicos da Academia Chinesa de Ciências, bem como muitos especialistas e acadêmicos com experiência prática em pesquisa científica em IA. partilhou e discutiu a aplicação atual da IA na investigação científica, as aplicações específicas da IA no campo da investigação científica, as limitações e os problemas não resolvidos da IA, e o impacto que a IA para a Ciência pode ter no paradigma da investigação científica no futuro.
O sucesso do AlphaFold é apenas o primeiro passo de uma longa jornada. As estruturas tradicionais de IA ainda têm limitações.
Hassabis, atual ganhador do Prêmio Nobel de Química, ganhou o prêmio por desenvolver o modelo de inteligência artificial AlphaFold, que resolveu um problema de 50 anos e pode prever as estruturas complexas de aproximadamente 200 milhões de proteínas conhecidas, e foi usado. por mais de 2 milhões de pessoas em todo o mundo. Na opinião de Tang Chao, acadêmico da Academia Chinesa de Ciências e diretor do Centro Conjunto de Ciências da Vida da Universidade de Pequim e da Universidade de Tsinghua, o sucesso do AlphaFold não é igual ao sucesso no campo das ciências da vida. uma longa marcha de milhares de quilômetros.”
Tang Chao, acadêmico da Academia Chinesa de Ciências e diretor do Centro Conjunto de Ciências da Vida da Universidade de Pequim e da Universidade de Tsinghua, está fazendo um discurso/fotografado por Luo Yidan, repórter do Beijing News Shell Finance
Tang Chao introduziu que a maioria dos modelos no campo das ciências da vida estão atualmente limitados a uma única modalidade, como transcrição unicelular, sequência de RNA, estrutura de proteínas, etc. a ciência é começar com moléculas e células, órgãos, até a composição interativa multinível e multidimensional da vida em geral.
"A vida é um sistema complexo com múltiplas escalas e níveis, do macro ao micro. Cada nível tem sua própria linguagem e lógica, que se influenciam mutuamente", disse Tang Chao: "As estruturas tradicionais de IA têm um bom desempenho no processamento de dados estruturados e lineares, mas a vida." sistemas Os dados são dinâmicos e interativos em vários bits, de modo que a estrutura tradicional de IA mostra limitações óbvias ao lidar com dados de ciências da vida não lineares e de alta dimensão.”
Além disso, mesmo a investigação monomodal em IA requer uma boa base de dados. Atualmente, alguns campos de investigação científica enfrentam problemas de dados experimentais insuficientes e de padronização insuficiente dos dados experimentais.
Tang Chao disse que a construção de sistemas de dados de ciências da vida começou tarde, com investimento insuficiente, falta de um ecossistema completo de cadeia completa e falta de planejamento estratégico sistemático e mecanismos de compartilhamento na fase inicial. conjuntos de dados prontos para manuscritos e a taxa de utilização de dados fica para trás na Europa e na América.
Zhang Jinze, acadêmico da Academia Chinesa de Ciências, membro do Comitê Permanente do Comitê do Partido e vice-presidente da Universidade de Pequim, mencionou ao introduzir o uso de IA para pesquisa de materiais que o atual processo de coleta de dados não é uniforme, e os dados obtidos por diferentes equipamentos, ambientes e operadores são muito diferentes. Além disso, os dados gerados por diferentes tipos de experimentos incluem imagens, dados espectrais, dados estruturais, etc., em diferentes formatos.
A modelagem e o treinamento de IA exigem o apoio de big data. Zhang Jin disse: "A padronização é a base para realizar o compartilhamento de dados, a reprodutibilidade e a iteração do conhecimento científico".
Zhang Jin, acadêmico da Academia Chinesa de Ciências, membro do Comitê Permanente do Comitê do Partido e vice-presidente da Universidade de Pequim, faz um discurso Foto de Luo Yidan, repórter do Beijing News Shell Finance.
Na opinião de Tang Chao, as questões que precisam ser resolvidas urgentemente na pesquisa de estruturas de grandes modelos de ciências biológicas incluem: otimizar o projeto do codificador de dados de sequência, imagem e matriz com base nas características dos dados de ciências biológicas, ajustando a arquitetura do módulo e os dados para a fusão; de diferentes dados modais Conjunto de seleção e estratégias de pré-treinamento. O que pode realmente causar "mudanças revolucionárias" é como construir um novo modelo de arquitetura para a lógica da linguagem, auto-organização, emergência hierárquica, mecanismo de feedback, adaptabilidade, etc. dos fenômenos da vida.
Tang Chao introduziu que o processo de pesquisa em ciências da vida é muitas vezes um ciclo de: condução de observações experimentais - ajuste de modelo para explicar fenômenos - resumo de propriedades - previsão de comportamentos - e então condução de observações experimentais. Ele acredita que o ajuste de modelo pode ser concluído por meio de IA no. futuro, "Nós O objetivo é construir um modelo de ciências da vida multimodal e de vários níveis e, em última análise, esperamos descobrir novas leis e princípios nas ciências da vida."
A IA revoluciona o paradigma da pesquisa: não está mais obcecada com a “explicabilidade” clara por meio de extensa calibração experimental
Embora o "AI4S" ainda tenha muitos problemas que precisam ser resolvidos, atualmente a IA obteve conquistas em diversos campos de pesquisa científica. Além do AlphaFold relacionado ao Prêmio Nobel mencionado acima, aplicações específicas também incluem aplicações como a tecnologia DeepMind AI. controla a forma do plasma no dispositivo de fusão nuclear-Tokmak, o FraphCast prevê o clima global nos próximos dez dias e supera o HRES do sistema humano em 90% dos indicadores.
Além disso, a IA também acelera o processo de pesquisa experimental. Zhang Jin disse que é basicamente impossível para um aluno repetir 3 séries do mesmo experimento em um dia, mas por meio da plataforma automatizada, 150 conjuntos de experimentos automatizados podem ser feitos em um dia, o que melhora muito a repetibilidade do experimento, e dados experimentais de alta qualidade são a chave para o treinamento de simulação.
Jiang Jun, professor titular da Universidade de Ciência e Tecnologia da China, apresentou a experiência dele e de sua equipe usando a plataforma química robótica da Universidade de Ciência e Tecnologia da China para experimentos. Por meio de sua apresentação em vídeo, o repórter do Beijing News Shell Finance notou este dispositivo. com chassi móvel omnidirecional e maquinário inteligente Arm, um robô de operação experimental totalmente autônomo que se parece com uma “mesa móvel”.
Jiang Jun, professor titular da Universidade de Ciência e Tecnologia da China, apresenta o sistema experimental de máquina Foto de Luo Yidan, repórter do Beijing News Shell Finance.
Jiang Jun apresentou a plataforma química de máquinas da Universidade de Ciência e Tecnologia da China como "capaz de ler, calcular e trabalhar diligentemente". "Por meio do sistema de leitura de máquinas, os recursos de processamento de linguagem natural são usados para analisar documentos e patentes". , livros didáticos, cadernos eletrônicos experimentais e coleta de dados neutros no local; modelos físicos/previsões inteligentes por meio de experimentos de máquinas por meio de sistemas experimentais de máquinas para obter calibração de feedback do mundo real.
Ele apresentou que a tendência de desenvolvimento de "AI4S" no país e no exterior são grandes modelos + robôs + alianças ecológicas. Por exemplo, a Aliança Britânica AI-Hub gastou 3,2 bilhões de yuans para construir uma fábrica de inovação inteligente com 11.000 metros quadrados, 200 cientistas e. 100 engenheiros Atende a Unilever e é responsável por 60% de seu financiamento anual em P&D.
Muitos cientistas presentes disseram que a IA trouxe a pesquisa científica para um novo estágio.
Gong Xingao, acadêmico da Academia Chinesa de Ciências e professor da Universidade Fudan, disse que o paradigma da pesquisa em física é dividido em quatro etapas: física experimental, física teórica, física computacional e física matemática. Atualmente, atingiu o estágio da física digital usando mineração de dados, inteligência artificial e aprendizado de máquina como ferramentas.
Na perspectiva de Zhang Jin, a atribuição do Prémio Nobel a campos relacionados com a IA é uma referência: "As actividades científicas de rigor, como a física e a química, tornar-se-ão mais abertas. Não estamos mais obcecados com uma 'interpretabilidade' clara, mas sim em permitir que o preto- previsões de caixa sejam aceitas e continuamente calibradas por meio de experimentos, levando, em última análise, a uma compreensão mais precisa e abrangente.”