Este año, los Premios Nobel de Física y Química se otorgaron a campos relacionados con la IA. El concepto de IA para la ciencia (IA para la investigación científica), que se ha simplificado como "AI4S", también ha atraído la atención de los científicos nacionales. y en el extranjero.
Del 4 al 6 de noviembre se celebró en la Universidad de Pekín la Cumbre de Inteligencia Científica 2024, Zhang Jin, Gong Xingao, Tang Chao y otros académicos de la Academia de Ciencias de China, así como muchos expertos y académicos con experiencia práctica en la investigación científica de la IA. compartió y discutió la aplicación actual de la IA en la investigación científica. Las aplicaciones específicas de la IA en el campo de la investigación científica, las limitaciones y los problemas no resueltos de la IA y el impacto que la IA para la ciencia puede tener en el paradigma de la investigación científica en el futuro.
El éxito de AlphaFold es sólo el primer paso de un largo viaje. Los marcos tradicionales de IA todavía tienen limitaciones.
Hassabis, actual premio Nobel de Química, ganó el premio por su desarrollo del modelo de inteligencia artificial AlphaFold, que resolvió un problema de 50 años y puede predecir las estructuras complejas de aproximadamente 200 millones de proteínas conocidas, y ha sido utilizado. por más de 2 millones de personas en todo el mundo. En opinión de Tang Chao, académico de la Academia de Ciencias de China y director del Centro Conjunto de Ciencias de la Vida de la Universidad de Pekín y la Universidad de Tsinghua, el éxito de AlphaFold no equivale al éxito en el campo de las ciencias de la vida. Es sólo el “primer paso hacia el éxito”. una larga marcha de miles de kilómetros”.
Tang Chao, académico de la Academia de Ciencias de China y director del Centro Conjunto de Ciencias de la Vida de la Universidad de Pekín y la Universidad de Tsinghua, pronuncia un discurso/fotografiado por Luo Yidan, reportero de Beijing News Shell Finance
Tang Chao presentó que la mayoría de los modelos en el campo de las ciencias de la vida se limitan actualmente a una sola modalidad, como la transcripción unicelular, la secuencia de ARN, la estructura de las proteínas, etc. Sin embargo, las ciencias de la vida son un sistema enorme y complejo. La ciencia debe comenzar desde moléculas y células, órganos hasta la composición interactiva multinivel y multidimensional de la vida en general.
"La vida es un sistema complejo con múltiples escalas y niveles, desde macro a micro. Cada nivel tiene su propio lenguaje y lógica, que se influyen entre sí", dijo Tang Chao: "Los marcos de IA tradicionales funcionan bien en el procesamiento de datos estructurados y lineales, pero la vida "Los datos son dinámicos e interactivos de varios bits, por lo que el marco tradicional de IA muestra limitaciones obvias cuando se trata de datos de ciencias biológicas no lineales y de alta dimensión".
Además, incluso la investigación de IA monomodal requiere una buena base de datos. Actualmente, algunos campos de investigación científica enfrentan problemas de datos experimentales insuficientes y de estandarización insuficiente de los datos experimentales.
Tang Chao dijo que la construcción de sistemas de datos de ciencias biológicas comenzó tarde, con inversión insuficiente, falta de un ecosistema completo de cadena completa y falta de planificación estratégica sistemática y mecanismos de intercambio en la etapa inicial. conjuntos de datos listos para manuscritos, y la tasa de utilización de datos va a la zaga en Europa y América.
Zhang Jinze, académico de la Academia de Ciencias de China, miembro del Comité Permanente del Comité del Partido y vicepresidente de la Universidad de Pekín, mencionó al presentar el uso de la IA para la investigación de materiales que el proceso actual de recopilación de datos no es uniforme y los datos obtenidos por diferentes equipos, entornos y operadores son muy diferentes. Además, los datos generados por diferentes tipos de experimentos incluyen imágenes, datos espectrales, datos estructurales, etc., en diferentes formatos.
El modelado y el entrenamiento de la IA requieren el apoyo de big data, dijo Zhang Jin: "La estandarización es la base para lograr el intercambio de datos, la reproducibilidad y la iteración del conocimiento científico".
Zhang Jin, académico de la Academia de Ciencias de China, miembro del Comité Permanente del Comité del Partido y vicepresidente de la Universidad de Pekín, pronuncia un discurso. Foto de Luo Yidan, reportero de Beijing News Shell Finance.
En opinión de Tang Chao, los problemas que deben resolverse con urgencia en la investigación del marco de modelos grandes de ciencias biológicas incluyen: optimizar el diseño del codificador de datos de secuencia, imagen y matriz en función de las características de los datos de ciencias biológicas y ajustar la arquitectura del módulo y los datos para la fusión; de diferentes datos modales Selección de conjuntos y estrategias de preentrenamiento. Lo que realmente puede causar "cambios revolucionarios" es cómo construir una nueva arquitectura modelo para la lógica del lenguaje, la autoorganización, el surgimiento jerárquico, el mecanismo de retroalimentación, la adaptabilidad, etc. de los fenómenos de la vida.
Tang Chao introdujo que el proceso de investigación en ciencias de la vida es a menudo un ciclo de: realizar observaciones experimentales - ajuste de modelos para explicar fenómenos - resumir propiedades - predecir comportamientos - y luego realizar observaciones experimentales. Él cree que el ajuste de modelos se puede completar a través de la IA en el. futuro, "Nuestro objetivo es construir un modelo de ciencias biológicas multimodal y de niveles cruzados y, en última instancia, esperamos descubrir nuevas leyes y principios en las ciencias biológicas".
La IA revoluciona el paradigma de la investigación: ya no está obsesionada con una “explicabilidad” clara a través de una extensa calibración experimental
Aunque "AI4S" todavía tiene muchos problemas que deben resolverse, actualmente la IA ha logrado logros en muchos campos de investigación científica diferentes, además del AlphaFold relacionado con el Premio Nobel mencionado anteriormente, y las aplicaciones específicas también incluyen aplicaciones como la tecnología de IA DeepMind. controla la forma del plasma en el dispositivo de fusión nuclear Tokmak, FraphCast predice el tiempo global en los próximos diez días y supera al sistema humano HRES en un 90% de los indicadores.
Además, la IA también acelera el proceso de investigación experimental. Zhang Jin dijo que es básicamente imposible que un estudiante repita 3 series del mismo experimento en un día, pero a través de la plataforma automatizada, se pueden realizar 150 series de experimentos automatizados en un día, lo que mejora enormemente la repetibilidad del experimento. y los datos experimentales de alta calidad son la clave del entrenamiento de simulación.
Jiang Jun, profesor titular de la Universidad de Ciencia y Tecnología de China, presentó su experiencia y la de su equipo utilizando la plataforma química robótica de la Universidad de Ciencia y Tecnología de China para experimentos. A través de su presentación en video, el reportero de Beijing News Shell Finance notó este dispositivo. con un chasis móvil omnidireccional y maquinaria inteligente. Arm, un robot de operación experimental totalmente autónomo que parece una "mesa móvil".
Jiang Jun, profesor titular de la Universidad de Ciencia y Tecnología de China, presenta el sistema de experimentos con máquinas. Foto de Luo Yidan, reportero de Beijing News Shell Finance.
Jiang Jun presentó la plataforma química automática de la Universidad de Ciencia y Tecnología de China como "capaz de leer, calcular y trabajar con diligencia". A través del sistema de lectura automática, se utilizan capacidades de procesamiento del lenguaje natural para analizar artículos y patentes. "
Presentó que la tendencia de desarrollo de "AI4S" en el país y en el extranjero es modelos grandes + robots + alianzas ecológicas. Por ejemplo, la Alianza Británica AI-Hub gastó 3.200 millones de yuanes para construir una fábrica de innovación inteligente con 11.000 metros cuadrados, 200 científicos y. 100 ingenieros presta servicios a Unilever y representa el 60% de su financiación anual en I+D.
Muchos científicos en el lugar dijeron que la IA ha llevado la investigación científica a una nueva etapa.
Gong Xingao, académico de la Academia de Ciencias de China y profesor de la Universidad de Fudan, afirmó que el paradigma de la investigación en física se divide en cuatro etapas: física experimental, física teórica, física computacional y física matemática. En la actualidad, ha llegado a la etapa de la física digital utilizando como herramientas la minería de datos, la inteligencia artificial y el aprendizaje automático.
Desde la perspectiva de Zhang Jin, la concesión del Premio Nobel a los campos relacionados con la IA es un punto de referencia: "Las actividades científicas de rigor como la física y la química se volverán más abiertas. Ya no estamos obsesionados con una 'interpretabilidad' clara, sino con permitir que los negros- Las predicciones de las cajas deben ser aceptadas y calibradas continuamente a través de experimentos, lo que en última instancia conduce a una comprensión más precisa y completa”.