La arquitectura de red neuronal KAN ha marcado el comienzo de una importante actualización: la versión KAN 2.0. Esta actualización mejora significativamente las capacidades de aplicación de KAN en la investigación científica, especialmente en el campo de la física clásica. Los investigadores pueden personalizar los modelos KAN 2.0 e incorporar experiencia para explorar mejor los sistemas físicos, como identificar conceptos clave como el lagrangiano. Esto marca otro salto en la aplicación de la IA en la investigación científica y proporciona una nueva forma de resolver el problema de incompatibilidad inherente entre la IA y la ciencia.
La arquitectura de red neuronal KAN ha introducido su versión 2.0. Esta actualización hace que KAN esté más profundamente integrado con cuestiones científicas, especialmente en el campo de la investigación de la física clásica. Los investigadores ahora pueden personalizar su propio KAN2.0 e incorporar experiencia en el modelo para descubrir conceptos importantes como el lagrangiano en sistemas físicos.
KAN2.0 permite a los investigadores personalizar modelos según las necesidades personales, utilizando el conocimiento profesional como variable auxiliar, proporcionando una nueva perspectiva para el estudio de la física clásica.
El nuevo marco KAN2.0 está dedicado a resolver el problema de incompatibilidad inherente entre la IA y la ciencia. Unifica la IA y la ciencia a través de una sinergia bidireccional: integra el conocimiento científico en KAN y extrae conocimientos científicos de KAN.
Tres nuevas funciones de KAN2.0
MultKAN: KAN que introduce nodos de multiplicación mejora la capacidad de expresión del modelo.
kanpiler: un compilador que compila fórmulas simbólicas en KAN, mejorando la practicidad del modelo.
Convertidor de árbol: convierte la arquitectura KAN2.0 en un diagrama de árbol, mejorando la interpretabilidad del modelo.
El papel de KAN2.0 en el descubrimiento científico se refleja principalmente en tres aspectos: identificar características importantes, revelar estructuras de módulos y descubrir fórmulas simbólicas. Estas características se mejoran con respecto al KAN original.
La interpretabilidad de KAN2.0 es más general y adecuada para campos como la química y la biología que son difíciles de expresar mediante ecuaciones simbólicas. Los usuarios pueden construir estructuras modulares en KAN2.0 y ver visualmente las estructuras modulares intercambiándolas con neuronas MLP.
El equipo de investigación planea aplicar KAN2.0 a problemas de mayor escala y expandirlo a otras disciplinas científicas más allá de la física.
Esta investigación fue completada conjuntamente por cinco investigadores del MIT, el Instituto de Tecnología de California, el MIT CSAIL y otras instituciones, incluidos tres académicos chinos. Liu Ziming, el primer autor del artículo, es estudiante de doctorado de cuarto año en el MIT. Sus intereses de investigación se centran en la intersección de la inteligencia artificial y la física.
Dirección del artículo: https://arxiv.org/pdf/2408.10205
Dirección del proyecto: https://github.com/KindXiaoming/pykan
El lanzamiento de KAN 2.0 proporciona una nueva y poderosa herramienta para la investigación científica con aplicaciones prometedoras en campos interdisciplinarios. En el futuro, podemos esperar que KAN 2.0 logre avances en más campos científicos y promueva el desarrollo acelerado de descubrimientos científicos. El código fuente de este proyecto ha sido de código abierto y todos pueden contribuir.