L'architecture de réseau neuronal KAN a inauguré une mise à niveau majeure : la version KAN 2.0. Cette mise à jour améliore considérablement les capacités d'application du KAN dans la recherche scientifique, notamment dans le domaine de la physique classique. Les chercheurs sont en mesure de personnaliser les modèles KAN 2.0 et d'intégrer leur expertise pour mieux explorer les systèmes physiques, par exemple en identifiant des concepts clés tels que le lagrangien. Cela marque une nouvelle avancée dans l’application de l’IA à la recherche scientifique et offre une nouvelle façon de résoudre le problème d’incompatibilité inhérent entre l’IA et la science.
L'architecture de réseau neuronal KAN a inauguré sa version 2.0. Cette mise à jour rend KAN plus profondément intégré aux questions scientifiques, en particulier dans le domaine de la recherche en physique classique. Les chercheurs peuvent désormais personnaliser leur propre KAN2.0 et intégrer leur expertise dans le modèle pour découvrir des concepts importants tels que le lagrangien dans les systèmes physiques.
KAN2.0 permet aux chercheurs de personnaliser les modèles en fonction de leurs besoins personnels, en utilisant les connaissances professionnelles comme variable auxiliaire, offrant ainsi une nouvelle perspective pour l'étude de la physique classique.
Le nouveau framework KAN2.0 est dédié à la résolution du problème d'incompatibilité inhérent entre l'IA et la science. Il unifie l'IA et la science grâce à une synergie bidirectionnelle : intégrer les connaissances scientifiques dans le KAN et extraire les informations scientifiques du KAN.
Trois nouvelles fonctions de KAN2.0
MultKAN : KAN qui introduit des nœuds de multiplication améliore la capacité d'expression du modèle.
kanpiler : un compilateur qui compile des formules symboliques dans KAN, améliorant ainsi la praticité du modèle.
Convertisseur d'arbre : convertit l'architecture KAN2.0 en un diagramme arborescent, améliorant ainsi l'interprétabilité du modèle.
Le rôle de KAN2.0 dans la découverte scientifique se reflète principalement sous trois aspects : identifier des caractéristiques importantes, révéler les structures des modules et découvrir des formules symboliques. Ces fonctionnalités sont améliorées par rapport au KAN original.
L'interprétabilité de KAN2.0 est plus générale et adaptée à des domaines tels que la chimie et la biologie difficiles à exprimer par des équations symboliques. Les utilisateurs peuvent créer des structures modulaires dans KAN2.0 et voir visuellement les structures modulaires en échangeant avec les neurones MLP.
L'équipe de recherche prévoit d'appliquer KAN2.0 à des problèmes à plus grande échelle et de l'étendre à d'autres disciplines scientifiques au-delà de la physique.
Cette recherche a été réalisée conjointement par cinq chercheurs du MIT, du California Institute of Technology, du MIT CSAIL et d'autres institutions, dont trois universitaires chinois. Liu Ziming, le premier auteur de l'article, est doctorant en quatrième année au MIT. Ses intérêts de recherche se concentrent sur l'intersection de l'intelligence artificielle et de la physique.
Adresse papier : https://arxiv.org/pdf/2408.10205
Adresse du projet : https://github.com/KindXiaoming/pykan
La sortie de KAN 2.0 offre un nouvel outil puissant pour la recherche scientifique avec des applications prometteuses dans des domaines interdisciplinaires. À l’avenir, nous pouvons nous attendre à ce que KAN 2.0 réalise des percées dans davantage de domaines scientifiques et favorise le développement accéléré des découvertes scientifiques. Le code source de ce projet est open source et tout le monde est invité à contribuer.