Архитектура нейронной сети KAN подверглась серьезному обновлению — версии KAN 2.0. Это обновление значительно расширяет возможности применения KAN в научных исследованиях, особенно в области классической физики. Исследователи могут настраивать модели KAN 2.0 и использовать свой опыт для лучшего изучения физических систем, например, для определения ключевых понятий, таких как лагранжиан. Это знаменует собой еще один скачок в применении ИИ в научных исследованиях и открывает новый способ решения проблемы несовместимости между ИИ и наукой.
Выпущена версия архитектуры нейронной сети KAN 2.0. Это обновление делает KAN более глубоко интегрированным с научными проблемами, особенно в области исследований классической физики. Теперь исследователи могут настроить свой собственный KAN2.0 и включить в модель свой опыт, чтобы открыть важные концепции, такие как лагранжиан в физических системах.
KAN2.0 позволяет исследователям настраивать модели в соответствии с личными потребностями, используя профессиональные знания в качестве вспомогательной переменной, открывая новую перспективу для изучения классической физики.
Новая платформа KAN2.0 посвящена решению проблемы несовместимости искусственного интеллекта и науки. Он объединяет искусственный интеллект и науку посредством двусторонней синергии — интеграции научных знаний в KAN и извлечения научных идей из KAN.
Три новые функции KAN2.0
MultKAN: KAN, который вводит узлы умножения, расширяет возможности выражения модели.
kanpiler: компилятор, который компилирует символьные формулы в KAN, повышая практичность модели.
Преобразователь дерева: преобразует архитектуру KAN2.0 в древовидную диаграмму, улучшая интерпретируемость модели.
Роль KAN2.0 в научных открытиях в основном отражается в трех аспектах: выявление важных функций, выявление структур модулей и открытие символических формул. Эти функции улучшены по сравнению с исходным KAN.
Интерпретируемость KAN2.0 более общая и подходит для таких областей, как химия и биология, которые трудно выразить с помощью символических уравнений. Пользователи могут создавать модульные структуры в KAN2.0 и визуально видеть модульные структуры, обмениваясь ими с нейронами MLP.
Исследовательская группа планирует применить KAN2.0 для решения более масштабных задач и распространить его на другие научные дисциплины, помимо физики.
Это исследование было совместно завершено пятью исследователями из Массачусетского технологического института, Калифорнийского технологического института, MIT CSAIL и других учреждений, в том числе тремя китайскими учеными. Лю Цзымин, первый автор статьи, учится на четвертом курсе Массачусетского технологического института. Его исследовательские интересы сосредоточены на пересечении искусственного интеллекта и физики.
Адрес статьи: https://arxiv.org/pdf/2408.10205.
Адрес проекта: https://github.com/KindXiaoming/pykan.
Выпуск KAN 2.0 предоставляет новый мощный инструмент для научных исследований с многообещающими применениями в междисциплинарных областях. В будущем мы можем ожидать, что KAN 2.0 совершит прорыв в большем количестве научных областей и будет способствовать ускоренному развитию научных открытий. Исходный код этого проекта открыт, и каждый может внести свой вклад.