Стэнфордский университет открыл исходный код своей недавно разработанной системы написания искусственных материалов STORM&Co-STORM. Эта система может интегрировать информацию из нескольких источников для создания высококачественных длинных статей на основе простого ввода темы, что значительно повышает эффективность написания научных исследований. STORM использует многосторонние вопросы и ответы «экспертов LLM» и «модераторов LLM» для итеративного создания статей, в то время как Co-STORM создает динамические интеллект-карты посредством многоагентного диалога для обеспечения исчерпывающей информации. Система позволяет пользователям свободно выбирать режимы и генерировать структурированные длинные статьи в течение 3 минут, а также предоставляет функцию просмотра процесса мозгового штурма и примеров статей.
Основная технология системы STORM&Co-STORM включает поддержку поиска Bing и GPT-4o mini. Процесс автоматического написания разделен на три этапа: создание многоаспектных вопросов, создание и улучшение структуры и создание полного текста. Хотя система объединяет информацию из нескольких источников, эти источники информации могут быть ориентированы на основную информацию и могут содержать рекламный контент. Цель Co-STORM — решить проблему пропуска информации и повысить эффективность обучения. Пользовательское тестирование показывает, что это значительно снижает когнитивную нагрузку. В настоящее время система поддерживает только английский язык и в будущем будет расширена на несколько языков. Система STORM&Co-STORM с открытым исходным кодом открывает новые возможности для персонализированного обучения, делая получение знаний более удобным и эффективным.
Пользователям нужно только вводить тематические слова на английском языке, и система может генерировать высококачественные длинные статьи, объединяющие информацию из нескольких источников, подобно статьям в Википедии. Чтобы испытать систему STORM, пользователи могут свободно выбирать между режимами STORM и Co-STORM. По заданной теме STORM может сформировать структурированную качественную длинную статью за 3 минуты.
Кроме того, пользователи также могут просмотреть процесс мозгового штурма для различных ролей LLM, нажав «Просмотреть процесс мозгового штурма». В столбце «Обнаружение» пользователи могут ссылаться на статьи и примеры чатов, созданные другими учеными, а лично созданные статьи и записи чатов также можно найти на боковой панели «Моя библиотека».
Автоматизированный процесс написания в системе STORM разделен на три основных этапа: создание многоаспектных вопросов, создание и улучшение плана и создание полного текста. Система просматривает соответствующие статьи Википедии, чтобы выявить различные точки зрения на данную тему, а затем моделирует разговор между автором Википедии и экспертом на основе надежных онлайн-источников. Основываясь на знаниях, присущих LLM, содержание диалогов, собранное с разных точек зрения, наконец, тщательно компилируется в письменный план.
Хотя STORM раскрывает различные точки зрения при исследовании определенной темы, собранная информация все равно может опираться на основные источники в Интернете и может содержать рекламный контент. Еще одним ограничением исследования является то, что, хотя исследователи сосредоточились на создании статей, подобных Википедии, с нуля, они рассматривали только возможность создания свободно организованного текста. Высококачественные статьи Википедии, написанные людьми, обычно содержат структурированные данные и мультимодальную информацию.
Целью Co-STORM является решение проблемы упущения информации при сборе и интеграции информации, что значительно повышает эффективность обучения. Он помогает пользователям понимать и участвовать в организации информации посредством многоагентного совместного диалога, динамического отображения связей и модулей создания отчетов. Исследователи провели оценку 20 добровольцев, сравнив эффективность Co-STORM с традиционными поисковыми системами и чат-ботом RAG. Результаты показывают, что Co-STORM значительно повышает глубину и широту информации, а 70% пользователей предпочитают Co-STORM, считая, что он значительно снижает когнитивную нагрузку.
В настоящее время система STORM&Co-STORM поддерживает только взаимодействие на английском языке и в будущем может быть расширена до возможностей многоязычного взаимодействия. Открытый исходный код этой системы является признаком того, что мы живем в необычайную эпоху, когда доступ к информации может быть полностью адаптирован к индивидуальному уровню, что позволяет учиться чему угодно.
Адрес статьи: https://www.arxiv.org/pdf/2408.15232.
В целом, открытый исходный код системы STORM&Co-STORM принес новые прорывы в области письма с помощью искусственного интеллекта, и ее эффективные и удобные функции заслуживают внимания. В будущем, с внедрением многоязычной поддержки и дальнейшим улучшением функций, эта система будет играть большую роль в академических исследованиях и ежедневной письменной речи.