La Universidad de Stanford ha abierto su nuevo sistema de escritura de inteligencia artificial STORM&Co-STORM. Este sistema puede integrar información de múltiples fuentes para generar artículos extensos de alta calidad basados en entradas de temas simples, lo que mejora en gran medida la eficiencia de la redacción de investigaciones científicas. STORM utiliza preguntas y respuestas desde múltiples ángulos por parte de "expertos en LLM" y "moderadores de LLM" para generar artículos de forma iterativa, mientras que Co-STORM genera mapas mentales dinámicos a través del diálogo entre múltiples agentes para garantizar información completa. El sistema permite a los usuarios seleccionar libremente modos y generar artículos largos estructurados en 3 minutos, y proporciona la función de ver el proceso de lluvia de ideas y ejemplos de artículos.
La tecnología central del sistema STORM&Co-STORM incluye soporte para búsqueda de Bing y GPT-4o mini. Su proceso de escritura automatizado se divide en tres etapas: generación de preguntas con múltiples perspectivas, generación y mejora de esquemas y generación de texto completo. Aunque el sistema integra información de múltiples fuentes, las fuentes de información pueden estar sesgadas hacia la corriente principal y pueden contener contenido promocional. Co-STORM tiene como objetivo resolver el problema de la omisión de información y mejorar la eficiencia del aprendizaje. Las pruebas de los usuarios muestran que reduce significativamente la carga cognitiva. Actualmente el sistema sólo admite inglés y se ampliará a varios idiomas en el futuro. El sistema de código abierto STORM&Co-STORM ofrece nuevas posibilidades para el aprendizaje personalizado, haciendo que la adquisición de conocimientos sea más cómoda y eficiente.
Los usuarios sólo necesitan ingresar palabras de asunto en inglés y el sistema puede generar artículos largos de alta calidad que integran información de múltiples fuentes, similar a los artículos de Wikipedia. Para experimentar el sistema STORM, los usuarios pueden elegir libremente entre los modos STORM y Co-STORM. Después de un tema determinado, STORM puede formar un artículo extenso estructurado y de alta calidad en 3 minutos.
Además, los usuarios también pueden ver el proceso de lluvia de ideas de diferentes roles de LLM haciendo clic en "Ver proceso de lluvia de ideas". En la columna "Descubrir", los usuarios pueden consultar artículos y ejemplos de chat generados por otros académicos, y los artículos y registros de chat generados personalmente también se pueden encontrar en la barra lateral "Mi biblioteca".
El proceso de escritura automatizado del sistema STORM se divide en tres etapas principales: generación de preguntas con múltiples perspectivas, generación y mejora de esquemas y generación de texto completo. El sistema consulta artículos relevantes de Wikipedia para identificar varias perspectivas que cubren el tema y luego simula una conversación entre un escritor de Wikipedia y un experto basándose en fuentes confiables en línea. Con base en el conocimiento inherente de LLM, el contenido del diálogo recopilado desde diferentes perspectivas finalmente se compila cuidadosamente en un esquema escrito.
Aunque STORM descubre diversas perspectivas al investigar un tema determinado, la información recopilada aún puede inclinarse hacia fuentes principales en Internet y puede contener contenido promocional. Otra limitación del estudio es que aunque los investigadores se centraron en generar artículos similares a Wikipedia desde cero, solo consideraron generar texto organizado libremente. Los artículos de Wikipedia de alta calidad escritos por humanos suelen contener datos estructurados e información multimodal.
Co-STORM tiene como objetivo mejorar el problema de la omisión de información en la recopilación e integración de información para promover en gran medida la eficiencia del aprendizaje. Ayuda a los usuarios a comprender y participar en la organización de la información a través de un diálogo colaborativo entre múltiples agentes, mapas mentales dinámicos y módulos de generación de informes. Los investigadores realizaron evaluaciones humanas en 20 voluntarios, comparando el desempeño de Co-STORM con los motores de búsqueda tradicionales y RAG Chatbot. Los resultados muestran que Co-STORM mejora significativamente la profundidad y amplitud de la información, y el 70% de los usuarios prefieren Co-STORM, creyendo que reduce significativamente la carga cognitiva.
Actualmente, el sistema STORM&Co-STORM solo admite la interacción en inglés y puede ampliarse a capacidades de interacción en varios idiomas en el futuro. El código abierto de este sistema es una señal de que vivimos en una era extraordinaria en la que el acceso a la información puede adaptarse completamente al nivel individual, haciendo posible aprender cualquier cosa.
Dirección del artículo: https://www.arxiv.org/pdf/2408.15232
Con todo, el código abierto del sistema STORM&Co-STORM ha aportado nuevos avances al campo de la escritura asistida por inteligencia artificial, y vale la pena esperar sus características eficientes y convenientes. En el futuro, con la implementación del soporte multilingüe y una mayor mejora de las funciones, este sistema desempeñará un papel más importante en la investigación académica y la escritura diaria.