Die Stanford University hat ihr neu entwickeltes KI-Schreibsystem STORM&Co-STORM als Open-Source-Lösung bereitgestellt. Dieses System kann Informationen aus mehreren Quellen integrieren, um hochwertige lange Artikel auf der Grundlage einfacher Themeneingaben zu generieren, was die Effizienz des Schreibens wissenschaftlicher Forschung erheblich verbessert. STORM nutzt Multi-Angle-Q&A von „LLM-Experten“ und „LLM-Moderatoren“, um iterativ Artikel zu generieren, während Co-STORM durch Multi-Agenten-Dialog dynamische Mindmaps generiert, um umfassende Informationen zu gewährleisten. Das System ermöglicht Benutzern die freie Auswahl von Modi und die Generierung strukturierter langer Artikel innerhalb von 3 Minuten und bietet die Funktion, den Brainstorming-Prozess und Artikelbeispiele anzuzeigen.
Die Kerntechnologie des STORM&Co-STORM-Systems umfasst die Unterstützung der Bing-Suche und GPT-4o mini. Der automatisierte Schreibprozess ist in drei Phasen unterteilt: multiperspektivische Fragengenerierung, Gliederungsgenerierung und -verbesserung sowie Volltextgenerierung. Obwohl das System Informationen aus mehreren Quellen integriert, können die Informationsquellen auf den Mainstream ausgerichtet sein und Werbeinhalte enthalten. Co-STORM zielt darauf ab, das Problem der Informationsauslassung zu lösen und die Lerneffizienz zu verbessern. Benutzertests zeigen, dass es die kognitive Belastung erheblich reduziert. Derzeit unterstützt das System nur Englisch und wird in Zukunft auf mehrere Sprachen erweitert. Das Open-Source-System STORM&Co-STORM eröffnet neue Möglichkeiten für personalisiertes Lernen und macht den Wissenserwerb bequemer und effizienter.
Benutzer müssen lediglich englische Betreffwörter eingeben und das System kann qualitativ hochwertige lange Artikel generieren, die Informationen aus mehreren Quellen integrieren, ähnlich wie Wikipedia-Artikel. Um das STORM-System zu erleben, können Benutzer frei zwischen den Modi STORM und Co-STORM wählen. Nach einem vorgegebenen Thema kann STORM innerhalb von 3 Minuten einen strukturierten, qualitativ hochwertigen langen Artikel erstellen.
Darüber hinaus können Benutzer auch den Brainstorming-Prozess verschiedener LLM-Rollen anzeigen, indem sie auf „BrainSTORMing-Prozess anzeigen“ klicken. In der Spalte „Entdecken“ können Benutzer auf von anderen Wissenschaftlern erstellte Artikel und Chat-Beispiele verweisen, und in der Seitenleiste „Meine Bibliothek“ sind auch persönlich erstellte Artikel und Chat-Aufzeichnungen zu finden.
Der automatisierte Schreibprozess des STORM-Systems ist in drei Hauptphasen unterteilt: multiperspektivische Fragengenerierung, Gliederungsgenerierung und -verbesserung sowie Volltextgenerierung. Das System konsultiert relevante Wikipedia-Artikel, um verschiedene Perspektiven zum Thema zu ermitteln, und simuliert dann ein Gespräch zwischen einem Wikipedia-Autor und einem Experten auf der Grundlage zuverlässiger Online-Quellen. Basierend auf den inhärenten Kenntnissen des LLM werden die aus verschiedenen Perspektiven gesammelten Dialoginhalte schließlich sorgfältig zu einer Schreibskizze zusammengestellt.
Obwohl STORM bei der Recherche zu einem bestimmten Thema unterschiedliche Perspektiven aufdeckt, orientieren sich die gesammelten Informationen möglicherweise immer noch an Mainstream-Quellen im Internet und können Werbeinhalte enthalten. Eine weitere Einschränkung der Studie besteht darin, dass sich die Forscher zwar darauf konzentrierten, Wikipedia-ähnliche Artikel von Grund auf zu erstellen, sie jedoch nur die Erstellung frei organisierter Texte in Betracht zogen. Hochwertige, von Menschen geschriebene Wikipedia-Artikel enthalten typischerweise strukturierte Daten und multimodale Informationen.
Co-STORM zielt darauf ab, das Problem der Informationsauslassung bei der Informationssammlung und -integration zu verbessern, um die Lerneffizienz erheblich zu steigern. Es hilft Benutzern, die Organisation von Informationen durch kollaborativen Dialog mit mehreren Agenten, dynamische Mindmapping- und Berichtserstellungsmodule zu verstehen und daran teilzunehmen. Die Forscher führten menschliche Bewertungen an 20 Freiwilligen durch und verglichen die Leistung von Co-STORM mit herkömmlichen Suchmaschinen und RAG Chatbot. Die Ergebnisse zeigen, dass Co-STORM die Tiefe und Breite der Informationen erheblich verbessert, und 70 % der Benutzer bevorzugen Co-STORM, da sie glauben, dass es die kognitive Belastung erheblich reduziert.
Derzeit unterstützt das STORM&Co-STORM-System nur die Interaktion auf Englisch und kann in Zukunft auf mehrsprachige Interaktionsmöglichkeiten erweitert werden. Die Open Source dieses Systems ist ein Zeichen dafür, dass wir in einer außergewöhnlichen Zeit leben, in der der Zugang zu Informationen vollständig auf die individuelle Ebene zugeschnitten werden kann und es ermöglicht, alles zu lernen.
Papieradresse: https://www.arxiv.org/pdf/2408.15232
Alles in allem hat die offene Quelle des STORM&Co-STORM-Systems neue Durchbrüche auf dem Gebiet des Schreibens mit künstlicher Intelligenz gebracht, und seine effizienten und praktischen Funktionen sind es wert, gespannt zu sein. Zukünftig wird dieses System mit der Implementierung der Mehrsprachenunterstützung und der weiteren Verbesserung der Funktionen eine größere Rolle in der akademischen Forschung und im täglichen Schreiben spielen.