A Universidade de Stanford abriu o código-fonte de seu recém-desenvolvido sistema de escrita de IA STORM&Co-STORM. Este sistema pode integrar informações de várias fontes para gerar artigos longos de alta qualidade com base em entradas de tópicos simples, melhorando muito a eficiência da redação de pesquisas científicas. STORM usa perguntas e respostas multiângulos de "especialistas em LLM" e "moderadores de LLM" para gerar artigos de forma iterativa, enquanto o Co-STORM gera mapas mentais dinâmicos por meio de diálogo multiagente para garantir informações abrangentes. O sistema permite aos usuários selecionar livremente os modos e gerar artigos longos estruturados em 3 minutos, e oferece a função de visualizar o processo de brainstorming e exemplos de artigos.
A tecnologia central do sistema STORM&Co-STORM inclui suporte para pesquisa Bing e GPT-4o mini. Seu processo de escrita automatizado é dividido em três estágios: geração de perguntas multiperspectivas, geração e melhoria de esboço e geração de texto completo. Embora o sistema integre informações de múltiplas fontes, as fontes de informação podem ser tendenciosas para o mainstream e podem conter conteúdo promocional. O Co-STORM visa resolver o problema da omissão de informações e melhorar a eficiência do aprendizado. Os testes dos usuários mostram que reduz significativamente a carga cognitiva. Atualmente o sistema suporta apenas inglês e será expandido para vários idiomas no futuro. O sistema open source STORM&Co-STORM traz novas possibilidades para a aprendizagem personalizada, tornando a aquisição de conhecimento mais conveniente e eficiente.
Os usuários só precisam inserir palavras de assunto em inglês, e o sistema pode gerar artigos longos de alta qualidade que integram informações de várias fontes, semelhantes aos artigos da Wikipedia. Para experimentar o sistema STORM, os usuários podem escolher livremente entre os modos STORM e Co-STORM. Depois de um determinado tópico, o STORM pode formar um artigo longo, estruturado e de alta qualidade em 3 minutos.
Além disso, os usuários também podem visualizar o processo de brainstorming de diferentes funções do LLM clicando em "Ver Processo BrainSTORMing". Na coluna "Descobrir", os usuários podem consultar artigos e exemplos de bate-papo gerados por outros acadêmicos, e artigos gerados pessoalmente e registros de bate-papo também podem ser encontrados na barra lateral "Minha Biblioteca".
O processo de redação automatizado do sistema STORM é dividido em três etapas principais: geração de perguntas multiperspectivas, geração e melhoria do esboço e geração de texto completo. O sistema consulta artigos relevantes da Wikipédia para identificar várias perspectivas que cobrem o tópico e, em seguida, simula uma conversa entre um redator da Wikipédia e um especialista com base em fontes online confiáveis. Com base no conhecimento inerente ao LLM, o conteúdo do diálogo coletado de diferentes perspectivas é finalmente compilado cuidadosamente em um esboço escrito.
Embora o STORM revele diversas perspectivas ao pesquisar um determinado tópico, a informação recolhida ainda pode inclinar-se para fontes convencionais na Internet e pode conter conteúdo promocional. Outra limitação do estudo é que, embora os pesquisadores tenham se concentrado em gerar artigos semelhantes à Wikipédia a partir do zero, eles consideraram apenas a geração de texto organizado livremente. Artigos da Wikipedia escritos por humanos de alta qualidade geralmente contêm dados estruturados e informações multimodais.
Co-STORM visa melhorar o problema da omissão de informação na recolha e integração de informação para promover grandemente a eficiência da aprendizagem. Ajuda os usuários a compreender e participar na organização da informação através de diálogo colaborativo multiagente, mapeamento mental dinâmico e módulos de geração de relatórios. Os pesquisadores realizaram avaliações humanas em 20 voluntários, comparando o desempenho do Co-STORM com motores de busca tradicionais e RAG Chatbot. Os resultados mostram que o Co-STORM melhora significativamente a profundidade e amplitude da informação, e 70% dos utilizadores preferem o Co-STORM, acreditando que reduz significativamente a carga cognitiva.
Atualmente, o sistema STORM&Co-STORM suporta apenas interação em inglês e pode ser expandido para recursos de interação multilíngue no futuro. O código aberto deste sistema é um sinal de que vivemos numa era extraordinária onde o acesso à informação pode ser totalmente adaptado ao nível individual, tornando possível aprender qualquer coisa.
Endereço do artigo: https://www.arxiv.org/pdf/2408.15232
Em suma, o código aberto do sistema STORM&Co-STORM trouxe novos avanços para o campo da escrita assistida por inteligência artificial, e vale a pena esperar por seus recursos eficientes e convenientes. No futuro, com a implementação do suporte multilíngue e o aprimoramento das funções, este sistema desempenhará um papel maior na pesquisa acadêmica e na escrita diária.