Die akademische Forschung beruht auf einer effizienten Literaturrecherche, aber bestehende Suchmaschinen sind schwierig, die Bedürfnisse komplexer beruflicher Abfragen zu erfüllen. Beispielsweise erfordern die nicht-stationäre Verstärkungslernforschung für bestimmte Algorithmen (z. B. UCB-Methoden) stärkere Such- und Analysefunktionen. Forscher verbringen oft viel Zeit und Mühe damit, enorme akademische Datenbanken manuell zu rufen. In diesem Artikel wird PASA vorgestellt, ein selbstentwickeltes vom Bytedance Research Institute und der Peking University, einem autonomen akademischen Papiersuchagenten, das auf großer Sprachmodell (LLM) basiert, um dieses Problem zu lösen.
Im Bereich der akademischen Forschung ist die Literaturrecherche eine komplexe und wichtige Aufgabe, um Informationen zu erhalten. Forscher müssen in der Lage sein, komplexe, Fachgebiete der Suchfunktionen zu bewältigen, um den sorgfältigen Forschungsbedarf zu decken. Bestehende akademische Suchplattformen wie Google Scholar haben jedoch häufig Schwierigkeiten, diese komplexen Forschungsabfragen zu bewältigen. Beispielsweise erfordern professionelle Abfragen zum nicht-stationären Verstärkungslernen unter Verwendung von UCB-Methoden eine stärkere Computer- und Analysefunktion. Darüber hinaus müssen Forscher häufig viel Zeit und Mühe verbringen, wenn sie bei der Durchführung von Literaturprüfungen riesige akademische Datenbanken durchsuchen.
Obwohl in mehreren Studien die Anwendung von Großsprachmodellen (LLMs) bei der Suche nach akademischen Papier und der wissenschaftlichen Entdeckung untersucht wurden, haben traditionelle Suchinstrumente immer noch Schwierigkeiten, komplexen beruflichen Forschungsbedürfnissen zu erfüllen. Viele Studien konzentrieren sich auf die Entwicklung von LLM -Agenten durch Optimierungsrahmen und sofortige technische Technologien. Die große Lücke kam.
Kürzlich schlug das Bytedance Research Institute und Forscher der Peking University gemeinsam PASA vor, einen innovativen LLM-basierten Papiersuchvertreter. PASA kann komplexe Suchstrategien, einschließlich Toolsanrufe, Papierlesungen und Referenzauswahl, autonom durchführen, um umfassende und genaue Ergebnisse für komplexe akademische Abfragen zu generieren. Um die Leistung von PASA zu optimieren, erstellte das Forschungsteam AutoscholarQuery, einen synthetischen Datensatz mit 35.000 feinkörnigen akademischen Abfragen, und etablierte RealScholarQuery als Benchmark für die Bewertung der tatsächlichen Leistung des Agenten. Das System verwendet Verstärkungslernen -Techniken, um die Suchfunktionen zu verbessern und die Hauptbeschränkungen bei bestehenden akademischen Suchmethoden zu lösen.
Das PASA -System besteht aus zwei LLM -Agenten: einem Crawler und einem Selektor, die zusammenarbeiten, um eine umfassende akademische Papiersuche durchzuführen. Der Crawler analysiert zunächst die Abfragen des Benutzers, um mehrere granulare Suchabfragen zu generieren, um relevante Papiere zu erhalten, und fügt diese Papiere einer speziellen Papierwarteschlange hinzu. Crawlers verarbeiten jedes in der Warteschlange in der Warteschlange in der Warteschlange in der Warteschlange, identifizieren und untersuchen wichtige Zitate, die den Umfang der Forschung erweitern können, und fügen der Liste dynamisch neu entdeckte verwandte Artikel hinzu. Der Selektor bewertet dann, ob jedes Papier den ursprünglichen Anforderungen an Abfragen erfüllt.
Experimentelle Ergebnisse zeigen, dass PASA-7B in mehreren Benchmark-Tests überlegen ist. Im Test-Test für AutoscholarQuery hat PASA-7B im Vergleich zu PASA-GPT-4O um 9,64% gestiegen. Bei der Einstellung von Google-basierten Benchmarks stieg die Rückrufrate von PASA-7B zwischen 33,80% und 42,64%. In dem herausfordernden RealScholarQuery-Szenario zeigt PASA-7B einen Rückrufanstieg von 30,36% und eine Genauigkeitserhöhung um 4,25%.
Im Allgemeinen markiert der Start von PASA einen wichtigen Fortschritt in der Suchtechnologie von akademischen Papier und bietet eine effektive Lösung für das Abrufen von Informationen zur akademischen Forschung. Durch die Kombination von großsprachigen Modellen und Verstärkungslerntechniken reduziert PASA die Zeit und Mühe, die Forscher in Literaturübersichten investiert haben, erheblich und bietet ihnen gleichzeitig ein effizientes Instrument, um mit einem zunehmend großen und komplexen akademischen Literaturumfeld umzugehen.
Code: https://github.com/bytedance/pasa
Papier: https://arxiv.org/abs/2501.10120
Punkte:
** PASA ist ein intelligenter Suchagent für akademische Papier, der gemeinsam von Forschern der Bytedance und der Peking University eingeführt wurde. **
** Dieses System besteht aus zwei LLM -Agenten, Crawler und Selektor, und kann unabhängig voneinander komplexe Suchstrategien durchführen. **
** Experimentelle Ergebnisse zeigen, dass PASA-7B in mehreren Benchmark-Tests besser als vorhandene Suchmethoden abschneidet und die Effizienz und Genauigkeit der Papiersuche signifikant verbessert. **
Die Entstehung von PASA hat revolutionäre Veränderungen in die akademische Forschung gebracht. In Zukunft ist die Weiterentwicklung und Anwendung von PASA es wert, auf die sich freuen kann.