Zhipu AI hat kürzlich ein neues Produkt veröffentlicht, das auf GLM -Technologie basiert, AutoGLM, einem intelligenten Körper, der den menschlichen Betrieb von Mobiltelefonen simulieren und verschiedene tägliche Aufgaben ausführen kann. Die Entstehung von Autoglm markiert einen großen Durchbruch in der KI im Bereich Mobiltelefonanwendungen. Leben. . Seine Betriebslogik ähnelt der des Menschen ohne komplexe Prozesse, und der Schwellenwert für den Einsatz ist extrem gering.
Autoglm kann eine Vielzahl von Aufgaben ausführen, wie Like und Kommentare zu WeChat -Momenten, Kauf historischer Bestellprodukte auf Taobao, Buchung von Hotels auf CTRIP, Kauf von Zugkarten für 12306, Bestellung von Takeaways on Meupuan usw. Seine Anwendungsszenarien sind nicht auf diese Weise beschränkt.
Derzeit können Benutzer autoglm-web erleben, indem sie das Plug-In "Zhipu Qingyan" installieren, der ein Browser-Assistent ist, mit dem Benutzer Webseiten besuchen, auf Webseiten klicken und die erweiterte Suche, Zusammenfassung und Inhaltsgenerierung auf der Website automatisch abschließen können. Darüber hinaus hat AutoGLM auch eine Anwendung für interne Tests auf Android-Systemen eröffnet und eine umfassende Zusammenarbeit mit Mobilfunkherstellern wie Ehre durchgeführt.
Die Technologie von Autoglm basiert auf der selbst entwickelten "grundlegenden Agenten-Entkoppelung der Zwischenoberfläche" und "Self-Evolution Online-Kurs verstärkte Lernrahmen", die die Fähigkeit, Antagonismus, Schulungsaufgaben und Datenknappheit in großer Modellagenturplanung und Aktionsausführung zu lösen. Probleme wie spärliche Feedback -Signale und Strategieverteilungsdrift. Autoglm kann sich selbst kontinuierlich verbessern und seine eigene Leistung kontinuierlich verbessern, ähnlich wie Menschen, die während ihres Wachstums ständig neue Fähigkeiten erwerben.
In Bezug auf technische Herausforderungen löst Autoglm das Problem der unzureichenden "Aktionsausführung" und der unzureichenden "Aufgabenplanung". Durch die Gestaltung der "grundlegenden Agenten entkoppeln Sie die Intermediate -Schnittstelle" entkoppelt es die beiden Phasen der "Aufgabenplanung" und "Aktionsausführung" über die Intermediate -Schnittstelle natürliche Sprache und erzielen eine große Verbesserung der Fähigkeiten des Agenten. Gleichzeitig nimmt Autoglm den "Self-Evolution Online-Kursverstärkungs-Lernrahmen" ein, um die Funktionen großer Modellagenten in den Web- und Telefonumgebungen in realen Online-Umgebungen zu lernen und zu verbessern.
AutoGLM hat sowohl bei der Verwendung von Telefonnutzung als auch im Webbrowser erhebliche Leistungsverbesserungen erzielt und die Leistung von GPT-4O und Claude-3,5-SONNET in Androidlab-Bewertungsbenchmarks übertroffen. In der Webarena-Lite-Bewertungsbenchmark erzielte Autoglm im Vergleich zu GPT-4O eine Leistungsverbesserung von etwa 200% und verengte die Erfolgslücke zwischen Menschen und großen Modellagenten in der GUI-Manipulation.
Projektadresse: https://xiao9905.github.io/autoglm
Mit seinen leistungsstarken Funktionen und technologischen Innovationen hat Autoglm das enorme Potenzial der künstlichen Intelligenz im Bereich des Mobiltelefonbetriebs gezeigt und mehr Bequemlichkeit für das tägliche Leben der Menschen verleiht. Die hervorragende Leistung bei Leistungstests beweist auch seine technische Stärke. Mit der kontinuierlichen Weiterentwicklung der Technologie wird AutoglM in Zukunft voraussichtlich breitere Anwendungen erzielen und mehr Wert für Benutzer schaffen.