Fuji-Web: KI-basierte vollständige Browser-Automatisierung?
Fuji-Web ist ein intelligenter KI-Partner, der die Absichten des Benutzers versteht, autonom durch Websites navigiert, Aufgaben im Namen des Benutzers ausführt und dabei jeden Aktionsschritt erklärt.
Demo
FujiWebCompressed.mp4
Wie funktioniert es?
Bitte lesen Sie unseren Blogbeitrag für ein Demovideo, Benchmarks und einen detaillierten technischen Überblick!
Installieren und Ausführen
Laden Sie die Erweiterung herunter und installieren Sie sie in Ihrem Browser
- Gehen Sie zur Veröffentlichungsseite, suchen Sie die neueste Version der Erweiterung und laden Sie „fuji-extension.zip“ herunter.
- Entpacken Sie die Datei.
- Laden Sie Ihre Erweiterung auf Chrome, indem Sie wie folgt vorgehen:
- Navigieren Sie zu
chrome://extensions/
- Schalten Sie
Developer mode
um - Klicken Sie auf
Load unpacked extension
- Wählen Sie den entpackten Ordner aus
Verwenden Sie die Erweiterung
Bitte beachten Sie, dass Sie möglicherweise die Seite aktualisieren müssen, damit die Erweiterung funktioniert.
- Suchen Sie das Fuji-Symbol in der oberen rechten Ecke Ihres Browsers und klicken Sie darauf, um den Seitenbereich zu öffnen.
- Erstellen Sie einen vorhandenen OpenAI-API-Schlüssel oder Anthropic-API-Schlüssel oder greifen Sie darauf zu und fügen Sie ihn in das dafür vorgesehene Feld ein. Dieser Schlüssel wird in Ihrem Browser gespeichert und nicht an Dritte hochgeladen.
- Navigieren Sie abschließend zu einer Webseite, auf der Sie Fuji-Web finden möchten, und geben Sie die Aufgabe ein, die sie ausführen soll.
Hinweis: Alle Eingabeaufforderungen (Text und Bild) werden direkt an die API Ihrer Auswahl gesendet. Fuji-Web versucht nicht, Informationen von Ihnen zu sammeln.
Erstellen Sie die Erweiterung
Wenn Sie die Erweiterung aus dem Quellcode erstellen möchten, befolgen Sie diese Anweisungen:
- Stellen Sie sicher, dass Sie über Node.js verfügen. Die Entwicklung erfolgte auf Node v20, sollte aber mit einigen niedrigeren Versionen funktionieren.
- Klonen Sie dieses Repository
- Installieren Sie
pnpm
global: npm install -g pnpm
- Führen Sie
pnpm install
aus - Führen Sie
pnpm dev
aus, um den Entwicklungsserver zu starten, oder pnpm build
um die Erweiterung zu erstellen.
Beim Laden der Erweiterung müssen Sie den vom Build-Prozess erstellten dist
-Ordner laden.
Roadmap
- Stellen Sie die API zur einfachen Integration mit Browser-Automatisierungs-Frameworks bereit (z. B. Puppeteer, Playwright, Selenium).
- Fügen Sie Unterstützung für komplexere und tabellenübergreifende Arbeitsabläufe hinzu
- Unterstützung für mehr Browsing-Verhalten hinzufügen (Auswahl aus Dropdown-Liste, Extrahieren von Inhalten aus der gesamten Seite usw.)
- Fügen Sie Unterstützung für das Speichern von Workflows hinzu
- Fügen Sie Unterstützung für das Teilen von Arbeitsabläufen und Anweisungen mit anderen hinzu
- Erstellen Sie eine Wikipedia-ähnliche Wissensdatenbank, in der Benutzer zusammenarbeiten können, um Wissen zu schaffen, das die Leistung von Fuji-Web verbessern kann
Fehlerbehebung
Sehen Sie sich unseren Leitfaden zur Fehlerbehebung an, um Hilfe bei häufigen Problemen zu erhalten.
Mitwirken
Möchten Sie einen Beitrag zu Fuji-Web leisten? Wir würden uns über Ihre Hilfe freuen! In unserem Beitragsleitfaden finden Sie Richtlinien zum Mitwirken, zum Melden von Fehlern, zum Vorschlagen von Verbesserungen und mehr.
Wir haben außerdem einen speziellen Kanal für Fuji-Web-Feedback zu Discord unter https://discord.gg/yfMjZ8udb5 eingerichtet.
Credits
- Die Bildanmerkungsmethode von Fuji-Web wurde vom UFO-Papier von Microsoft inspiriert.
- Fuji als Tool, das im Browser-Sidepanel lebt, wurde von der Browser-Erweiterung von TaxyAI inspiriert. Wir haben auch einen Teil des UI-Codes verwendet.
- Die Einrichtung der Chrome-Erweiterung nutzte ein großartiges Boilerplate-Projekt Jonghakseo/chrome-extension-boilerplate-react-vite.
- Das Fuji-Logo stammt aus dem Toss Face Emoji-Designset.