Fuji-Web: полная автоматизация браузера на основе искусственного интеллекта?
Fuji-Web — это интеллектуальный партнер в области искусственного интеллекта, который понимает намерения пользователя, автономно перемещается по веб-сайтам и выполняет задачи от имени пользователя, объясняя каждый шаг действия.
Демо
FujiWebCompressed.mp4
Как это работает?
Пожалуйста, прочтите наш блог, где вы найдете демонстрационное видео, тесты и подробный технический обзор!
Установка и запуск
Загрузите и установите расширение в свой браузер.
- Перейдите на страницу релизов, найдите последнюю версию расширения и скачайте «fuji-extension.zip».
- Разархивируйте файл.
- Загрузите расширение в Chrome, выполнив следующие действия:
- Перейдите по адресу
chrome://extensions/
- Переключить
Developer mode
- Нажмите
Load unpacked extension
- Выберите разархивированную папку
Используйте расширение
Обратите внимание, что вам может потребоваться обновить страницу, чтобы расширение заработало.
- Найдите значок Fuji в правом верхнем углу браузера и щелкните его, чтобы открыть боковую панель.
- Создайте или получите доступ к существующему ключу API OpenAI или ключу Anthropic API и вставьте его в соответствующее поле. Этот ключ будет храниться в вашем браузере и не будет передан третьей стороне.
- Наконец, перейдите на веб-страницу, на которой вам нужен Fuji-Web, и введите задачу, которую вы хотите, чтобы она выполняла.
Примечание. Все запросы (текст и изображения) отправляются непосредственно в выбранный вами API. Fuji-Web не пытается получить от вас какую-либо информацию.
Создайте расширение
Если вы хотите собрать расширение из исходного кода, следуйте этим инструкциям:
- Убедитесь, что у вас есть Node.js. Разработка велась на Node v20, но она должна работать и с более ранними версиями.
- Клонировать этот репозиторий
- Установите
pnpm
глобально: npm install -g pnpm
- Запустите
pnpm install
- Запустите
pnpm dev
, чтобы запустить сервер разработки, или pnpm build
, чтобы собрать расширение.
При загрузке расширения вам нужно будет загрузить папку dist
созданную в процессе сборки.
Дорожная карта
- Expose API для простой интеграции с платформами автоматизации браузера (например, Puppeteer, Playwright, Selenium)
- Добавьте поддержку более сложных рабочих процессов с перекрестными таблицами.
- Добавить поддержку дополнительных вариантов поведения при просмотре (выбор из раскрывающегося списка, извлечение содержимого всей страницы и т. д.).
- Добавить поддержку сохранения рабочих процессов.
- Добавьте поддержку обмена рабочими процессами и инструкциями с другими.
- Создайте базу знаний, подобную Википедии, где пользователи могут вместе работать над созданием знаний, которые могут улучшить производительность Fuji-Web.
Поиск неисправностей
Ознакомьтесь с нашим Руководством по устранению неполадок, чтобы получить помощь в решении распространенных проблем.
Содействие
Хотите внести свой вклад в Fuji-Web? Мы будем рады вашей помощи! Ознакомьтесь с нашим Руководством по участию, чтобы узнать, как вносить свой вклад, сообщать об ошибках, предлагать улучшения и многое другое.
Мы также создали специальный канал для отзывов Fuji-Web в Discord по адресу https://discord.gg/yfMjZ8udb5.
Кредиты
- Метод аннотации изображений Fuji-Web был вдохновлен статьей Microsoft об НЛО.
- Fuji как инструмент, расположенный на боковой панели браузера, был вдохновлен расширением браузера TaxyAI. Мы также использовали часть кода пользовательского интерфейса.
- В настройке расширения Chrome использовался замечательный шаблонный проект Jonghakseo/chrome-extension-boilerplate-react-vite.
- Логотип Fuji взят из набора дизайнов Toss Face Emoji.