Fuji-Web: AI 기반 전체 브라우저 자동화 ?
Fuji-Web은 사용자의 의도를 이해하고 웹 사이트를 자율적으로 탐색하며 각 작업 단계를 설명하면서 사용자를 대신하여 작업을 실행하는 지능형 AI 파트너입니다.
데모
FujiWeb압축.mp4
어떻게 작동하나요?
데모 비디오, 벤치마크 및 심층적인 기술 개요를 보려면 블로그 게시물을 읽어보세요!
설치 및 실행
브라우저에 확장 프로그램을 다운로드하고 설치하세요.
- 릴리스 페이지로 이동하여 최신 버전의 확장 프로그램을 찾아 "fuji-extension.zip"을 다운로드하세요.
- 파일의 압축을 풉니다.
- 다음을 수행하여 Chrome에 확장 프로그램을 로드하세요.
-
chrome://extensions/
로 이동하세요. -
Developer mode
전환 -
Load unpacked extension
를 클릭하세요. - 압축이 풀린 폴더를 선택하세요
확장 프로그램을 사용하세요
확장 프로그램이 작동하려면 페이지를 새로 고쳐야 할 수도 있습니다.
- 브라우저 오른쪽 상단에서 Fuji 아이콘을 찾아 클릭하여 측면 패널을 엽니다.
- 기존 OpenAI API 키 또는 Anthropic API 키를 생성하거나 액세스하여 제공된 상자에 붙여넣습니다. 이 키는 귀하의 브라우저에 저장되며 제3자에게 업로드되지 않습니다.
- 마지막으로 Fuji-Web을 원하는 웹페이지로 이동하여 수행하려는 작업을 입력하세요.
참고: 모든 프롬프트(텍스트 및 이미지)는 선택한 API로 직접 전송됩니다. Fuji-Web은 귀하로부터 어떠한 정보도 수집하려고 시도하지 않습니다.
확장 빌드
소스에서 확장을 빌드하려면 다음 지침을 따르세요.
- Node.js가 있는지 확인하세요. 개발은 Node v20에서 이루어졌지만 일부 하위 버전에서도 작동할 것입니다.
- 이 저장소 복제
- 전역적으로
pnpm
설치: npm install -g pnpm
-
pnpm install
실행 -
pnpm dev
실행하여 개발 서버를 시작하거나 pnpm build
실행하여 확장을 빌드하세요.
확장을 로드할 때 빌드 프로세스에서 생성된 dist
폴더를 로드해야 합니다.
로드맵
- 브라우저 자동화 프레임워크(예: Puppeteer, Playwright, Selenium)와 쉽게 통합하기 위한 API 노출
- 더 복잡한 크로스탭 워크플로에 대한 지원 추가
- 더 많은 탐색 동작에 대한 지원 추가(드롭다운에서 선택, 전체 페이지에서 콘텐츠 추출 등)
- 워크플로우 저장 지원 추가
- 다른 사람과 작업 흐름 및 지침을 공유하기 위한 지원 추가
- Fuji-Web의 성능을 향상시킬 수 있는 지식을 생성하기 위해 사용자가 함께 작업할 수 있는 위키피디아와 같은 지식 기반을 만듭니다.
문제 해결
일반적인 문제에 대한 도움말은 문제 해결 가이드를 확인하세요.
기여
Fuji-Web에 기여하는 데 관심이 있으십니까? 우리는 당신의 도움을 원합니다! 기여, 버그 보고, 개선 사항 제안 등에 대한 지침은 기여 가이드를 확인하세요.
또한 Discord에 대한 Fuji-Web 피드백 전용 채널(https://discord.gg/yfMjZ8udb5)을 설정했습니다.
크레딧
- Fuji-Web의 이미지 주석 방법은 Microsoft의 UFO 논문에서 영감을 받았습니다.
- 브라우저 측면 패널에 있는 도구인 Fuji는 TaxyAI의 브라우저 확장에서 영감을 받았습니다. 우리는 또한 UI 코드 중 일부를 사용했습니다.
- Chrome 확장 프로그램 설정은 멋진 상용구 프로젝트 Jonghakseo/chrome-extension-boilerplate-react-vite를 활용했습니다.
- Fuji 로고는 Toss Face Emoji 디자인 세트에서 따왔습니다.