Fuji-Web: ¿Automatización completa del navegador basada en IA?
Fuji-Web es un socio de inteligencia artificial inteligente que comprende la intención del usuario, navega por sitios web de forma autónoma y ejecuta tareas en nombre del usuario mientras explica cada paso de acción.
Manifestación
FujiWebComprimido.mp4
¿Cómo funciona?
Lea nuestra publicación de blog para ver un video de demostración, puntos de referencia y una descripción técnica detallada.
Instalación y ejecución
Descargue e instale la extensión en su navegador
- Vaya a la página de lanzamientos, busque la última versión de la extensión y descargue "fuji-extension.zip".
- Descomprima el archivo.
- Cargue su extensión en Chrome haciendo lo siguiente:
- Navega a
chrome://extensions/
- Alternar
Developer mode
- Haga clic en
Load unpacked extension
- Seleccione la carpeta descomprimida
Usa la extensión
Tenga en cuenta que es posible que deba actualizar la página para que funcione la extensión.
- Busque el ícono de Fuji en la esquina superior derecha de su navegador y haga clic en él para abrir el panel lateral.
- Cree o acceda a una clave API OpenAI o una clave API Anthropic existente y péguela en el cuadro provisto. Esta clave se almacenará en su navegador y no se cargará a terceros.
- Finalmente, navegue hasta la página web que desee Fuji-Web y escriba la tarea que desea que realice.
Nota: todas las indicaciones (texto e imagen) se envían directamente a la API de su selección. Fuji-Web no intenta recopilar ninguna información sobre usted.
Construye la extensión
Si desea crear la extensión desde el código fuente, siga estas instrucciones:
- Asegúrese de tener Node.js. El desarrollo se realizó en Node v20 pero debería funcionar con algunas versiones inferiores.
- Clonar este repositorio
- Instale
pnpm
globalmente: npm install -g pnpm
- Ejecute
pnpm install
- Ejecute
pnpm dev
para iniciar el servidor de desarrollo o pnpm build
para crear la extensión.
Al cargar la extensión, deberá cargar la carpeta dist
creada por el proceso de compilación.
Hoja de ruta
- Expose API para una fácil integración con marcos de automatización del navegador (por ejemplo, Puppeteer, Playwright, Selenium)
- Agregue soporte para flujos de trabajo más complejos y de tabulación cruzada
- Agregue soporte para más comportamientos de navegación (seleccione del menú desplegable, extraiga contenido de toda la página, etc.)
- Agregar soporte para guardar flujos de trabajo
- Agregue soporte para compartir flujos de trabajo e instrucciones con otros
- Cree una base de conocimientos similar a la de Wikipedia donde los usuarios puedan trabajar juntos para crear conocimientos que puedan mejorar el rendimiento de Fuji-Web.
Solución de problemas
Consulte nuestra Guía de solución de problemas para obtener ayuda con problemas comunes.
Contribuyendo
¿Interesado en contribuir a Fuji-Web? ¡Nos encantaría tu ayuda! Consulte nuestra Guía de contribución para obtener pautas sobre cómo contribuir, informar errores, sugerir mejoras y más.
También hemos creado un canal dedicado para recibir comentarios de Fuji-Web sobre Discord en https://discord.gg/yfMjZ8udb5.
Créditos
- El método de anotación de imágenes de Fuji-Web se inspiró en el artículo OVNI de Microsoft.
- Fuji, como herramienta que reside en el panel lateral del navegador, se inspiró en la extensión del navegador de TaxyAI. También utilizamos parte de su código de interfaz de usuario.
- La configuración de la extensión de Chrome aprovechó un increíble proyecto repetitivo Jonghakseo/chrome-extension-boilerplate-react-vite.
- El logotipo de Fuji es del conjunto de diseño Toss Face Emoji.