Embedditor es el equivalente de código abierto de MS Word para incrustar que le ayuda a aprovechar al máximo su búsqueda de vectores.
Sitio web • Discord • Twitter • Documentación • Pruebe la demostración en IngestAI
Aprovecha al máximo tu búsqueda de vectores
Embedditor es un editor de pre-reprocesamiento de incrustaciones de código abierto que le ayuda a editar incrustaciones GPT/LLM como si fuera un documento de Microsoft Word, para que pueda aprovechar al máximo su búsqueda de vectores y, al mismo tiempo, reducir significativamente los costos de incrustación y almacenamiento de vectores.
Únase a nuestra comunidad
Características
Interfaz de editor enriquecida
- ⚡ Une y divide uno o varios fragmentos con unos pocos clics
- ⚡ Editar metadatos y tokens incrustados
- ⚡ Excluir palabras, oraciones o incluso partes de fragmentos de la incrustación
- ⚡ Seleccione las partes del fragmento que desea incrustar
- ⚡ Agregue información adicional a sus mebeddings, como enlaces URL o imágenes
- ⚡ Obtenga un marcado HTML atractivo para sus resultados de búsqueda de IA
- ⚡ Guarde sus archivos de incrustación preprocesados en formatos .veml o .jason
Automatización de preprocesamiento
- ⚡ Filtre de la vectorización la mayor parte del 'ruido', como puntuaciones o palabras vacías
- ⚡ Elimine de la incrustación de palabras insignificantes y de uso frecuente con el algoritmo TF-IDF
- ⚡ Normalice sus tokens de incrustación antes de la vectorización
Beneficios
Interfaz de hoja de cálculo enriquecida
- ⚡ Relevancia optimizada del contenido recuperado de una base de datos vectorial
- ⚡ Eficiencia y precisión mejoradas en sus aplicaciones relacionadas con IA/LLM
- ⚡ Resultados de búsqueda visualmente mejores con imágenes, enlaces URL, etc.
- ⚡ Mayor rentabilidad con hasta un 30% de reducción de costos en incrustación y almacenamiento vectorial
- ⚡ Control total sobre sus datos, implementando Embedditor localmente sin esfuerzo en su PC o entorno dedicado
- ⚡ Guarde sus incrustaciones preprocesadas o listas en formato .json o .veml para usarlas en LangChain, Chromat o cualquier otra base de datos vectorial
intento rápido
Regístrate gratis y pruébalo en IngestAI.
GUI
Acceda al Panel usando: http://localhost:8080/
Capturas de pantalla
Instalación
Copie .env.example en .env
Establezca las siguientes configuraciones en el .env
OPENAI_API_KEY=
Configurar el proyecto
-
php artisan migrate
-
php artisan db:seed
-
php artisan storage:link