Embedditor é o equivalente de código aberto do MS Word para incorporação que ajuda você a aproveitar ao máximo sua pesquisa vetorial.
Site • Discord • Twitter • Documentação • Experimente a demonstração no IngestAI
Aproveite ao máximo sua pesquisa vetorial
Embedditor é um editor de pré-reprocessamento de incorporação de código aberto, que ajuda você a editar embeddings GPT/LLM como se fosse um documento do Microsoft Word, para que você possa aproveitar ao máximo sua pesquisa de vetores, ao mesmo tempo que reduz significativamente os custos de incorporação e armazenamento de vetores.
Junte-se à nossa comunidade
Características
Interface de editor rica
- ⚡ Junte e divida um ou vários pedaços com apenas alguns cliques
- ⚡ Editar incorporação de metadados e tokens
- ⚡ Exclua palavras, frases ou até mesmo partes de blocos da incorporação
- ⚡ Selecione as partes do pedaço que você deseja incorporar
- ⚡ Adicione informações adicionais aos seus mebeddings, como links de URL ou imagens
- ⚡ Obtenha uma marcação HTML bonita para seus resultados de pesquisa de IA
- ⚡ Salve seus arquivos de incorporação pré-processados nos formatos .veml ou .jason
Automação de pré-processamento
- ⚡ Filtre a maior parte do 'ruído' da vetorização, como pontuações ou palavras irrelevantes
- ⚡ Remova da incorporação de palavras não significativas e usadas com frequência com o algoritmo TF-IDF
- ⚡ Normalize seus tokens de incorporação antes da vetorização
Benefícios
Interface de planilha rica
- ⚡ Relevância otimizada do conteúdo recuperado de um banco de dados vetorial
- ⚡ Maior eficiência e precisão em seus aplicativos relacionados a IA/LLM
- ⚡ Resultados de pesquisa visualmente melhores com imagens, links de URL, etc.
- ⚡ Maior eficiência de custos com redução de até 30% nos custos de incorporação e armazenamento de vetores
- ⚡ Controle total sobre seus dados, implantando facilmente o Embedditor localmente em seu PC ou ambiente dedicado
- ⚡ Salve seus embeddings pré-processados ou prontos em formato .json ou .veml para usá-los em LangChain, Chromat ou qualquer outro Vector DB
Tentativa rápida
Cadastre-se gratuitamente e experimente no IngestAI.
GUI
Acesse o painel usando: http://localhost:8080/
Capturas de tela
Instalação
Copie .env.example para .env
Defina as seguintes configurações no .env
OPENAI_API_KEY=
Configure o projeto
-
php artisan migrate
-
php artisan db:seed
-
php artisan storage:link