Inscreva-se (1k pedaços grátis) | PDF2MD | Motor de busca de notícias sobre hackers | Documentação | Conheça um Mantenedor | Discórdia | Matriz
Solução completa para pesquisa, recomendações e RAG
Links rápidos
- Referência de API + Documentos
- Especificação OpenAPI
- SDK de texto digitado
- SDK Python
Características
- Auto-hospedagem em seu VPC ou local : temos guias completos de auto-hospedagem para AWS, GCP, Kubernetes em geral e docker compose disponíveis em nossa página de documentação aqui.
- ? Pesquisa de vetor denso semântico : integra-se aos modelos de incorporação OpenAI ou Jina e Qdrant para fornecer pesquisa de vetor semântico.
- ? Pesquisa neural/texto completo tolerante a erros de digitação : cada pedaço carregado é vetorizado com naver/efficient-splade-VI-BT-large-query para pesquisa de vetor esparso neural de qualidade e tolerante a erros de digitação.
- Destaque de subfrases : destaque as palavras ou frases correspondentes em um bloco e coloque-as em negrito na pesquisa para aprimorar a experiência do usuário para seus usuários. Grite para a caixa do simsearch!
- ? Recomendações : Encontre pedaços semelhantes (ou arquivos, se estiver usando agrupamento) com a API de recomendação. Muito útil se você tiver uma plataforma onde o conteúdo favorito, favorito ou votado pelos usuários.
- ? Rotas convenientes da API RAG : Integramos com o OpenRouter para fornecer acesso a qualquer LLM que você desejar para o RAG. Experimente nossas rotas para RAG totalmente gerenciado com gerenciamento de memória baseado em tópicos ou selecione seu próprio RAG de contexto.
- Traga seus próprios modelos : se desejar, você pode trazer seu próprio modelo de incorporação de texto, SPLADE, reclassificação de codificador cruzado e/ou modelo de linguagem grande (LLM) e conectá-lo à nossa infraestrutura.
- Pesquisa híbrida com reclassificação de codificador cruzado : para obter os melhores resultados, use a pesquisa híbrida com otimização de reclassificação BAAI/bge-reranker-large.
- ? Polarização de atualidade : polarize facilmente os resultados da pesquisa para o que foi mais recente para evitar obsolescência
- Merchandising ajustável : ajuste a relevância usando sinais como cliques, adição ao carrinho ou citações
- ?️ Filtragem : intervalo de datas, correspondência de substring, tag, numérico e outros tipos de filtro são suportados.
- Agrupamento : marque vários pedaços como parte do mesmo arquivo e pesquise no nível do arquivo, de modo que o mesmo resultado de nível superior nunca apareça duas vezes
Está faltando um recurso que seu caso de uso precisaria? - ligue para 628-222-4090, faça uma edição no Github ou junte-se à comunidade Matrix e conte-nos! Somos uma pequena empresa que ainda trabalha muito e está ansiosa para construir o que você precisa; serviços profissionais estão disponíveis.
Desenvolvimento local com Linux
Pacotes Debian/Ubuntu pacotes necessários
sudo apt install curl
gcc
g++
make
pkg-config
python3
python3-pip
libpq-dev
libssl-dev
openssl
Pacotes Arch necessários
sudo pacman -S base-devel postgresql-libs
Instale NodeJS e Yarn
Você pode instalar o NVM usando seu script de instalação.
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.5/install.sh | bash
Você deve reiniciar o terminal para atualizar o perfil bash com NVM. Em seguida, você pode instalar a versão NodeJS LTS e o Yarn.
nvm install --lts
npm install -g yarn
Criar diretório tmp do servidor
Instale ferrugem
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
Instale o relógio de carga
cargo install cargo-watch
Configurar ambientes
cp .env.analytics ./frontends/analytics/.env
cp .env.chat ./frontends/chat/.env
cp .env.search ./frontends/search/.env
cp .env.server ./server/.env
cp .env.dashboard ./frontends/dashboard/.env
Adicione seu LLM_API_KEY
a ./server/.env
Aqui está um guia para adquirir isso.
Etapas assim que você tiver a chave
- Abra o arquivo
./server/.env
- Substitua o valor de
LLM_API_KEY
por sua própria chave de API OpenAI. - Substitua o valor de
OPENAI_API_KEY
para ser sua própria chave de API OpenAI.
Inicie os serviços de contêiner do Docker necessários para desenvolvimento local
cat .env.chat .env.search .env.server .env.docker-compose > .env
./convenience.sh -l
Iniciar serviços para desenvolvedor local
Recomendamos gerenciar isso através do tmuxp, consulte o guia aqui ou nas guias do terminal.
cd clients/ts-sdk
yarn build
cd frontends
yarn
yarn dev
cd server
cargo watch -x run
cd server
cargo run --bin ingestion-worker
cd server
cargo run --bin file-worker
cd server
cargo run --bin delete-worker
Verifique a configuração de trabalho
- verifique se você pode ver o redoc com a referência OpenAPI em localhost:8090/redoc
- faça uma conta criar um conjunto de dados com dados de teste em localhost:5173
- pesquise esse conjunto de dados com dados de teste em localhost:5174
Depurando problemas com desenvolvedor local
Entre em contato conosco no discord para obter assistência. Estamos disponíveis e teremos todo o prazer em ajudar.
Depure o diesel obtendo o SQL gerado exato
diesel::debug_query(&query).to_string();
Configuração local para testar recursos do Stripe
Instale o Stripe CLI.
-
stripe login
-
stripe listen --forward-to localhost:8090/api/stripe/webhook
- defina
STRIPE_WEBHOOK_SECRET
em server/.env
para o segredo de assinatura do webhook resultante -
stripe products create --name trieve --default-price-data.unit-amount 1200 --default-price-data.currency usd
-
stripe plans create --amount=1200 --currency=usd --interval=month --product={id from response of step 3}
Colaboradores