Зарегистрироваться (1 тыс. фрагментов бесплатно) | PDF2MD | Поисковая система хакерских новостей | Документация | Познакомьтесь с сопровождающим | Раздор | Матрица
Комплексное решение для поиска, рекомендаций и RAG
Быстрые ссылки
- Справочник по API + документация
- Спецификация OpenAPI
- Машинописный SDK
- Python SDK
Функции
- Самостоятельный хостинг в вашем VPC или на предприятии : у нас есть полные руководства по самостоятельному хостингу для AWS, GCP, Kubernetes в целом и Docker Compose, доступные на нашей странице документации здесь.
- ? Семантический векторный поиск : интегрируется с моделями внедрения OpenAI или Jina и Qdrant для обеспечения семантического векторного поиска.
- ? Полнотекстовый/нейронный поиск, устойчивый к опечаткам : каждый загруженный фрагмент векторизуется с помощью Naver/efficient-Splade-VI-BT-large-query для устойчивого к опечаткам качественного нейронного поиска с разреженными векторами.
- Выделение подпредложений : выделите совпадающие слова или предложения в фрагменте и выделяйте их жирным шрифтом при поиске, чтобы улучшить UX для ваших пользователей. Привет ящику симпоиска!
- ? Рекомендации : находите похожие фрагменты (или файлы при использовании группировки) с помощью API рекомендаций. Очень полезно, если у вас есть платформа, на которой пользователи добавляют контент в избранное, добавляют в закладки или голосуют за него.
- ? Удобные маршруты API RAG : мы интегрируемся с OpenRouter, чтобы предоставить вам доступ к любому LLM, который вы хотите для RAG. Попробуйте наши маршруты для полностью управляемого RAG с тематическим управлением памятью или выберите свой собственный контекстный RAG.
- Используйте свои собственные модели . Если хотите, вы можете использовать свою собственную модель для встраивания текста, SPLADE, перекрестного кодирования и/или модель для большого языка (LLM) и подключить ее к нашей инфраструктуре.
- Гибридный поиск с повторным ранжированием между кодировщиками . Для достижения наилучших результатов используйте гибридный поиск с оптимизацией повторного ранжирования BAAI/bge-reranker-large.
- ? Смещение недавности : легко смещать результаты поиска в зависимости от того, что было самым последним, чтобы предотвратить устаревание.
- Настраиваемый мерчандайзинг : корректируйте релевантность, используя такие сигналы, как клики, добавление в корзину или цитирование.
- ?️ Фильтрация : поддерживаются диапазон дат, совпадение подстроки, теги, числовые и другие типы фильтров.
- Группировка : отмечайте несколько фрагментов как часть одного файла и осуществляйте поиск на уровне файла, чтобы один и тот же результат верхнего уровня никогда не появлялся дважды.
Нам не хватает функции, которая понадобится вашему варианту использования? — позвоните нам по телефону 628-222-4090, оставьте заявку на Github или присоединяйтесь к сообществу Matrix и расскажите нам! Мы небольшая компания, которая по-прежнему очень практична и стремится создать то, что вам нужно; доступны профессиональные услуги.
Локальная разработка с Linux
Пакеты Debian/Ubuntu необходимые пакеты
sudo apt install curl
gcc
g++
make
pkg-config
python3
python3-pip
libpq-dev
libssl-dev
openssl
Необходимы пакеты Arch
sudo pacman -S base-devel postgresql-libs
Установите NodeJS и Yarn.
Вы можете установить NVM, используя его сценарий установки.
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.5/install.sh | bash
Вам следует перезагрузить терминал, чтобы обновить профиль bash с помощью NVM. Затем вы можете установить выпуск NodeJS LTS и Yarn.
nvm install --lts
npm install -g yarn
Создать каталог tmp сервера
Установить ржавчину
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
Установить груз-часы
cargo install cargo-watch
Настройка окружения
cp .env.analytics ./frontends/analytics/.env
cp .env.chat ./frontends/chat/.env
cp .env.search ./frontends/search/.env
cp .env.server ./server/.env
cp .env.dashboard ./frontends/dashboard/.env
Добавьте свой LLM_API_KEY
в ./server/.env
Вот руководство по его приобретению.
Действия, когда у вас есть ключ
- Откройте файл
./server/.env
- Замените значение
LLM_API_KEY
на свой собственный ключ API OpenAI. - Замените значение
OPENAI_API_KEY
на свой собственный ключ API OpenAI.
Запустите службы контейнеров докеров, необходимые для локальной разработки.
cat .env.chat .env.search .env.server .env.docker-compose > .env
./convenience.sh -l
Запустить службы для локальной разработки
Мы рекомендуем управлять этим через tmuxp, см. руководство здесь или вкладки терминала.
cd clients/ts-sdk
yarn build
cd frontends
yarn
yarn dev
cd server
cargo watch -x run
cd server
cargo run --bin ingestion-worker
cd server
cargo run --bin file-worker
cd server
cargo run --bin delete-worker
Проверьте рабочую настройку
- убедитесь, что вы видите redoc со ссылкой OpenAPI на localhost: 8090/redoc
- создать учетную запись, создать набор данных с тестовыми данными на локальном хосте: 5173
- найдите этот набор данных с тестовыми данными на локальном хосте: 5174
Отладка проблем с помощью локальной разработки
Обратитесь к нам в Discord за помощью. Мы доступны и более чем рады помочь.
Отладка дизельного топлива путем получения точно сгенерированного SQL-запроса.
diesel::debug_query(&query).to_string();
Локальная настройка для тестирования функций полосы
Установите Stripe CLI.
-
stripe login
-
stripe listen --forward-to localhost:8090/api/stripe/webhook
- установите
STRIPE_WEBHOOK_SECRET
на server/.env
в полученный секрет подписи веб-перехватчика -
stripe products create --name trieve --default-price-data.unit-amount 1200 --default-price-data.currency usd
-
stripe plans create --amount=1200 --currency=usd --interval=month --product={id from response of step 3}
Авторы