Insurance Query engine
1.0.0
使用的模型是“BAAI/bge-base-en-v1.5”,来自拥抱脸
要在 Docker 容器中运行 Qdrant,请执行以下步骤:
拉取 Qdrant Docker 镜像:
docker pull qdrant/qdrant
运行 Qdrant 容器:
docker run -p 6333:6333 qdrant/qdrant
在运行任何脚本之前,请确保安装了所有必需的 Python 库:
pip install -r requirements.txt
ingest.py 脚本处理 Insurance_Handbook.pdf PDF 文档,从文本生成矢量嵌入,并将这些嵌入存储在 Qdrant 矢量数据库中。
工作原理: 加载 PDF:读取指定 PDF 文件的内容。分割文本:将文本分割成可管理的块以生成嵌入。每个块可能会稍微重叠以保留上下文。生成嵌入:使用预先训练的模型将每个文本块转换为向量嵌入。存储在 Qdrant 中:将生成的嵌入及其相应的文本存储在 Qdrant 矢量数据库中。用法:运行以下命令来处理数据并将其摄取到 Qdrant 中:
python ingest.py
app.py 脚本用于查询 Qdrant 矢量数据库,以根据用户提供的查询检索文档。
工作原理:嵌入查询:使用与文档嵌入相同的模型将输入查询转换为向量嵌入。相似性搜索:将查询嵌入与 Qdrant 中存储的嵌入进行比较,以查找最相似的文档。返回结果:根据相似度分数检索并显示最匹配的文档。使用方法:执行以下命令开始查询:
python app.py
确保 Qdrant 容器正在运行并且已使用 ingest.py 脚本摄取数据。