Insurance Query engine
1.0.0
使用的模型是“BAAI/bge-base-en-v1.5”,來自擁抱臉
若要在 Docker 容器中執行 Qdrant,請執行下列步驟:
拉取 Qdrant Docker 映像:
docker pull qdrant/qdrant
運行 Qdrant 容器:
docker run -p 6333:6333 qdrant/qdrant
在運行任何腳本之前,請確保安裝了所有必需的 Python 庫:
pip install -r requirements.txt
ingest.py 腳本處理 Insurance_Handbook.pdf PDF 文檔,從文字產生向量嵌入,並將這些嵌入儲存在 Qdrant 向量資料庫中。
工作原理: 載入 PDF:讀取指定 PDF 檔案的內容。分割文字:將文字分割成可管理的區塊以產生嵌入。每個區塊可能會稍微重疊以保留上下文。生成嵌入:使用預先訓練的模型將每個文字區塊轉換為向量嵌入。儲存在 Qdrant 中:將產生的嵌入及其對應的文字儲存在 Qdrant 向量資料庫中。用法:執行以下命令來處理資料並將其攝取到 Qdrant 中:
python ingest.py
app.py 腳本用於查詢 Qdrant 向量資料庫,以根據使用者提供的查詢檢索文件。
工作原理:嵌入查詢:使用與文件嵌入相同的模型將輸入查詢轉換為向量嵌入。相似性搜尋:將查詢嵌入與 Qdrant 中儲存的嵌入進行比較,以尋找最相似的文件。傳回結果:根據相似度分數檢索並顯示最符合的文件。使用方法:執行以下命令開始查詢:
python app.py
確保 Qdrant 容器正在運作並且已使用 ingest.py 腳本攝取資料。