qevals
1.0.0
Evals 是一個適用於法學碩士和 RAG 應用程式的綜合資料生成和評估框架。
它有2個主要模組:
evals 的高階架構圖如下:
架構圖
若要開始使用評估,請依照下列步驟操作:
pip install -r requirements.txt
安裝必要的依賴項。config/config.toml.template
的副本並命名為config/config.toml
。config.toml
檔案中的 2 個部分:MISC
DATAGEN
DATA_DIR
變數控制產生合成資料的資料語料庫的位置,它相對於datagen/data/
目錄。換句話說,在其中添加資料目錄並在變數中指定它們的名稱。GEN_PROVIDER
變數允許在azure
或vertex
之間進行選擇。DATAEVAL
EVAL_TESTS
提供框架支援的評估測試清單。可能的選項有AnswerRelevancy
、 Hallucination
、 Faithfulness
、 Bias
、 Toxicity
、 Correctness
、 Coherence
、 PromptInjection
、 PromptBreaking
、 PromptLeakage
。EVAL_RPVODER
變數允許在azure
或vertex
之間進行選擇。若要運行合成資料生成模組:
修改/調整提供的範例用戶端 ( datagen/client.py
)
運行python -m datagen.client
綜合產生的資料將以 CSV 檔案形式儲存在datagen/qa_out/
目錄中,格式如下:
```csv
question,context,ground_truth
```
運行 eval 模組:
eval/client.py
)question
、 context
、 ground_truth
)。use_answers_from_dataset
可能會或可能不會使用ground_truth
。當設定為False
時,它將忽略該資料列並使用配置的生成模型產生新的輸出。mlflow ui --port 5000
python -m eval.client