qevals
1.0.0
Evals adalah pembuatan data sintetis dan kerangka evaluasi untuk aplikasi LLM dan RAG.
Ini memiliki 2 modul utama:
Diagram evals arsitektur tingkat tinggi adalah sebagai berikut:
Diagram arsitektur
Untuk memulai evals, ikuti langkah-langkah berikut:
pip install -r requirements.txt
di direktori proyek.config/config.toml.template
dan beri nama config/config.toml
.config.toml
:MISC
DATAGEN
DATA_DIR
mengontrol lokasi korpus data tempat menghasilkan data sintetis, relatif terhadap direktori datagen/data/
. Dengan kata lain, tambahkan direktori data Anda di sana dan tentukan namanya di variabel.GEN_PROVIDER
memungkinkan pemilihan antara azure
atau vertex
.DATAEVAL
EVAL_TESTS
menawarkan daftar tes evaluasi yang didukung oleh kerangka kerja. Opsi yang mungkin adalah AnswerRelevancy
, Hallucination
, Faithfulness
, Bias
, Toxicity
, Correctness
, Coherence
, PromptInjection
, PromptBreaking
, PromptLeakage
.EVAL_RPVODER
memungkinkan memilih antara azure
atau vertex
.Untuk menjalankan modul pembuatan data sintetis:
Ubah/sesuaikan contoh klien yang disediakan ( datagen/client.py
)
Jalankan python -m datagen.client
Data yang dihasilkan secara sintetis akan disimpan di direktori datagen/qa_out/
sebagai file CSV dengan format:
```csv
question,context,ground_truth
```
Untuk menjalankan modul eval:
eval/client.py
)question
, context
, ground_truth
).ground_truth
mungkin digunakan atau tidak tergantung pada pengaturan use_answers_from_dataset
. Jika disetel ke False
kolom data tersebut akan diabaikan dan menghasilkan keluaran baru menggunakan model generatif yang dikonfigurasi.mlflow ui --port 5000
python -m eval.client