qevals
1.0.0
Evals は、LLM および RAG アプリケーション用の合成データ生成および評価フレームワークです。
2 つの主要なモジュールがあります。
evals の高レベルのアーキテクチャ図は次のとおりです。
アーキテクチャ図
eval を開始するには、次の手順に従います。
pip install -r requirements.txt
実行して、必要な依存関係をインストールします。config/config.toml.template
のコピーを作成し、 config/config.toml
名前を付けます。config.toml
ファイル内の 2 つのセクションを更新します。MISC
DATAGEN
DATA_DIR
変数は、合成データを生成するデータ コーパスの場所を制御します。この場所は、 datagen/data/
ディレクトリを基準にしています。つまり、そこにデータ ディレクトリを追加し、変数にその名前を指定します。GEN_PROVIDER
変数を使用すると、 azure
またはvertex
を選択できます。DATAEVAL
EVAL_TESTS
フレームワークでサポートされている評価テストのリストを提供します。可能なオプションは、 AnswerRelevancy
、 Hallucination
、 Faithfulness
、 Bias
、 Toxicity
、 Correctness
、 Coherence
、 PromptInjection
、 PromptBreaking
、 PromptLeakage
です。EVAL_RPVODER
変数を使用すると、 azure
またはvertex
を選択できます。合成データ生成モジュールを実行するには:
提供されているサンプル クライアント ( datagen/client.py
) を変更/適応させます。
python -m datagen.client
を実行します。
合成的に生成されたデータは、次の形式の CSV ファイルとしてdatagen/qa_out/
ディレクトリに保存されます。
```csv
question,context,ground_truth
```
eval モジュールを実行するには:
eval/client.py
) を変更/適応させます。question
、 context
、 ground_truth
) によって生成されたデータの形式と一致する必要があります。ground_truth
、 use_answers_from_dataset
設定に応じて使用される場合と使用されない場合があります。 False
に設定すると、そのデータ列が無視され、構成された生成モデルを使用して新しい出力が生成されます。mlflow ui --port 5000
python -m eval.client
を実行します。