genai system evaluation
1.0.0
このリポジトリには、LLM 拡張システムを評価する方法を示すサンプル ノートブックが含まれています。ローカル評価のためのツールと方法を提供します。
これらのノートブックは Python 3.12 でテストされました。ローカルで実行している場合は、3.12 を使用していることを確認してください。また、デフォルトのプロファイルに設定する認証情報を使用して AWS CLI がセットアップされていることを確認してください。これらの認証情報は Amazon Bedrock モデルにアクセスする必要があります
LLM-System-Validation/
├── data/ # RAG context and validation datasets
├── example-notebooks/ # Notebooks for evaluating various components
|__ script/ # Various scripts for setting up environment.
|__ .github/ # Example github actions
data/
: 検索拡張生成 (RAG) コンテキストと検証に使用されるデータセットが含まれます。example-notebooks/
: 以下の評価を示す Jupyter ノートブック:リポジトリのクローンを作成します。
git clone [email protected]:aws-samples/genai-system-evaluation.git
cd genai-system-evaluation
仮想環境をセットアップします。
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
必要な依存関係をインストールします。
pip install -r requirements.txt
RAG コンテキストの opensearch ドキュメントをダウンロードします。
$ cd data && mkdir opensearch-docs && cd opensearch-docs
$ git clone https://github.com/opensearch-project/documentation-website.git
ノートブックの例に移動して、jupyter ノートブックを開始してください。
$ cd ../../example-notebooks
$ jupyter notebook
ノートブック 1 から始めて、順番に進めていきます。
example-notebooks/
ディレクトリ内のサンプル ノートブックを調べて、さまざまな評価手法を理解してください。 詳細については、「貢献」を参照してください。
このライブラリは、MIT-0 ライセンスに基づいてライセンスされています。 LICENSE ファイルを参照してください。