genai system evaluation
1.0.0
此儲存庫包含範例筆記本,用於示範如何評估 LLM 增強系統。它為本地評估提供了工具和方法。
這些筆記本使用 Python 3.12 進行了測試。如果您在本地運行,請確保您使用的是 3.12。另請確保您的 AWS CLI 設定包含您想要設定為預設設定檔的憑證。這些憑證需要存取 Amazon Bedrock 模型
LLM-System-Validation/
├── data/ # RAG context and validation datasets
├── example-notebooks/ # Notebooks for evaluating various components
|__ script/ # Various scripts for setting up environment.
|__ .github/ # Example github actions
data/
:包含用於檢索增強生成 (RAG) 上下文和驗證的資料集。example-notebooks/
:Jupyter 筆記本展示了以下評估:克隆儲存庫:
git clone [email protected]:aws-samples/genai-system-evaluation.git
cd genai-system-evaluation
設定虛擬環境:
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
安裝所需的依賴項:
pip install -r requirements.txt
下載 RAG 上下文的 opensearch 文件。
$ cd data && mkdir opensearch-docs && cd opensearch-docs
$ git clone https://github.com/opensearch-project/documentation-website.git
前往筆記本範例並啟動 jupyter 筆記本!
$ cd ../../example-notebooks
$ jupyter notebook
從筆記本 1 開始,逐步完成它們!
example-notebooks/
目錄中的範例筆記本以了解不同的評估技術。 請參閱貢獻以獲取更多資訊。
該庫根據 MIT-0 許可證獲得許可。請參閱許可證文件。