В этом репозитории содержатся образцы блокнотов, демонстрирующие, как оценивать систему, дополненную LLM. Он предоставляет инструменты и методы для локальной оценки.
Эти ноутбуки были протестированы с использованием Python 3.12. Если вы работаете локально, убедитесь, что вы используете версию 3.12. Также убедитесь, что у вас есть настройка AWS CLI с учетными данными, которые вы хотите установить в профиле по умолчанию. Для этих учетных данных необходим доступ к моделям Amazon Bedrock.
LLM-System-Validation/
├── data/ # RAG context and validation datasets
├── example-notebooks/ # Notebooks for evaluating various components
|__ script/ # Various scripts for setting up environment.
|__ .github/ # Example github actions
data/
: содержит наборы данных, используемые для контекста и проверки расширенной генерации (RAG).example-notebooks/
: блокноты Jupyter, демонстрирующие оценку:Клонируем репозиторий:
git clone [email protected]:aws-samples/genai-system-evaluation.git
cd genai-system-evaluation
Настройте виртуальную среду:
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Установите необходимые зависимости:
pip install -r requirements.txt
Загрузите документацию opensearch для контекста RAG.
$ cd data && mkdir opensearch-docs && cd opensearch-docs
$ git clone https://github.com/opensearch-project/documentation-website.git
Перейдите к примерам блокнотов и запустите блокноты Jupyter!
$ cd ../../example-notebooks
$ jupyter notebook
Начните с тетради 1 и проработайте их!
example-notebooks/
чтобы понять различные методы оценки. См. ВКЛАД для получения дополнительной информации.
Эта библиотека лицензируется по лицензии MIT-0. См. файл ЛИЦЕНЗИИ.