Repositori ini berisi contoh buku catatan untuk mendemonstrasikan cara mengevaluasi sistem yang ditambah LLM. Panduan ini menyediakan alat dan metode untuk evaluasi lokal.
Notebook ini diuji dengan Python 3.12. Jika Anda menjalankan secara lokal, pastikan Anda menggunakan 3.12. Pastikan juga Anda memiliki pengaturan AWS CLI dengan kredensial yang ingin Anda atur ke profil default. Kredensial ini memerlukan akses ke Amazon Bedrock Models
LLM-System-Validation/
├── data/ # RAG context and validation datasets
├── example-notebooks/ # Notebooks for evaluating various components
|__ script/ # Various scripts for setting up environment.
|__ .github/ # Example github actions
data/
: Berisi kumpulan data yang digunakan untuk konteks dan validasi Retrieval-Augmented Generation (RAG).example-notebooks/
: Notebook Jupyter yang mendemonstrasikan evaluasi:Kloning repositori:
git clone [email protected]:aws-samples/genai-system-evaluation.git
cd genai-system-evaluation
Siapkan lingkungan virtual:
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Instal dependensi yang diperlukan:
pip install -r requirements.txt
Unduh dokumen opensearch untuk konteks RAG.
$ cd data && mkdir opensearch-docs && cd opensearch-docs
$ git clone https://github.com/opensearch-project/documentation-website.git
Buka contoh buku catatan & mulai buku catatan jupyter!
$ cd ../../example-notebooks
$ jupyter notebook
Mulailah dari buku catatan 1 dan selesaikan semuanya!
example-notebooks/
untuk memahami berbagai teknik evaluasi. Lihat KONTRIBUSI untuk informasi lebih lanjut.
Perpustakaan ini dilisensikan di bawah Lisensi MIT-0. Lihat file LISENSI.