genai system evaluation
1.0.0
พื้นที่เก็บข้อมูลนี้มีสมุดบันทึกตัวอย่างเพื่อสาธิตวิธีประเมินระบบเสริม LLM มีเครื่องมือและวิธีการประเมินในท้องถิ่น
โน้ตบุ๊กเหล่านี้ได้รับการทดสอบด้วย Python 3.12 หากคุณใช้งานในเครื่อง ตรวจสอบให้แน่ใจว่าคุณใช้ 3.12 นอกจากนี้ ตรวจสอบให้แน่ใจว่าคุณมีการตั้งค่า AWS CLI ด้วยข้อมูลรับรองที่คุณต้องการตั้งค่าเป็นโปรไฟล์เริ่มต้น ข้อมูลประจำตัวเหล่านี้จำเป็นต้องเข้าถึงโมเดล Amazon Bedrock
LLM-System-Validation/
├── data/ # RAG context and validation datasets
├── example-notebooks/ # Notebooks for evaluating various components
|__ script/ # Various scripts for setting up environment.
|__ .github/ # Example github actions
data/
: ประกอบด้วยชุดข้อมูลที่ใช้สำหรับบริบทการเรียกข้อมูล-Augmented Generation (RAG) และการตรวจสอบความถูกต้องexample-notebooks/
: สมุดบันทึก Jupyter สาธิตการประเมิน:โคลนที่เก็บ:
git clone [email protected]:aws-samples/genai-system-evaluation.git
cd genai-system-evaluation
ตั้งค่าสภาพแวดล้อมเสมือน:
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
ติดตั้งการพึ่งพาที่จำเป็น:
pip install -r requirements.txt
ดาวน์โหลดเอกสาร opensearch สำหรับบริบท RAG
$ cd data && mkdir opensearch-docs && cd opensearch-docs
$ git clone https://github.com/opensearch-project/documentation-website.git
ไปที่ตัวอย่างสมุดบันทึกและเริ่มสมุดบันทึก jupyter!
$ cd ../../example-notebooks
$ jupyter notebook
เริ่มต้นที่สมุดบันทึก 1 และทำงานผ่านมัน!
example-notebooks/
เพื่อทำความเข้าใจเทคนิคการประเมินต่างๆ ดูการมีส่วนร่วมสำหรับข้อมูลเพิ่มเติม
ห้องสมุดนี้ได้รับอนุญาตภายใต้ใบอนุญาต MIT-0 ดูไฟล์ใบอนุญาต