เลือกรุ่น - ที่นี่ผู้ใช้สามารถเลือกรูปแบบการแชทพารามิเตอร์ Llama3 70B ( llama-3-70b
)
เลือกอุณหภูมิ (ความสุ่มของการตอบสนอง) - ที่นี่ผู้ใช้สามารถปรับขนาดการสุ่มของการตอบสนองของแบบจำลองได้ ตัวเลขที่ต่ำกว่าช่วยให้ได้คำตอบโดยประมาณและเป็นกลางมากขึ้น ในขณะที่ตัวเลขที่สูงกว่าจะช่วยส่งเสริมความคิดสร้างสรรค์ของโมเดล
เลือกจำนวนโทเค็น (ระยะเวลาในการตอบสนอง) - มีหลายตัวเลือกให้เลือก จำนวนโทเค็นที่ผู้ใช้ใช้มีความสัมพันธ์โดยตรงกับความยาวของการตอบสนองที่โมเดลส่งคืน
คำถาม - อย่างที่มันฟัง; นี่คือจุดที่ผู้ใช้สามารถตั้งคำถามกับโมเดลได้
การตอบสนอง - นี่คือการตอบสนองที่สร้างโดยโมเดลโดยคำนึงถึงบริบทในฐานข้อมูลเวกเตอร์ของคุณ โปรดทราบว่าหากคำถามไม่สามารถเชื่อมโยงกับเนื้อหาในฐานความรู้ของคุณได้ คุณอาจได้รับคำตอบที่หลอนประสาท
ไดเรกทอรี app
โฮสต์ FastAPI สำหรับ LLM ของคุณ
ไดเร็กทอรี chat-ui
โฮสต์โค้ดสำหรับ Chatbot UI
ดูตัวแปรเมื่อปรับใช้ AMP อ้างอิงเอกสารการอนุมาน Cloduera AI เพื่อรับตำแหน่งข้อมูลและคีย์การอนุมาน
JupyterLab - Python 3.11 - Nvidia GPU
https://docs.cloudera.com/machine-learning/cloud/applied-ml-prototypes/topics/ml-amp-project-spec.html
สิ่งนี้จะสร้างปริมาณงานต่อไปนี้พร้อมกับความต้องการทรัพยากร:
2 CPU, 16GB MEM
2 CPU, 8GB MEM
2 CPU, 1 GPU, 16GB MEM
doc-genius-ai/
├── app/ # Application directory for API and Model Serving
│ └── [..subdirs..]
│ └── chatbot/ # has the model serving python files for RAG, Prompt, Fine-tuning models
│ └── main.py # main.py file to start the API
├── chat-ui/ # Directory for the chatbot UI in Next.js
│ └── [..subdirs..]
│ └── app.py # app.py file to serve build files in .next directory via Flask
├── pipeline/ # Pipeline directory for data processing or workflow pipelines and vector load
├── data/ # Data directory for storing datasets or data files or RAG KB
├── models/ # Models directory for LLMs / ML models
├── session/ # Scripts for CML Sessions and Validation Tasks
├── images/ # Directory for storing project related images
├── api.md # Documentation for the APIs
├── README.md # Detailed description of the project
├── .gitignore # Specifies intentionally untracked files to ignore
├── catalog.yaml # YAML file that contains descriptive information and metadata for the displaying the AMP projects in the CML Project Catalog.
├─ .project-metadata.yaml # Project metadata file that provides configuration and setup details
├── cdsw-build.sh # Script for building the Model dependencies
└── requirements.txt # Python dependencies for Model Serving
สิ่งสำคัญ: โปรดอ่านสิ่งต่อไปนี้ก่อนดำเนินการต่อ AMP นี้มีหรือขึ้นอยู่กับแพ็คเกจซอฟต์แวร์ของบุคคลที่สามบางแพ็คเกจ ข้อมูลเกี่ยวกับแพ็คเกจซอฟต์แวร์ของบุคคลที่สามดังกล่าวมีอยู่ในไฟล์ประกาศที่เกี่ยวข้องกับ AMP นี้ เมื่อกำหนดค่าและเปิดใช้งาน AMP นี้ คุณจะดาวน์โหลดและติดตั้งแพ็คเกจซอฟต์แวร์ของบุคคลที่สามดังกล่าวลงในสภาพแวดล้อมของคุณ ในบางกรณี จากเว็บไซต์ของบุคคลที่สาม สำหรับชุดซอฟต์แวร์ของบุคคลที่สามแต่ละชุด โปรดดูไฟล์ประกาศและเว็บไซต์ที่เกี่ยวข้องสำหรับข้อมูลเพิ่มเติม รวมถึงข้อกำหนดสิทธิ์การใช้งานที่เกี่ยวข้อง
หากคุณไม่ต้องการดาวน์โหลดและติดตั้งแพ็คเกจซอฟต์แวร์ของบริษัทอื่น อย่ากำหนดค่า เปิดใช้งาน หรือใช้ AMP นี้ โดยการกำหนดค่า เปิดใช้งาน หรือใช้ AMP คุณรับทราบข้อความข้างต้น และยอมรับว่า Cloudera จะไม่รับผิดชอบหรือรับผิดในทางใดทางหนึ่งสำหรับแพ็คเกจซอฟต์แวร์ของบุคคลที่สาม
ลิขสิทธิ์ (c) 2024 - Cloudera, Inc. สงวนลิขสิทธิ์