選擇型號- 此處使用者可以選擇 Llama3 70B 參數聊天型號 ( llama-3-70b
)
選擇溫度(響應的隨機性) - 使用者可以在此處縮放模型響應的隨機性。較低的數字確保更近似、客觀的答案,而較高的數字則鼓勵模型創造力。
選擇令牌數量(回應長度) - 這裡提供了幾個選項。使用者使用的令牌數量與模型傳回的回應長度直接相關。
問題- 就像聽起來一樣;用戶可以在此處向模型提出問題
響應- 這是模型根據向量資料庫中的上下文產生的回應。請注意,如果問題與您知識庫中的內容無法關聯,您可能會得到幻覺答案。
app
目錄託管您的 LLM 的 FastAPI
chat-ui
目錄託管 Chatbot UI 的程式碼。
部署 AMP 時查看變數。請參閱 Cloduera AI 推理文件以取得推理端點和金鑰。
JupyterLab - Python 3.11 - Nvidia GPU
https://docs.cloudera.com/machine-learning/cloud/applied-ml-prototypes/topics/ml-amp-project-spec.html
這將建立以下具有資源需求的工作負載:
2 CPU, 16GB MEM
2 CPU, 8GB MEM
2 CPU, 1 GPU, 16GB MEM
doc-genius-ai/
├── app/ # Application directory for API and Model Serving
│ └── [..subdirs..]
│ └── chatbot/ # has the model serving python files for RAG, Prompt, Fine-tuning models
│ └── main.py # main.py file to start the API
├── chat-ui/ # Directory for the chatbot UI in Next.js
│ └── [..subdirs..]
│ └── app.py # app.py file to serve build files in .next directory via Flask
├── pipeline/ # Pipeline directory for data processing or workflow pipelines and vector load
├── data/ # Data directory for storing datasets or data files or RAG KB
├── models/ # Models directory for LLMs / ML models
├── session/ # Scripts for CML Sessions and Validation Tasks
├── images/ # Directory for storing project related images
├── api.md # Documentation for the APIs
├── README.md # Detailed description of the project
├── .gitignore # Specifies intentionally untracked files to ignore
├── catalog.yaml # YAML file that contains descriptive information and metadata for the displaying the AMP projects in the CML Project Catalog.
├─ .project-metadata.yaml # Project metadata file that provides configuration and setup details
├── cdsw-build.sh # Script for building the Model dependencies
└── requirements.txt # Python dependencies for Model Serving
重要提示:請在繼續之前閱讀以下內容。此 AMP 包含或以其他方式依賴某些第三方軟體包。有關此類第三方軟體包的資訊可在與此 AMP 關聯的通知文件中找到。透過設定和啟動此 AMP,您將導致此類第三方軟體包被下載並安裝到您的環境中(在某些情況下),從第三方網站。對於每個第三方軟體包,請參閱通知文件和適用的網站以獲取更多信息,包括適用的許可條款。
如果您不想下載和安裝第三方軟體包,請勿設定、啟動或以其他方式使用此 AMP。透過配置、啟動或以其他方式使用 AMP,即表示您承認上述聲明並同意 Cloudera 對第三方軟體包不以任何方式負責或承擔責任。
版權所有 (c) 2024 - Cloudera, Inc. 保留所有權利。