Pilih Model - Di sini pengguna dapat memilih model obrolan parameter Llama3 70B ( llama-3-70b
)
Pilih Suhu (Keacakan Respons) - Di sini pengguna dapat menskalakan keacakan respons model. Angka yang lebih rendah memastikan jawaban yang lebih mendekati dan obyektif, sedangkan angka yang lebih tinggi mendorong kreativitas model.
Pilih Jumlah Token (Length of Response) - Disini telah disediakan beberapa pilihan. Jumlah token yang digunakan pengguna berkorelasi langsung dengan lamanya respons yang dikembalikan model.
Pertanyaan - Seperti kedengarannya; disinilah pengguna dapat memberikan pertanyaan kepada model
Respons - Ini adalah respons yang dihasilkan oleh model berdasarkan konteks dalam database vektor Anda. Perhatikan bahwa jika pertanyaan tidak dapat berkorelasi dengan konten dalam basis pengetahuan Anda, Anda mungkin mendapatkan tanggapan halusinasi.
direktori app
menghosting FastAPI untuk LLM Anda
direktori chat-ui
menghosting kode untuk Chatbot UI.
Lihat Variabel saat Men-deploy AMP. Rujuk Dokumen Inferensi AI Cloduera untuk Mendapatkan Titik akhir dan Kunci Inferensi.
JupyterLab - Python 3.11 - GPU Nvidia
https://docs.cloudera.com/machine-learning/cloud/applied-ml-prototypes/topics/ml-amp-project-spec.html
Hal ini menciptakan beban kerja berikut dengan persyaratan sumber daya:
2 CPU, 16GB MEM
2 CPU, 8GB MEM
2 CPU, 1 GPU, 16GB MEM
doc-genius-ai/
├── app/ # Application directory for API and Model Serving
│ └── [..subdirs..]
│ └── chatbot/ # has the model serving python files for RAG, Prompt, Fine-tuning models
│ └── main.py # main.py file to start the API
├── chat-ui/ # Directory for the chatbot UI in Next.js
│ └── [..subdirs..]
│ └── app.py # app.py file to serve build files in .next directory via Flask
├── pipeline/ # Pipeline directory for data processing or workflow pipelines and vector load
├── data/ # Data directory for storing datasets or data files or RAG KB
├── models/ # Models directory for LLMs / ML models
├── session/ # Scripts for CML Sessions and Validation Tasks
├── images/ # Directory for storing project related images
├── api.md # Documentation for the APIs
├── README.md # Detailed description of the project
├── .gitignore # Specifies intentionally untracked files to ignore
├── catalog.yaml # YAML file that contains descriptive information and metadata for the displaying the AMP projects in the CML Project Catalog.
├─ .project-metadata.yaml # Project metadata file that provides configuration and setup details
├── cdsw-build.sh # Script for building the Model dependencies
└── requirements.txt # Python dependencies for Model Serving
PENTING: Harap baca yang berikut ini sebelum melanjutkan. AMP ini mencakup atau bergantung pada paket perangkat lunak pihak ketiga tertentu. Informasi tentang paket perangkat lunak pihak ketiga tersebut tersedia dalam file pemberitahuan yang terkait dengan AMP ini. Dengan mengonfigurasi dan meluncurkan AMP ini, Anda akan menyebabkan paket perangkat lunak pihak ketiga tersebut diunduh dan dipasang ke lingkungan Anda, dalam beberapa kasus, dari situs web pihak ketiga. Untuk setiap paket perangkat lunak pihak ketiga, silakan lihat file pemberitahuan dan situs web yang berlaku untuk informasi lebih lanjut, termasuk ketentuan lisensi yang berlaku.
Jika Anda tidak ingin mengunduh dan menginstal paket perangkat lunak pihak ketiga, jangan konfigurasikan, luncurkan, atau gunakan AMP ini. Dengan mengonfigurasi, meluncurkan, atau menggunakan AMP, Anda menyetujui pernyataan di atas dan menyetujui bahwa Cloudera tidak bertanggung jawab atau berkewajiban dengan cara apa pun atas paket perangkat lunak pihak ketiga.
Hak Cipta (c) 2024 - Cloudera, Inc. Semua hak dilindungi undang-undang.