Arsitektur yang dapat diterapkan berikut mengotomatiskan penerapan Pola AI generasi sampel di IBM Cloud, termasuk semua infrastruktur dasar IBM Cloud dan WatsonX. Arsitektur ini menerapkan praktik terbaik untuk penerapan Pola AI watsonx gen di IBM Cloud, seperti yang dijelaskan dalam arsitektur referensi.
Arsitektur yang dapat diterapkan ini memberikan landasan komprehensif untuk kepercayaan, kemampuan observasi, keamanan, dan kepatuhan terhadap peraturan. Arsitektur ini mengonfigurasi akun IBM Cloud agar selaras dengan pengaturan kepatuhan. Ini juga menerapkan layanan manajemen kunci dan manajemen rahasia serta infrastruktur untuk mendukung integrasi berkelanjutan (CI), pengiriman berkelanjutan (CD), dan saluran kepatuhan berkelanjutan (CC) untuk pengelolaan siklus hidup aplikasi yang aman. Ini juga menerapkan rangkaian layanan WatsonX dan IBM Cloud Elasticsearch untuk memfasilitasi pola RAG. Saluran pipa ini memfasilitasi penerapan aplikasi, memeriksa kerentanan dan kemampuan audit, serta membantu memastikan penerapan aplikasi AI generatif yang aman dan dapat dipercaya di IBM Cloud.
Dua variasi tersedia untuk arsitektur yang dapat diterapkan ini:
Variasi dasar:
Variasi standar:
Arsitektur yang dapat diterapkan ini dirancang untuk menampilkan penerapan otomatis sepenuhnya dari aplikasi generasi tambahan pengambilan melalui Proyek Cloud IBM. Ini memberikan landasan yang fleksibel dan dapat disesuaikan untuk aplikasi watsonx Anda sendiri di IBM Cloud. Arsitektur ini menerapkan contoh aplikasi berikut secara default.
Dengan menggunakan arsitektur ini, Anda dapat mempercepat penerapan dan menyesuaikannya untuk memenuhi kebutuhan bisnis dan tujuan perusahaan Anda.
Arsitektur ini dapat membantu Anda mencapai tujuan berikut:
Sebelum Anda menyebarkan arsitektur yang dapat diterapkan, pastikan Anda menyelesaikan tindakan berikut:
Penting
Anda harus menggunakan kunci API yang dikaitkan dengan pengguna. Anda tidak dapat menggunakan kunci ID layanan atau profil tepercaya.
Salin nilai kunci API. Anda membutuhkannya dalam langkah-langkah berikut.
Di lingkungan pengujian atau evaluasi, Anda dapat memberikan peran Administrator pada layanan berikut
User API key creator
, karena peran tersebut wajib untuk keberhasilan penerapan kluster OpenShift.Untuk membatasi akses pada lingkungan produksi, lihat tingkat izin minimum di tab izin arsitektur yang dapat diterapkan ini.
gpg --gen-key
tanpa frasa sandi (jika belum kedaluwarsa, Anda dapat menggunakan kunci yang dibuat sebelumnya).gpg --export-secret-key <email address> | base64
. Untuk informasi lebih lanjut tentang penyimpanan kunci, lihat Membuat kunci GPG.Tambahkan nama dan deskripsi.
Pilih wilayah dan grup sumber daya untuk proyek tersebut. Misalnya, untuk tujuan evaluasi, Anda dapat memilih wilayah yang paling dekat dengan Anda dan grup sumber daya default.
Untuk informasi selengkapnya tentang struktur akun perusahaan, lihat buku putih akun Administrasi Pusat.
Masukkan nama konfigurasi. Misalnya, "RAG", "dev", atau "prod". Nama tersebut nantinya dapat membantu Anda untuk menyesuaikan target penerapan Anda.
Anda sekarang dapat membuat konfigurasi dengan mengatur variabel.
Dari panel Keamanan , pilih metode autentikasi yang ingin Anda gunakan untuk menyebarkan arsitektur Anda.
Tambahkan kunci API dari prasyarat di Sebelum Anda mulai.
Di tab Keamanan > Autentikasi di bagian Konfigurasi , pilih kunci API.
Masukkan nilai untuk bidang yang wajib diisi dari tab Wajib .
Tinjau nilai untuk bidang opsional dari tab Opsional :
signing_key
dari prasyarat di Sebelum Anda mulai.Klik Simpan . Setelah nilai masukan divalidasi, tombol berubah menjadi Lihat konfigurasi tumpukan .
Anda dapat menerapkan arsitektur bertumpuk yang dapat diterapkan melalui konsol IBM Cloud dengan dua cara:
Dengan menggunakan Penyebaran Otomatis : Metode penerapan dapat berguna untuk lingkungan demonstrasi dan nonproduksi. Dengan penerapan otomatis, semua konfigurasi anggota tumpukan divalidasi, lalu disetujui dan diterapkan.
Anda dapat memeriksa pengaturan Penerapan otomatis untuk proyek Anda dengan mengklik Kelola > Pengaturan . Dengan mengaktifkan Penerapan Otomatis, Anda mengaktifkan pengaturan untuk semua konfigurasi dalam proyek.
Secara individual dengan menerapkan setiap konfigurasi anggota. Metode manual cocok untuk proyek yang memiliki lingkungan produksi. Anda dapat meninjau perubahan di setiap konfigurasi anggota sebelum otomatisasi dijalankan.
Tip
Setelah menyetujui konfigurasi, Anda mungkin menerima pesan kesalahan "Tidak dapat memvalidasi konfigurasi Anda". Untuk mengatasi masalah ini, segarkan browser Anda.
Anda mungkin melihat notifikasi "Versi baru tersedia" di kolom Perlu Perhatian di konfigurasi proyek Anda. Anda dapat mengabaikan pesan-pesan ini karena pesan-pesan ini tidak mencegah Anda menyebarkan tumpukan.
Klik ikon Opsi di sebelah Lihat konfigurasi tumpukan dan klik Validasi .
Jika pengaturan Penyebaran otomatis tidak aktif di proyek Anda, hanya konfigurasi anggota yang siap yang divalidasi.
Di proyek Anda, klik tab Konfigurasi .
Jika konfigurasi anggota pertama tumpukan ( Account Infrastructure Base
) tidak ditandai sebagai Siap untuk divalidasi , segarkan halaman di browser Anda.
Klik Validasi dalam status Draf di baris Account Infrastructure Base
.
Setujui konfigurasi dan klik Deploy setelah validasi berhasil diselesaikan.
Setelah Anda menerapkan konfigurasi anggota awal, Anda dapat memvalidasi dan menerapkan konfigurasi anggota yang tersisa secara bersamaan. Ulangi langkah-langkah penerapan ini untuk setiap konfigurasi anggota dalam arsitektur.
Arsitektur penerapan Retrieval Augmented Generation Pattern yang dapat diterapkan kini diterapkan di akun target.
Setelah arsitektur disebarkan, aplikasi sampel dimulai di layanan DevOps yang baru disediakan.
Untuk memantau pembuatan dan penerapan aplikasi, ikuti langkah-langkah berikut:
resource_group_name
dari arsitektur yang dapat diterapkan.Workload - Sample RAG App Configuration
.Outputs
, URL ke aplikasi yang diterapkan tercantum di bawah output sample_app_public_url
. Untuk meminimalkan biaya, otomatisasi menerapkan paket harga Uji Coba dari Secrets Manager. Anda hanya dapat membuat satu contoh Uji Coba Secrets Manager. Anda dapat menyebarkan instans paket Standar Secrets Manager dari pengaturan Opsional tumpukan.
Untuk memperbaikinya, hapus contoh uji coba. Setelah dihapus, hapus juga layanan dari status reklamasi.
Di IBM Cloud, saat Anda menghapus sumber daya, sumber daya tersebut tidak langsung hilang. Sebaliknya, ia memasuki kondisi reklamasi, yang bertahan dalam waktu singkat (biasanya 7 hari) sebelum dihapus secara permanen. Selama status reklamasi, Anda dapat memulihkan sumber daya, jika diperlukan.
Jalankan perintah IBM Cloud CLI berikut untuk menghapus layanan dari status reklamasi.
Perintah pertama mencantumkan semua sumber daya dalam kondisi reklamasi.
# List all the resources in reclamation state with its reclamation ID
ibmcloud resource reclamations
Temukan ID reklamasi layanan Secrets Manager. Gunakan ID itu dalam perintah berikut.
ibmcloud resource reclamation-delete < reclamation-id >
Masalah khusus ini dapat terjadi ketika penerapan ALM/rantai alat Anda lebih dari 14 hari dan konfigurasi aplikasi DA telah dibatalkan/disebarkan ulang. Hal ini disebabkan oleh layanan Pengiriman Berkelanjutan yang diperlukan untuk membuat dan menghapus properti alur, dan penerapan terjadi ketika layanan CD mungkin tidak ada. Kami sedang mengerjakan solusi jangka panjang untuk bug ini, namun untuk sementara, bug ini dapat diatasi dengan memastikan keberadaan layanan CD di grup sumber daya tempat rantai alat diharapkan dibuat.
Masalah akan terjadi pada arsitektur yang dapat diterapkan Workload - Sample RAG App Configuration
, dalam variasi Mesin Kode dan OCP. Kesalahan biasanya berisi pesan ini:
"errors": [
{
"code": 403,
"message": "Continuous Delivery service required"
}
]
Banyak penyesuaian yang dimungkinkan dengan arsitektur ini. Ini adalah beberapa pilihan umum.
Setiap konfigurasi anggota mencakup sejumlah besar parameter masukan. Anda dapat mengedit konfigurasi untuk mengubah nilai default.
Misalnya, dengan mengedit konfigurasi anggota, Anda dapat melakukan hal berikut:
Untuk mengedit konfigurasi anggota, pilih Edit dari ikon Opsi di baris konfigurasi anggota.
Anda dapat menghapus konfigurasi anggota dari tumpukan yang tidak bergantung pada konfigurasi lain.
Anda dapat menghapus konfigurasi berikut dalam arsitektur ini:
Untuk menghapus konfigurasi anggota, pilih Hapus dari Stack dari ikon Opsi di baris konfigurasi anggota.
Anda dapat menambah atau menghapus variabel masukan dan keluaran pada tingkat tumpukan dengan mengikuti langkah-langkah berikut:
Anda dapat secara selektif menyediakan sumber daya observabilitas seperti rute dan target Pelacak Aktivitas, serta instance Cloud Monitoring dengan mengikuti langkah-langkah berikut:
cloud_logs_provision
): Atur ini untuk menyediakan atau melewati penyediaan mesin virtual IBM Cloud Logs.cloud_monitoring_provision
): Atur ini untuk menyediakan atau melewatkan penyediaan mesin virtual pemantauan cloud IBM.enable_at_event_routing_to_cos_bucket
): Setel ini untuk mengaktifkan atau menonaktifkan perutean peristiwa dari Pelacak Aktivitas ke keranjang Penyimpanan Objek.enable_at_event_routing_to_cloud_logs
): Setel ini untuk mengaktifkan atau menonaktifkan perutean peristiwa dari Pelacak Aktivitas ke Log Cloud.Setelah Anda memodifikasi arsitektur yang dapat diterapkan dalam proyek, Anda dapat membagikannya dengan orang lain melalui katalog IBM Cloud pribadi. Untuk membagikan arsitektur yang dapat diterapkan, ikuti langkah-langkah dalam Berbagi arsitektur yang dapat diterapkan ke perusahaan Anda.
Anda dapat menggunakan kode otomatisasi sampel ini sebagai panduan untuk menyesuaikan aplikasi sampel agar memenuhi kebutuhan Anda. Kode tersedia di https://github.com/terraform-ibm-modules/terraform-ibm-rag-sample-da.
Untuk menggunakan aplikasi Anda sendiri, hapus konfigurasi anggota Workload - Sample RAG App Configuration
dari tumpukan. Konfigurasi anggota ini khusus untuk aplikasi sampel default.
Bersihkan konfigurasi
Langkah ini opsional jika Anda berencana menghancurkan semua sumber daya Watson. Artefak yang dibuat oleh aplikasi dihapus sebagai bagian dari pembatalan penerapan sumber daya Watson.
Ikuti langkah-langkah yang dijelaskan dalam file cleanup.md untuk menghapus konfigurasi aplikasi sampel.
Hapus sumber daya yang dibuat oleh rantai alat CI
Sumber daya berikut, yang dibuat oleh rantai alat, tidak dimusnahkan sebagai bagian dari pembatalan penerapan tumpukan di Project.
Hapus proyek.
Untuk membatalkan penerapan infrastruktur yang dibuat oleh arsitektur yang dapat diterapkan, ikuti langkah-langkah dalam Menghapus proyek di dokumen IBM Cloud.