สถาปัตยกรรมที่ปรับใช้ได้ต่อไปนี้ทำให้การปรับใช้รูปแบบ AI เจนเนอเรชั่นตัวอย่างบน IBM Cloud เป็นแบบอัตโนมัติ รวมถึงโครงสร้างพื้นฐาน IBM Cloud และ WatsonX พื้นฐานทั้งหมด สถาปัตยกรรมนี้ใช้แนวทางปฏิบัติที่ดีที่สุดสำหรับการปรับใช้รูปแบบ AI ของ watsonx gen บน IBM Cloud ตามที่อธิบายไว้ในสถาปัตยกรรมอ้างอิง
สถาปัตยกรรมที่ปรับใช้ได้นี้มอบรากฐานที่ครอบคลุมสำหรับความน่าเชื่อถือ ความสามารถในการสังเกต ความปลอดภัย และการปฏิบัติตามกฎระเบียบ สถาปัตยกรรมกำหนดค่าบัญชี IBM Cloud ให้สอดคล้องกับการตั้งค่าการปฏิบัติตามข้อกำหนด นอกจากนี้ยังปรับใช้บริการการจัดการคีย์และการจัดการความลับและโครงสร้างพื้นฐานเพื่อรองรับการบูรณาการอย่างต่อเนื่อง (CI) การส่งมอบอย่างต่อเนื่อง (CD) และไปป์ไลน์การปฏิบัติตามข้อกำหนดอย่างต่อเนื่อง (CC) เพื่อการจัดการวงจรชีวิตของแอปพลิเคชันอย่างปลอดภัย นอกจากนี้ยังปรับใช้ชุดบริการ WatsonX และ IBM Cloud Elasticsearch เพื่ออำนวยความสะดวกให้กับรูปแบบ RAG ไปป์ไลน์เหล่านี้อำนวยความสะดวกในการปรับใช้แอปพลิเคชัน ตรวจสอบช่องโหว่และการตรวจสอบ และช่วยให้มั่นใจถึงการใช้งานแอปพลิเคชัน AI ที่สร้างไว้อย่างปลอดภัยและเชื่อถือได้บน IBM Cloud
มีสองรูปแบบให้เลือกสำหรับสถาปัตยกรรมที่ปรับใช้ได้นี้:
รูปแบบพื้นฐาน:
รูปแบบมาตรฐาน:
สถาปัตยกรรมที่ปรับใช้ได้นี้ได้รับการออกแบบเพื่อแสดงการใช้งานแบบอัตโนมัติเต็มรูปแบบของแอปพลิเคชันการสร้างเสริมการดึงข้อมูลผ่าน IBM Cloud Projects โดยให้รากฐานที่ยืดหยุ่นและปรับแต่งได้สำหรับแอปพลิเคชัน watsonx ของคุณเองบน IBM Cloud สถาปัตยกรรมนี้ปรับใช้แอปพลิเคชันตัวอย่างต่อไปนี้ตามค่าเริ่มต้น
ด้วยการใช้สถาปัตยกรรมนี้ คุณสามารถเร่งการปรับใช้และปรับแต่งให้ตรงกับความต้องการทางธุรกิจและเป้าหมายขององค์กรได้
สถาปัตยกรรมนี้สามารถช่วยให้คุณบรรลุเป้าหมายต่อไปนี้:
ก่อนที่คุณจะปรับใช้สถาปัตยกรรมที่ปรับใช้ได้ ตรวจสอบให้แน่ใจว่าคุณได้ดำเนินการต่อไปนี้:
สำคัญ
คุณต้องใช้คีย์ API ที่เชื่อมโยงกับผู้ใช้ คุณไม่สามารถใช้คีย์รหัสบริการหรือโปรไฟล์ที่เชื่อถือได้
คัดลอกค่าของคีย์ API คุณต้องการมันในขั้นตอนต่อไปนี้
ในสภาพแวดล้อมการทดสอบหรือการประเมินผล คุณสามารถมอบบทบาทผู้ดูแลระบบในบริการต่อไปนี้ได้
User API key creator
อย่างชัดเจน เนื่องจากจำเป็นสำหรับการปรับใช้คลัสเตอร์ OpenShift ที่ประสบความสำเร็จหากต้องการกำหนดขอบเขตการเข้าถึงให้เข้มงวดยิ่งขึ้นสำหรับสภาพแวดล้อมการใช้งานจริง โปรดดูระดับสิทธิ์ขั้นต่ำในแท็บสิทธิ์ของสถาปัตยกรรมที่ปรับใช้ได้นี้
gpg --gen-key
โดยไม่มีข้อความรหัสผ่าน (หากยังไม่หมดอายุ คุณสามารถใช้คีย์ที่สร้างไว้ก่อนหน้านี้ได้)gpg --export-secret-key <email address> | base64
. สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการจัดเก็บคีย์ โปรดดูที่การสร้างคีย์ GPGเพิ่มชื่อและคำอธิบาย
เลือกภูมิภาคและกลุ่มทรัพยากรสำหรับโครงการ ตัวอย่างเช่น เพื่อวัตถุประสงค์ในการประเมิน คุณสามารถเลือกภูมิภาคที่ใกล้เคียงที่สุดกับคุณและกลุ่มทรัพยากรเริ่มต้นได้
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโครงสร้างบัญชีองค์กร ดูเอกสารทางเทคนิคของบัญชีการดูแลจากส่วนกลาง
ป้อนชื่อการกำหนดค่า ตัวอย่างเช่น "RAG", "dev" หรือ "prod" ชื่อนี้สามารถช่วยคุณได้ในภายหลังเพื่อให้ตรงกับเป้าหมายการปรับใช้ของคุณ
ตอนนี้คุณสามารถสร้างการกำหนดค่าของคุณได้โดยการตั้งค่าตัวแปร
จากแผง ความปลอดภัย ให้เลือกวิธีการรับรองความถูกต้องที่คุณต้องการใช้เพื่อปรับใช้สถาปัตยกรรมของคุณ
เพิ่มคีย์ API จากข้อกำหนดเบื้องต้นในก่อนที่คุณจะเริ่มต้น
ในแท็บ ความปลอดภัย > การตรวจสอบสิทธิ์ ในส่วน กำหนดค่า ให้ เลือกคีย์ API
ป้อนค่าสำหรับฟิลด์ที่ต้องกรอกจากแท็บ Required
ตรวจสอบค่าสำหรับช่องที่ไม่บังคับจากแท็บ ตัวเลือก :
signing_key
จากสิ่งที่จำเป็นต้องมีใน ก่อนที่คุณจะเริ่มต้นคลิก บันทึก หลังจากตรวจสอบค่าอินพุตแล้ว ปุ่มจะเปลี่ยนเป็น ดูการกำหนดค่าสแต็ก
คุณสามารถปรับใช้สถาปัตยกรรมแบบสแต็กที่ปรับใช้ได้ผ่านคอนโซล IBM Cloud ได้สองวิธี:
โดยใช้ การปรับใช้อัตโนมัติ : วิธีการปรับใช้จะมีประโยชน์สำหรับสภาพแวดล้อมการสาธิตและไม่ใช่การใช้งานจริง ด้วยการปรับใช้อัตโนมัติ การกำหนดค่าสมาชิกสแต็กทั้งหมดจะได้รับการตรวจสอบ จากนั้นจึงอนุมัติและปรับใช้
คุณสามารถตรวจสอบการตั้งค่า การทำให้ใช้งานได้อัตโนมัติ สำหรับโปรเจ็กต์ของคุณโดยคลิก จัดการ > การตั้งค่า เมื่อเปิดการทำให้ใช้งานได้อัตโนมัติ คุณจะเปิดใช้งานการตั้งค่าสำหรับการกำหนดค่าทั้งหมดในโปรเจ็กต์
ทีละรายการโดยการปรับใช้การกำหนดค่าสมาชิกแต่ละรายการ วิธีการด้วยตนเองเหมาะสำหรับโครงการที่มีสภาพแวดล้อมการผลิต คุณสามารถตรวจสอบการเปลี่ยนแปลงในการกำหนดค่าสมาชิกแต่ละรายการก่อนที่จะเรียกใช้ระบบอัตโนมัติ
เคล็ดลับ
หลังจากที่คุณอนุมัติการกำหนดค่าแล้ว คุณอาจได้รับข้อความแสดงข้อผิดพลาด "ไม่สามารถตรวจสอบการกำหนดค่าของคุณได้" เพื่อแก้ไขปัญหานี้ ให้รีเฟรชเบราว์เซอร์ของคุณ
คุณอาจเห็นการแจ้งเตือน "เวอร์ชันใหม่พร้อมใช้งาน" ในคอลัมน์ Needs Attention ในการกำหนดค่าโปรเจ็กต์ของคุณ คุณสามารถละเว้นข้อความเหล่านี้ได้เนื่องจากไม่ได้ป้องกันคุณจากการปรับใช้สแต็ก
คลิกไอคอน ตัวเลือก ถัดจาก ดูการกำหนดค่าสแตก แล้วคลิก ตรวจสอบ
หากการตั้งค่า การทำให้ใช้งานได้อัตโนมัติ ปิดอยู่ในโปรเจ็กต์ของคุณ จะมีการตรวจสอบเฉพาะการกำหนดค่าสมาชิกที่พร้อมเท่านั้น
ในโปรเจ็กต์ของคุณ คลิกแท็บ การกำหนดค่า
หากการกำหนดค่าสมาชิกแรกของสแต็ก ( Account Infrastructure Base
) ไม่ได้ทำเครื่องหมายว่า Ready to validate ให้รีเฟรชเพจในเบราว์เซอร์ของคุณ
คลิก ตรวจสอบ สถานะแบบร่าง ในแถว Account Infrastructure Base
อนุมัติการกำหนดค่าแล้วคลิก ปรับใช้ หลังจากการตรวจสอบความถูกต้องเสร็จสมบูรณ์
หลังจากที่คุณปรับใช้การกำหนดค่าสมาชิกเริ่มต้น คุณสามารถตรวจสอบและปรับใช้การกำหนดค่าสมาชิกที่เหลือได้ในเวลาเดียวกัน ทำซ้ำขั้นตอนการปรับใช้เหล่านี้สำหรับการกำหนดค่าสมาชิกแต่ละรายการในสถาปัตยกรรม
ขณะนี้สถาปัตยกรรมที่ปรับใช้รูปแบบการเรียกข้อมูล Augmented Generation ได้ปรับใช้ในบัญชีเป้าหมายแล้ว
หลังจากปรับใช้สถาปัตยกรรมแล้ว แอปพลิเคชันตัวอย่างจะเริ่มต้นในบริการ DevOps ที่จัดเตรียมใหม่
ในการตรวจสอบการสร้างและการปรับใช้แอปพลิเคชัน ให้ทำตามขั้นตอนเหล่านี้:
resource_group_name
ของสถาปัตยกรรมที่ปรับใช้ได้Workload - Sample RAG App Configuration
Outputs
URL ไปยังแอปพลิเคชันที่ปรับใช้จะแสดงรายการอยู่ใต้เอาต์พุต sample_app_public_url
เพื่อลดต้นทุน ระบบอัตโนมัติจะใช้แผนราคาทดลองใช้ของ Secrets Manager คุณสามารถสร้างอินสแตนซ์ทดลองใช้งาน Secrets Manager ได้เพียงอินสแตนซ์เดียวเท่านั้น คุณสามารถปรับใช้อินสแตนซ์แผนมาตรฐานของ Secrets Manager ได้จาก การตั้งค่าเพิ่มเติม ของสแต็ก
หากต้องการแก้ไข ให้ลบอินสแตนซ์รุ่นทดลองใช้ออก หลังจากลบแล้ว ให้ลบบริการออกจากสถานะการเรียกคืนด้วย
ใน IBM Cloud เมื่อคุณลบทรัพยากร ทรัพยากรนั้นจะไม่หายไปทันที แต่จะเข้าสู่สถานะการบุกเบิก โดยจะคงอยู่ในช่วงเวลาสั้นๆ (ปกติคือ 7 วัน) ก่อนที่จะถูกลบอย่างถาวร ในระหว่างสถานะการบุกเบิก คุณสามารถกู้คืนทรัพยากรได้ หากจำเป็น
รันคำสั่ง IBM Cloud CLI ต่อไปนี้เพื่อลบเซอร์วิสออกจากสถานะการเรียกคืน
คำสั่งแรกแสดงรายการรีซอร์สทั้งหมดในสถานะการเรียกคืน
# List all the resources in reclamation state with its reclamation ID
ibmcloud resource reclamations
ค้นหา ID การเรียกคืนของบริการ Secrets Manager ใช้ ID นั้นในคำสั่งต่อไปนี้
ibmcloud resource reclamation-delete < reclamation-id >
ปัญหานี้อาจเกิดขึ้นได้เมื่อการปรับใช้ ALM/toolchain ของคุณมีอายุมากกว่า 14 วัน และการกำหนดค่าแอปพลิเคชัน DA ไม่ได้ปรับใช้/ปรับใช้ใหม่ นี่เป็นเพราะว่าจำเป็นต้องมีบริการจัดส่งอย่างต่อเนื่องเพื่อสร้างและลบคุณสมบัติของไปป์ไลน์ และการปรับใช้เกิดขึ้นเมื่อบริการซีดีอาจไม่มีอยู่ เรากำลังดำเนินการแก้ไขปัญหาระยะยาวสำหรับจุดบกพร่องนี้ แต่ในระหว่างนี้ก็สามารถบรรเทาลงได้ด้วยการตรวจสอบให้แน่ใจว่ามีบริการซีดีอยู่ในกลุ่มทรัพยากรที่คาดว่าจะสร้าง toolchains
ปัญหาจะเกิดขึ้นในสถาปัตยกรรมที่ปรับใช้ Workload - Sample RAG App Configuration
ได้ทั้งในรูปแบบ Code Engine และ OCP โดยทั่วไปข้อผิดพลาดจะมีข้อความนี้:
"errors": [
{
"code": 403,
"message": "Continuous Delivery service required"
}
]
การปรับแต่งหลายอย่างสามารถทำได้ด้วยสถาปัตยกรรมนี้ นี่คือตัวเลือกทั่วไปบางส่วน
การกำหนดค่าสมาชิกแต่ละรายการจะมีพารามิเตอร์อินพุตจำนวนมาก คุณสามารถแก้ไขการกำหนดค่าเพื่อเปลี่ยนค่าเริ่มต้นได้
ตัวอย่างเช่น โดยการแก้ไขการกำหนดค่าสมาชิก คุณสามารถทำสิ่งเหล่านี้ให้สำเร็จ:
หากต้องการแก้ไขการกำหนดค่าสมาชิก ให้เลือก แก้ไข จากไอคอนตัวเลือกในแถวการกำหนดค่าสมาชิก
คุณสามารถลบการกำหนดค่าสมาชิกออกจากสแต็กที่การกำหนดค่าอื่นไม่ได้ขึ้นอยู่กับได้
คุณสามารถลบการกำหนดค่าต่อไปนี้ในสถาปัตยกรรมนี้ได้:
หากต้องการลบการกำหนดค่าสมาชิก ให้เลือก ลบออกจากสแต็ก จากไอคอนตัวเลือกในแถวการกำหนดค่าสมาชิก
คุณสามารถเพิ่มหรือลบตัวแปรอินพุตและเอาต์พุตในระดับสแต็กได้โดยทำตามขั้นตอนเหล่านี้:
คุณสามารถเลือกจัดสรรทรัพยากรที่สามารถสังเกตได้ เช่น เส้นทางและเป้าหมายของตัวติดตามกิจกรรม และอินสแตนซ์ Cloud Monitoring โดยทำตามขั้นตอนเหล่านี้:
cloud_logs_provision
): ตั้งค่านี้เพื่อจัดเตรียมหรือข้ามการจัดเตรียมอินสแตนซ์ IBM Cloud Logscloud_monitoring_provision
): ตั้งค่านี้เพื่อจัดเตรียมหรือข้ามการจัดเตรียมอินสแตนซ์ IBM Cloud Monitoringenable_at_event_routing_to_cos_bucket
): ตั้งค่านี้เพื่อเปิดหรือปิดใช้งานการกำหนดเส้นทางกิจกรรมจากตัวติดตามกิจกรรมไปยังที่เก็บข้อมูลออบเจ็กต์enable_at_event_routing_to_cloud_logs
): ตั้งค่านี้เพื่อเปิดหรือปิดใช้งานการกำหนดเส้นทางเหตุการณ์จากตัวติดตามกิจกรรมไปยังบันทึกบนคลาวด์หลังจากที่คุณแก้ไขสถาปัตยกรรมที่ปรับใช้ได้ในโปรเจ็กต์ คุณสามารถแชร์กับผู้อื่นผ่านแค็ตตาล็อก IBM Cloud ส่วนตัวได้ หากต้องการแชร์สถาปัตยกรรมที่ปรับใช้ได้ ให้ทำตามขั้นตอนใน การแชร์สถาปัตยกรรมที่ปรับใช้ได้กับองค์กรของคุณ
คุณสามารถใช้โค้ดของระบบอัตโนมัติตัวอย่างนี้เป็นแนวทางในการปรับแต่งแอปตัวอย่างให้ตรงตามความต้องการของคุณ โค้ดมีอยู่ที่ https://github.com/terraform-ibm-modules/terraform-ibm-rag-sample-da
หากต้องการใช้แอปของคุณเอง ให้ลบ Workload - Sample RAG App Configuration
ออกจากสแต็ก การกำหนดค่าสมาชิกนี้มีเฉพาะสำหรับแอปตัวอย่างเริ่มต้น
ทำความสะอาดการกำหนดค่า
ขั้นตอนนี้เป็นทางเลือกหากคุณวางแผนที่จะทำลายทรัพยากร Watson ทั้งหมด สิ่งประดิษฐ์ที่สร้างขึ้นโดยแอปพลิเคชันจะถูกลบออกโดยเป็นส่วนหนึ่งของการยกเลิกการปรับใช้ทรัพยากร Watson
ทำตามขั้นตอนที่ระบุไว้ในไฟล์ cleanup.md เพื่อลบการกำหนดค่าสำหรับแอปตัวอย่าง
ลบทรัพยากรที่สร้างโดย CI toolchain
ทรัพยากรต่อไปนี้ซึ่งสร้างโดย toolchain จะไม่ถูกทำลายโดยเป็นส่วนหนึ่งของการยกเลิกการปรับใช้สแต็กใน Project
ลบโครงการ
หากต้องการยกเลิกการปรับใช้โครงสร้างพื้นฐานที่สร้างโดยสถาปัตยกรรมที่ปรับใช้ได้ ให้ทำตามขั้นตอนในการลบโปรเจ็กต์ในเอกสาร IBM Cloud