รูปแบบ RAG ช่วยให้ธุรกิจสามารถใช้ความสามารถในการใช้เหตุผลของ LLM โดยใช้โมเดลที่มีอยู่ในการประมวลผลและสร้างการตอบสนองตามข้อมูลใหม่ RAG อำนวยความสะดวกในการอัปเดตข้อมูลเป็นระยะโดยไม่จำเป็นต้องปรับแต่งอย่างละเอียดดังนั้นจึงปรับปรุงการรวม LLMs เข้ากับธุรกิจ
Enterprise Rag Solution Accelerator (GPT-RAG) นำเสนอสถาปัตยกรรมที่แข็งแกร่งซึ่งเหมาะสำหรับการปรับใช้ระดับองค์กรของรูปแบบ RAG มันช่วยให้มั่นใจได้ว่าการตอบสนองต่อสายดินและสร้างขึ้นจากความปลอดภัยที่ไม่ไว้วางใจและ AI ที่รับผิดชอบทำให้มั่นใจได้ถึงความพร้อมใช้งานความสามารถในการปรับขนาดและการตรวจสอบได้ เหมาะอย่างยิ่งสำหรับองค์กรที่เปลี่ยนจากการสำรวจและขั้นตอน POC เป็นการผลิตเต็มรูปแบบและ MVPs
ดูคู่มือผู้ใช้และผู้ดูแลระบบของเราสำหรับรายละเอียดการตั้งค่าและการใช้งานที่สมบูรณ์
GPT-RAG เป็นไปตามวิธีการแบบแยกส่วนประกอบด้วยสามองค์ประกอบแต่ละรายการมีฟังก์ชั่นเฉพาะ
การบริโภคข้อมูล - เพิ่มประสิทธิภาพการใช้ข้อมูลและการจัดทำดัชนีสำหรับขั้นตอนการดึง RAG
Orchestrator - ประสานงานการไหลเพื่อดึงข้อมูลและสร้างการตอบสนองของผู้ใช้ มันมีสองตัวเลือก: ใช้งานได้ โดยใช้ฟังก์ชั่นเคอร์เนลความหมาย (ค่าเริ่มต้น) และ ตัวแทน โดยใช้ตัวแทน autogen ดูคำแนะนำในการปรับใช้เพื่อเปลี่ยนเป็น Agentic
แอป Front-end- ใช้แบ็กเอนด์สำหรับรูปแบบส่วนหน้าเพื่อให้เว็บอินเตอร์เฟสที่ปรับขนาดและมีประสิทธิภาพ
หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับรูปแบบ RAG และสถาปัตยกรรม GPT-RAG
รูปแบบผ้าขี้ริ้ว: อะไรและทำไม?
ภาพรวมสถาปัตยกรรมโซลูชัน
เรียนรู้วิธี การตั้งค่า สถาปัตยกรรมพื้นฐานสำหรับสถานการณ์โดยไม่ต้องแยกเครือข่าย คลิกลิงก์เพื่อดำเนินการต่อ
ปรับใช้ตัวเร่งความเร็วโซลูชันโดยใช้สถาปัตยกรรมศูนย์ความน่าเชื่อถือมาตรฐานพร้อมการตั้งค่าโซลูชันที่กำหนดค่าล่วงหน้า ไม่จำเป็นต้องปรับแต่ง คลิกลิงก์เพื่อดำเนินการต่อ
สำรวจตัวเลือกสำหรับการปรับแต่งการปรับใช้ของตัวเร่งโซลูชันด้วยสถาปัตยกรรมที่ไม่น่าเชื่อถือเป็นการปรับการตั้งค่าโซลูชันตามความต้องการของคุณ คลิกลิงก์เพื่อดำเนินการต่อ
สำหรับผู้ที่ต้องการการควบคุมที่สมบูรณ์ให้ทำตามคำแนะนำโดยละเอียดนี้เพื่อตั้งค่าตัวเร่งความเร็วโซลูชันด้วยตนเองด้วยสถาปัตยกรรมที่ไม่น่าเชื่อถือ คลิกลิงก์เพื่อดำเนินการต่อ
คู่มือนี้จะนำคุณผ่านกระบวนการปรับใช้ของ Rag Enterprise มีตัวเลือกการปรับใช้สองตัวเลือก สถาปัตยกรรมพื้นฐาน และ สถาปัตยกรรมที่น่าเชื่อถือเป็นศูนย์ ก่อนที่จะเริ่มการปรับใช้โปรดตรวจสอบให้แน่ใจว่าคุณได้เตรียมเครื่องมือและบริการที่จำเป็นทั้งหมดตามที่ระบุไว้ในส่วน ที่จำเป็นต้องมี
สิ่งที่ต้องมีก่อน
** หากคุณยังไม่ได้สร้างทรัพยากรบริการ Azure AI ในการสมัครสมาชิกมาก่อน
สำหรับการสาธิตอย่างรวดเร็วหรือโครงการพิสูจน์แนวคิดโดยไม่มีข้อกำหนดการแยกเครือข่ายคุณสามารถปรับใช้ตัวเร่งความเร็วโดยใช้สถาปัตยกรรมพื้นฐาน
ขั้นตอนการปรับใช้นั้นค่อนข้างง่ายเพียงติดตั้งข้อกำหนดเบื้องต้นที่กล่าวถึงข้างต้นและทำตามขั้นตอนทั้งสี่นี้โดยใช้ Azure Developer CLI (AZD) ในเทอร์มินัล:
1 ดาวน์โหลดที่เก็บ:
azd init -t azure/gpt-rag
หมายเหตุ : Add
-b agentic
หากใช้ Orchestrator Agentic Autogen -basedazd init -t azure/gpt-rag -b agentic
2 เข้าสู่ระบบ Azure:
2.a Azure Developer CLI:
azd auth login
2.B Azure CLI:
az login
3 เริ่มสร้างโครงสร้างพื้นฐานและการปรับใช้ส่วนประกอบ:
azd up
4 เพิ่มเอกสารต้นฉบับในการจัดเก็บวัตถุ
อัปโหลดเอกสารของคุณไปยังโฟลเดอร์ 'เอกสาร' ที่อยู่ในบัญชีจัดเก็บ ชื่อของบัญชีนี้ควรเริ่มต้นด้วย 'strag' นี่คือบัญชีที่เก็บข้อมูลเริ่มต้นดังแสดงในภาพตัวอย่างด้านล่าง
เสร็จแล้ว! การปรับใช้ขั้นพื้นฐานเสร็จสมบูรณ์
แนะนำ : เพิ่มการรับรองความถูกต้องของแอพ ดูบทช่วยสอนด่วนนี้สำหรับคำแนะนำทีละขั้นตอน
สำหรับการปรับใช้ที่ปลอดภัยและโดดเดี่ยวมากขึ้นคุณสามารถเลือกใช้สถาปัตยกรรมที่น่าเชื่อถือเป็นศูนย์ สถาปัตยกรรมนี้เหมาะสำหรับสภาพแวดล้อมการผลิตที่การแยกเครือข่ายและมาตรการความปลอดภัยที่เข้มงวดมีมูลค่าสูง
ก่อนที่จะปรับใช้สถาปัตยกรรมศูนย์ความน่าเชื่อถือตรวจสอบให้แน่ใจว่าได้ตรวจสอบข้อกำหนดเบื้องต้น เป็นสิ่งสำคัญที่จะต้องทราบว่าคุณจะต้องใช้ Node.js และ Python สำหรับส่วนที่สองของกระบวนการเท่านั้นซึ่งจะดำเนินการบน VM ที่สร้างขึ้นระหว่างการปรับใช้สถาปัตยกรรมนี้
ขั้นตอนการปรับใช้นั้นคล้ายกับสถาปัตยกรรมพื้นฐาน แต่มีขั้นตอนเพิ่มเติมบางอย่าง สำหรับคู่มือโดยละเอียดเกี่ยวกับการปรับใช้ตัวเลือกนี้โปรดดูคำแนะนำด้านล่าง:
1 ดาวน์โหลดที่เก็บข้อมูล
azd init -t azure/gpt-rag
หมายเหตุ : Add
-b agentic
หากใช้ Orchestrator Agentic Autogen -basedazd init -t azure/gpt-rag -b agentic
2 เปิดใช้งานการแยกเครือข่าย
azd env set AZURE_NETWORK_ISOLATION true
3 เข้าสู่ระบบ Azure:
2.a Azure Developer CLI:
azd auth login
2.B Azure CLI:
az login
4 เริ่มสร้างโครงสร้างพื้นฐานและการปรับใช้ส่วนประกอบ:
azd provision
5 ถัดไปคุณจะใช้เครื่องเสมือนกับการเชื่อมต่อป้อม (สร้างขึ้นระหว่างขั้นตอนที่ 4) เพื่อดำเนินการปรับใช้ต่อไป
เข้าสู่ระบบ VM ที่สร้างขึ้นด้วย GPTRAG ผู้ใช้และตรวจสอบสิทธิ์ด้วยรหัสผ่านที่เก็บไว้ใน KeyVault ซึ่งคล้ายกับรูปด้านล่าง:
6 เมื่อเข้าถึง Windows ให้ติดตั้ง PowerShell เนื่องจากข้อกำหนดเบื้องต้นอื่น ๆ ได้ติดตั้งไว้บน VM แล้ว
7 เปิดพรอมต์คำสั่งและเรียกใช้คำสั่งต่อไปนี้เพื่ออัปเดต AZD เป็นเวอร์ชันล่าสุด:
choco upgrade azd
หลังจากอัปเดต AZD เพียงปิดและเปิดเทอร์มินัลอีกครั้ง
8 สร้างไดเรกทอรีใหม่เช่น deploy
จากนั้นป้อนไดเรกทอรีที่สร้างขึ้น
mkdir deploy
cd deploy
ในการสรุปขั้นตอนให้ดำเนินการคำสั่งที่ตามมาในพรอมต์คำสั่งเพื่อให้การปรับใช้เสร็จสมบูรณ์:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
หมายเหตุ: เมื่อเรียกใช้
azd init ...
และazd env refresh
ให้ใช้ชื่อสภาพแวดล้อมการสมัครสมาชิกและภูมิภาคที่ใช้ในการจัดเตรียมโครงสร้างพื้นฐานเบื้องต้น
เสร็จแล้ว! การปรับใช้ศูนย์ความน่าเชื่อถือเสร็จสมบูรณ์
แนะนำ : เพิ่มการรับรองความถูกต้องของแอพ ดูบทช่วยสอนด่วนนี้สำหรับคำแนะนำทีละขั้นตอน
ส่วนนี้ให้คำแนะนำอย่างรวดเร็วสำหรับการปรับแต่งจัดการและแก้ไขปัญหาการปรับใช้ของคุณ
กระบวนการปรับใช้มาตรฐานตั้งค่าทรัพยากร Azure และปรับใช้ส่วนประกอบเร่งความเร็วด้วยการกำหนดค่ามาตรฐาน ในการปรับการปรับใช้ตามความต้องการเฉพาะของคุณให้ทำตามขั้นตอนในส่วนการปรับใช้ที่กำหนดเองสำหรับตัวเลือกการปรับแต่งเพิ่มเติม
เมื่อคุณใช้โซลูชัน GPT-RAG สำเร็จเพื่อพิสูจน์แนวคิดและคุณพร้อมที่จะปรับใช้การปรับใช้อย่างเป็นทางการโดยใช้กระบวนการ CI/CD ที่เหมาะสมเพื่อเร่งการปรับใช้ของคุณในการผลิต
หากคุณพบข้อผิดพลาดใด ๆ ในระหว่างกระบวนการปรับใช้ให้ปรึกษาหน้าการแก้ไขปัญหาสำหรับคำแนะนำเกี่ยวกับการแก้ไขปัญหาทั่วไป
เพื่อประเมินประสิทธิภาพของการปรับใช้ของคุณโปรดดูคู่มือการทดสอบประสิทธิภาพสำหรับวิธีการทดสอบและแนวทางปฏิบัติที่ดีที่สุด
เรียนรู้วิธีสอบถามและวิเคราะห์ข้อมูลการสนทนาโดยทำตามขั้นตอนที่ระบุไว้ในวิธีการสอบถามและวิเคราะห์เอกสารการสนทนา
ทำความเข้าใจกับผลกระทบค่าใช้จ่ายของการปรับใช้ของคุณโดยการตรวจสอบรูปแบบการกำหนดราคาสำหรับการประมาณราคาโดยละเอียด
ตรวจสอบให้แน่ใจว่าการกำกับดูแลที่เหมาะสมของการปรับใช้ของคุณโดยทำตามแนวทางที่มีให้ในรูปแบบการกำกับดูแล
เราขอขอบคุณที่คุณสนใจในการสนับสนุนโครงการนี้! โปรดดูที่หน้า MDING.MD สำหรับแนวทางโดยละเอียดเกี่ยวกับวิธีการมีส่วนร่วมรวมถึงข้อมูลเกี่ยวกับข้อตกลงใบอนุญาตผู้สนับสนุน (CLA) จรรยาบรรณและกระบวนการสำหรับการส่งคำขอดึง
ขอบคุณสำหรับการสนับสนุนและการมีส่วนร่วมของคุณ!
โครงการนี้อาจมีเครื่องหมายการค้าหรือโลโก้สำหรับโครงการผลิตภัณฑ์หรือบริการ การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ที่ได้รับอนุญาตขึ้นอยู่กับและต้องปฏิบัติตามแนวทางเครื่องหมายการค้าและแบรนด์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ในรุ่นที่แก้ไขของโครงการนี้จะต้องไม่ทำให้เกิดความสับสนหรือบอกเป็นสปอนเซอร์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของบุคคลที่สามจะอยู่ภายใต้นโยบายของบุคคลที่สามเหล่านั้น