ดาวน์โหลด GPT RAG - ดาวน์โหลดซอร์สโค้ด GPT RAG

GPT RAG

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

รูปแบบ RAG ช่วยให้ธุรกิจสามารถใช้ความสามารถในการใช้เหตุผลของ LLM โดยใช้โมเดลที่มีอยู่ในการประมวลผลและสร้างการตอบสนองตามข้อมูลใหม่ RAG อำนวยความสะดวกในการอัปเดตข้อมูลเป็นระยะโดยไม่จำเป็นต้องปรับแต่งอย่างละเอียดดังนั้นจึงปรับปรุงการรวม LLMs เข้ากับธุรกิจ

Enterprise Rag Solution Accelerator (GPT-RAG) นำเสนอสถาปัตยกรรมที่แข็งแกร่งซึ่งเหมาะสำหรับการปรับใช้ระดับองค์กรของรูปแบบ RAG มันช่วยให้มั่นใจได้ว่าการตอบสนองต่อสายดินและสร้างขึ้นจากความปลอดภัยที่ไม่ไว้วางใจและ AI ที่รับผิดชอบทำให้มั่นใจได้ถึงความพร้อมใช้งานความสามารถในการปรับขนาดและการตรวจสอบได้ เหมาะอย่างยิ่งสำหรับองค์กรที่เปลี่ยนจากการสำรวจและขั้นตอน POC เป็นการผลิตเต็มรูปแบบและ MVPs

ดูคู่มือผู้ใช้และผู้ดูแลระบบของเราสำหรับรายละเอียดการตั้งค่าและการใช้งานที่สมบูรณ์

ส่วนประกอบแอปพลิเคชัน

GPT-RAG เป็นไปตามวิธีการแบบแยกส่วนประกอบด้วยสามองค์ประกอบแต่ละรายการมีฟังก์ชั่นเฉพาะ

การบริโภคข้อมูล - เพิ่มประสิทธิภาพการใช้ข้อมูลและการจัดทำดัชนีสำหรับขั้นตอนการดึง RAG
Orchestrator - ประสานงานการไหลเพื่อดึงข้อมูลและสร้างการตอบสนองของผู้ใช้ มันมีสองตัวเลือก: ใช้งานได้ โดยใช้ฟังก์ชั่นเคอร์เนลความหมาย (ค่าเริ่มต้น) และ ตัวแทน โดยใช้ตัวแทน autogen ดูคำแนะนำในการปรับใช้เพื่อเปลี่ยนเป็น Agentic
แอป Front-end- ใช้แบ็กเอนด์สำหรับรูปแบบส่วนหน้าเพื่อให้เว็บอินเตอร์เฟสที่ปรับขนาดและมีประสิทธิภาพ

แนวคิด

หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับรูปแบบ RAG และสถาปัตยกรรม GPT-RAG

รูปแบบผ้าขี้ริ้ว: อะไรและทำไม?
ภาพรวมสถาปัตยกรรมโซลูชัน

Enterprise Rag+Promption Engineering+Finetuning+Train (วิดีโอในภาษาสเปน)

คู่มือการตั้งค่า

การปรับใช้สถาปัตยกรรมพื้นฐาน: สำหรับการสาธิตอย่างรวดเร็วโดยไม่มีการแยกเครือข่าย

เรียนรู้วิธี การตั้งค่า สถาปัตยกรรมพื้นฐานสำหรับสถานการณ์โดยไม่ต้องแยกเครือข่าย คลิกลิงก์เพื่อดำเนินการต่อ

การปรับใช้สถาปัตยกรรมแบบศูนย์มาตรฐาน: ตัวเลือกการปรับใช้ที่รวดเร็วที่สุดเป็นศูนย์

ปรับใช้ตัวเร่งความเร็วโซลูชันโดยใช้สถาปัตยกรรมศูนย์ความน่าเชื่อถือมาตรฐานพร้อมการตั้งค่าโซลูชันที่กำหนดค่าล่วงหน้า ไม่จำเป็นต้องปรับแต่ง คลิกลิงก์เพื่อดำเนินการต่อ

การตั้งค่าสถาปัตยกรรมที่กำหนดเองเป็น ศูนย์

สำรวจตัวเลือกสำหรับการปรับแต่งการปรับใช้ของตัวเร่งโซลูชันด้วยสถาปัตยกรรมที่ไม่น่าเชื่อถือเป็นการปรับการตั้งค่าโซลูชันตามความต้องการของคุณ คลิกลิงก์เพื่อดำเนินการต่อ

การตั้งค่าด้วยตนเองทีละขั้นตอน: สถาปัตยกรรมที่ไม่ไว้วางใจ Zero: วิธีการใช้งานจริง **

สำหรับผู้ที่ต้องการการควบคุมที่สมบูรณ์ให้ทำตามคำแนะนำโดยละเอียดนี้เพื่อตั้งค่าตัวเร่งความเร็วโซลูชันด้วยตนเองด้วยสถาปัตยกรรมที่ไม่น่าเชื่อถือ คลิกลิงก์เพื่อดำเนินการต่อ

เริ่มต้น

คู่มือนี้จะนำคุณผ่านกระบวนการปรับใช้ของ Rag Enterprise มีตัวเลือกการปรับใช้สองตัวเลือก สถาปัตยกรรมพื้นฐาน และ สถาปัตยกรรมที่น่าเชื่อถือเป็นศูนย์ ก่อนที่จะเริ่มการปรับใช้โปรดตรวจสอบให้แน่ใจว่าคุณได้เตรียมเครื่องมือและบริการที่จำเป็นทั้งหมดตามที่ระบุไว้ในส่วน ที่จำเป็นต้องมี

สิ่งที่ต้องมีก่อน

Azure Developer CLI: ดาวน์โหลด AZD สำหรับ Windows, OS อื่น ๆ
PowerShell 7+ พร้อมโมดูล AZ (Windows เท่านั้น): PowerShell, AZ Module
Git: ดาวน์โหลด git
node.js 16+ windows/mac linux/wsl
Python 3.11: ดาวน์โหลด Python
เริ่มต้นการสร้างบริการ Azure AI และยอมรับเงื่อนไข AI ที่รับผิดชอบ **

** หากคุณยังไม่ได้สร้างทรัพยากรบริการ Azure AI ในการสมัครสมาชิกมาก่อน

การปรับใช้สถาปัตยกรรมขั้นพื้นฐาน

สำหรับการสาธิตอย่างรวดเร็วหรือโครงการพิสูจน์แนวคิดโดยไม่มีข้อกำหนดการแยกเครือข่ายคุณสามารถปรับใช้ตัวเร่งความเร็วโดยใช้สถาปัตยกรรมพื้นฐาน

ขั้นตอนการปรับใช้นั้นค่อนข้างง่ายเพียงติดตั้งข้อกำหนดเบื้องต้นที่กล่าวถึงข้างต้นและทำตามขั้นตอนทั้งสี่นี้โดยใช้ Azure Developer CLI (AZD) ในเทอร์มินัล:

1 ดาวน์โหลดที่เก็บ:

azd init -t azure/gpt-rag

หมายเหตุ : Add -b agentic หากใช้ Orchestrator Agentic Autogen -based
azd init -t azure/gpt-rag -b agentic

2 เข้าสู่ระบบ Azure:

2.a Azure Developer CLI:

azd auth login

2.B Azure CLI:

az login

3 เริ่มสร้างโครงสร้างพื้นฐานและการปรับใช้ส่วนประกอบ:

azd up

4 เพิ่มเอกสารต้นฉบับในการจัดเก็บวัตถุ

อัปโหลดเอกสารของคุณไปยังโฟลเดอร์ 'เอกสาร' ที่อยู่ในบัญชีจัดเก็บ ชื่อของบัญชีนี้ควรเริ่มต้นด้วย 'strag' นี่คือบัญชีที่เก็บข้อมูลเริ่มต้นดังแสดงในภาพตัวอย่างด้านล่าง

Storage_sample

เสร็จแล้ว! การปรับใช้ขั้นพื้นฐานเสร็จสมบูรณ์

แนะนำ : เพิ่มการรับรองความถูกต้องของแอพ ดูบทช่วยสอนด่วนนี้สำหรับคำแนะนำทีละขั้นตอน

การปรับใช้สถาปัตยกรรมศูนย์ความน่าเชื่อถือ

สำหรับการปรับใช้ที่ปลอดภัยและโดดเดี่ยวมากขึ้นคุณสามารถเลือกใช้สถาปัตยกรรมที่น่าเชื่อถือเป็นศูนย์ สถาปัตยกรรมนี้เหมาะสำหรับสภาพแวดล้อมการผลิตที่การแยกเครือข่ายและมาตรการความปลอดภัยที่เข้มงวดมีมูลค่าสูง

สถาปัตยกรรมศูนย์ความน่าเชื่อถือ

ก่อนที่จะปรับใช้สถาปัตยกรรมศูนย์ความน่าเชื่อถือตรวจสอบให้แน่ใจว่าได้ตรวจสอบข้อกำหนดเบื้องต้น เป็นสิ่งสำคัญที่จะต้องทราบว่าคุณจะต้องใช้ Node.js และ Python สำหรับส่วนที่สองของกระบวนการเท่านั้นซึ่งจะดำเนินการบน VM ที่สร้างขึ้นระหว่างการปรับใช้สถาปัตยกรรมนี้

ขั้นตอนการปรับใช้นั้นคล้ายกับสถาปัตยกรรมพื้นฐาน แต่มีขั้นตอนเพิ่มเติมบางอย่าง สำหรับคู่มือโดยละเอียดเกี่ยวกับการปรับใช้ตัวเลือกนี้โปรดดูคำแนะนำด้านล่าง:

1 ดาวน์โหลดที่เก็บข้อมูล

azd init -t azure/gpt-rag

หมายเหตุ : Add -b agentic หากใช้ Orchestrator Agentic Autogen -based
azd init -t azure/gpt-rag -b agentic

2 เปิดใช้งานการแยกเครือข่าย

azd env set AZURE_NETWORK_ISOLATION true

3 เข้าสู่ระบบ Azure:

2.a Azure Developer CLI:

azd auth login

2.B Azure CLI:

az login

4 เริ่มสร้างโครงสร้างพื้นฐานและการปรับใช้ส่วนประกอบ:

azd provision

5 ถัดไปคุณจะใช้เครื่องเสมือนกับการเชื่อมต่อป้อม (สร้างขึ้นระหว่างขั้นตอนที่ 4) เพื่อดำเนินการปรับใช้ต่อไป

เข้าสู่ระบบ VM ที่สร้างขึ้นด้วย GPTRAG ผู้ใช้และตรวจสอบสิทธิ์ด้วยรหัสผ่านที่เก็บไว้ใน KeyVault ซึ่งคล้ายกับรูปด้านล่าง:

เข้าสู่ระบบ KeyVault

6 เมื่อเข้าถึง Windows ให้ติดตั้ง PowerShell เนื่องจากข้อกำหนดเบื้องต้นอื่น ๆ ได้ติดตั้งไว้บน VM แล้ว

7 เปิดพรอมต์คำสั่งและเรียกใช้คำสั่งต่อไปนี้เพื่ออัปเดต AZD เป็นเวอร์ชันล่าสุด:

 choco upgrade azd

หลังจากอัปเดต AZD เพียงปิดและเปิดเทอร์มินัลอีกครั้ง

8 สร้างไดเรกทอรีใหม่เช่น deploy จากนั้นป้อนไดเรกทอรีที่สร้างขึ้น

 mkdir deploy  
cd deploy

ในการสรุปขั้นตอนให้ดำเนินการคำสั่งที่ตามมาในพรอมต์คำสั่งเพื่อให้การปรับใช้เสร็จสมบูรณ์:

 azd init -t azure/gpt-rag  
azd auth login   
azd env refresh  
azd package  
azd deploy

หมายเหตุ: เมื่อเรียกใช้ azd init ... และ azd env refresh ให้ใช้ชื่อสภาพแวดล้อมการสมัครสมาชิกและภูมิภาคที่ใช้ในการจัดเตรียมโครงสร้างพื้นฐานเบื้องต้น

เสร็จแล้ว! การปรับใช้ศูนย์ความน่าเชื่อถือเสร็จสมบูรณ์

แนะนำ : เพิ่มการรับรองความถูกต้องของแอพ ดูบทช่วยสอนด่วนนี้สำหรับคำแนะนำทีละขั้นตอน

วิธี?

ส่วนนี้ให้คำแนะนำอย่างรวดเร็วสำหรับการปรับแต่งจัดการและแก้ไขปัญหาการปรับใช้ของคุณ

ปรับแต่งการปรับใช้ของคุณ

กระบวนการปรับใช้มาตรฐานตั้งค่าทรัพยากร Azure และปรับใช้ส่วนประกอบเร่งความเร็วด้วยการกำหนดค่ามาตรฐาน ในการปรับการปรับใช้ตามความต้องการเฉพาะของคุณให้ทำตามขั้นตอนในส่วนการปรับใช้ที่กำหนดเองสำหรับตัวเลือกการปรับแต่งเพิ่มเติม

การปรับใช้สิ่งแวดล้อมหลายครั้ง

เมื่อคุณใช้โซลูชัน GPT-RAG สำเร็จเพื่อพิสูจน์แนวคิดและคุณพร้อมที่จะปรับใช้การปรับใช้อย่างเป็นทางการโดยใช้กระบวนการ CI/CD ที่เหมาะสมเพื่อเร่งการปรับใช้ของคุณในการผลิต

แก้ไขปัญหาการปรับใช้

หากคุณพบข้อผิดพลาดใด ๆ ในระหว่างกระบวนการปรับใช้ให้ปรึกษาหน้าการแก้ไขปัญหาสำหรับคำแนะนำเกี่ยวกับการแก้ไขปัญหาทั่วไป

ประเมินประสิทธิภาพ

เพื่อประเมินประสิทธิภาพของการปรับใช้ของคุณโปรดดูคู่มือการทดสอบประสิทธิภาพสำหรับวิธีการทดสอบและแนวทางปฏิบัติที่ดีที่สุด

สอบถามประวัติการสนทนา

เรียนรู้วิธีสอบถามและวิเคราะห์ข้อมูลการสนทนาโดยทำตามขั้นตอนที่ระบุไว้ในวิธีการสอบถามและวิเคราะห์เอกสารการสนทนา

ประเมินราคา

ทำความเข้าใจกับผลกระทบค่าใช้จ่ายของการปรับใช้ของคุณโดยการตรวจสอบรูปแบบการกำหนดราคาสำหรับการประมาณราคาโดยละเอียด

จัดการการกำกับดูแล

ตรวจสอบให้แน่ใจว่าการกำกับดูแลที่เหมาะสมของการปรับใช้ของคุณโดยทำตามแนวทางที่มีให้ในรูปแบบการกำกับดูแล

ชุมชนผ้าขี้ริ้วขององค์กร

Discord Channel Enterprise Rag - ชุมชนที่เชื่อมต่อกัน

การบริจาค

เราขอขอบคุณที่คุณสนใจในการสนับสนุนโครงการนี้! โปรดดูที่หน้า MDING.MD สำหรับแนวทางโดยละเอียดเกี่ยวกับวิธีการมีส่วนร่วมรวมถึงข้อมูลเกี่ยวกับข้อตกลงใบอนุญาตผู้สนับสนุน (CLA) จรรยาบรรณและกระบวนการสำหรับการส่งคำขอดึง

ขอบคุณสำหรับการสนับสนุนและการมีส่วนร่วมของคุณ!

เครื่องหมายการค้า

โครงการนี้อาจมีเครื่องหมายการค้าหรือโลโก้สำหรับโครงการผลิตภัณฑ์หรือบริการ การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ที่ได้รับอนุญาตขึ้นอยู่กับและต้องปฏิบัติตามแนวทางเครื่องหมายการค้าและแบรนด์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ในรุ่นที่แก้ไขของโครงการนี้จะต้องไม่ทำให้เกิดความสับสนหรือบอกเป็นสปอนเซอร์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของบุคคลที่สามจะอยู่ภายใต้นโยบายของบุคคลที่สามเหล่านั้น

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-01
ขนาด 9.37MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
ภาพยนตร์และโทรทัศน์ GPT เวอร์ชันล่าสุด

2023-10-30

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด