GenAIExamples ได้รับการออกแบบมาเพื่อให้นักพัฒนาสามารถเข้าสู่ generative AI ได้อย่างง่ายดาย โดยมีตัวอย่างที่ใช้ไมโครเซอร์วิส ซึ่งจะทำให้กระบวนการปรับใช้ ทดสอบ และปรับขนาดแอปพลิเคชัน GenAI ง่ายขึ้น ตัวอย่างทั้งหมดเข้ากันได้อย่างสมบูรณ์กับ Docker และ Kubernetes โดยรองรับแพลตฟอร์มฮาร์ดแวร์ที่หลากหลาย เช่น Gaudi, Xeon และ NVIDIA GPU และฮาร์ดแวร์อื่นๆ ทำให้มั่นใจถึงความยืดหยุ่นและประสิทธิภาพสำหรับการปรับใช้ GenAI ของคุณ
GenAIComps เป็นเครื่องมือเชิงบริการที่มีส่วนประกอบไมโครเซอร์วิส เช่น llm การฝัง การจัดอันดับใหม่ และอื่นๆ การใช้ส่วนประกอบเหล่านี้ สามารถสร้างตัวอย่างต่างๆ ใน GenAIExample ได้ รวมถึง ChatQnA, DocSum ฯลฯ
GenAIInfra ซึ่งเป็นส่วนหนึ่งของคอนเทนเนอร์ OPEA และชุดระบบคลาวด์เนทีฟ ช่วยให้ใช้งาน GenAIExamples ในระบบคลาวด์ได้อย่างรวดเร็วและมีประสิทธิภาพ
GenAIEval วัดตัวชี้วัดประสิทธิภาพของบริการ เช่น ปริมาณงาน เวลาแฝง และความแม่นยำสำหรับ GenAIExamples คุณสมบัตินี้ช่วยให้ผู้ใช้เปรียบเทียบประสิทธิภาพระหว่างการกำหนดค่าฮาร์ดแวร์ต่างๆ ได้อย่างง่ายดาย
GenAIExamples นำเสนอตัวเลือกการปรับใช้ที่ยืดหยุ่นซึ่งตอบสนองความต้องการของผู้ใช้ที่แตกต่างกัน ช่วยให้ใช้งานและการปรับใช้ในสภาพแวดล้อมต่างๆ ได้อย่างมีประสิทธิภาพ ต่อไปนี้เป็นภาพรวมโดยย่อของวิธีการหลัก 3 วิธี ได้แก่ การเริ่มต้นใช้งาน Python, Docker Compose และ Kubernetes
ผู้ใช้สามารถเลือกแนวทางที่เหมาะสมที่สุดโดยพิจารณาจากความง่ายในการตั้งค่า ความต้องการด้านความสามารถในการปรับขนาด และสภาพแวดล้อมที่พวกเขาใช้งานอยู่
การปรับใช้จะขึ้นอยู่กับอิมเมจ Docker ที่เผยแพร่ตามค่าเริ่มต้น ตรวจสอบรายการอิมเมจ Docker สำหรับข้อมูลโดยละเอียด คุณสามารถสร้างภาพของคุณเองได้โดยทำตามคำแนะนำ
ใช้กรณี | นักเทียบท่าเขียน การปรับใช้บน Xeon | นักเทียบท่าเขียน การปรับใช้กับ Gaudi | Kubernetes พร้อม Manifests | Kubernetes พร้อมแผนภูมิ Helm | Kubernetes กับ GMC |
---|---|---|---|---|---|
แชทQnA | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | ChatQnA พร้อมรายการ | ChatQnA พร้อมแผนภูมิ Helm | ChatQnA กับ GMC |
รหัสGen | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | CodeGen พร้อมรายการ | CodeGen พร้อมแผนภูมิ Helm | CodeGen กับ GMC |
รหัสทรานส์ | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | CodeTrans พร้อมรายการ | CodeTrans พร้อมแผนภูมิ Helm | CodeTrans กับ GMC |
หมอซัม | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | DocSum พร้อมรายการ | DocSum พร้อมแผนภูมิ Helm | DocSum กับ GMC |
ค้นหาQnA | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | ไม่รองรับ | ไม่รองรับ | ค้นหา QnA ด้วย GMC |
FaqGen | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | FaqGen พร้อมรายการ | ไม่รองรับ | FaqGen กับ GMC |
การแปล | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | การแปลด้วย Manifests | ไม่รองรับ | แปลกับ GMC |
เสียงQnA | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | AudioQnA พร้อมรายการ | ไม่รองรับ | AudioQnA พร้อม GMC |
VisualQnA | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | VisualQnA พร้อมรายการ | ไม่รองรับ | VisualQnA พร้อม GMC |
ต่อเนื่องหลายรูปแบบQnA | คำแนะนำของ Xeon | คำแนะนำของเกาดี้ | ไม่รองรับ | ไม่รองรับ | ไม่รองรับ |
ชุดผลผลิต | คำแนะนำของ Xeon | ไม่รองรับ | ProductivitySuite พร้อมรายการ | ไม่รองรับ | ไม่รองรับ |
ตรวจสอบที่นี่เพื่อดูข้อมูลโดยละเอียดของตัวอย่าง รุ่น ฮาร์ดแวร์ ฯลฯ ที่รองรับ
ยินดีต้อนรับสู่ชุมชนโอเพ่นซอร์ส OPEA! เรารู้สึกตื่นเต้นมากที่คุณอยู่ที่นี่และรู้สึกตื่นเต้นกับการมีส่วนร่วมที่เป็นไปได้ที่คุณสามารถนำมาสู่แพลตฟอร์ม OPEA ไม่ว่าคุณจะแก้ไขข้อบกพร่อง เพิ่มส่วนประกอบ GenAI ใหม่ ปรับปรุงเอกสารประกอบ หรือแบ่งปันกรณีการใช้งานเฉพาะของคุณ การมีส่วนร่วมของคุณมีค่าอย่างยิ่ง
เมื่อร่วมมือกัน เราจะทำให้ OPEA กลายเป็นแพลตฟอร์มสำหรับโซลูชัน AI ระดับองค์กรได้ มาทำงานร่วมกันเพื่อผลักดันขอบเขตของสิ่งที่เป็นไปได้ และสร้างอนาคตที่ AI สามารถเข้าถึงได้ มีประสิทธิภาพ และสร้างผลกระทบสำหรับทุกคน
โปรดตรวจสอบแนวทางการสนับสนุนเพื่อดูคำแนะนำโดยละเอียดเกี่ยวกับวิธีการสนับสนุนส่วนประกอบ GenAI และวิธีทั้งหมดที่คุณสามารถมีส่วนร่วมได้!
ขอขอบคุณที่เป็นส่วนหนึ่งของการเดินทางครั้งนี้ เราแทบรอไม่ไหวที่จะเห็นสิ่งที่เราสามารถบรรลุผลสำเร็จร่วมกันได้!