Google เพิ่งเปิดตัวเครื่องมือ Vertex AI RAG ซึ่งมีจุดมุ่งหมายเพื่อลดความซับซ้อนของกระบวนการดึงข้อมูลจากฐานความรู้และป้อนลงในโมเดลภาษาขนาดใหญ่ (LLM) เครื่องมือนี้ ซึ่งเป็นส่วนหนึ่งของแพลตฟอร์ม Vertex AI คือบริการประสานการจัดการและเฟรมเวิร์กข้อมูลที่ออกแบบมาโดยเฉพาะสำหรับการพัฒนาแอปพลิเคชัน LLM ที่ปรับปรุงบริบท โดยมีจุดมุ่งหมายเพื่อจัดการกับความท้าทายที่ Generative AI และ LLM ต้องเผชิญ เช่น ข้อมูลเท็จและข้อจำกัดด้านความรู้ ซึ่งช่วยให้นักพัฒนาสร้างโซลูชัน Generative AI ที่เชื่อถือได้มากขึ้น เอ็นจิ้นนี้ใช้งานง่าย มีความสามารถในการจัดระเบียบที่มีการจัดการ และรองรับฐานข้อมูลเวกเตอร์และส่วนประกอบแบบกำหนดเองที่หลากหลาย เพื่อตอบสนองความต้องการที่แตกต่างกันอย่างยืดหยุ่น
เมื่อเร็วๆ นี้ Google ได้เปิดตัวกลไก Vertex AI RAG อย่างเป็นทางการ ซึ่งเป็นเครื่องมือพัฒนาที่ออกแบบมาเพื่อลดความซับซ้อนของกระบวนการที่ซับซ้อนในการดึงข้อมูลที่เกี่ยวข้องจากฐานความรู้และป้อนลงในโมเดลภาษาขนาดใหญ่ (LLM) ในฐานะที่เป็นส่วนหนึ่งของแพลตฟอร์ม Vertex AI เอ็นจิ้น Vertex AI RAG ถูกกำหนดให้เป็นบริการประสานการจัดการและเฟรมเวิร์กข้อมูลที่ออกแบบมาเพื่อการพัฒนาแอปพลิเคชัน LLM ที่ปรับปรุงบริบท
ในบล็อกโพสต์เมื่อวันที่ 15 มกราคม Google กล่าวว่าแม้ว่าปัญญาประดิษฐ์ทั่วไปและแบบจำลองภาษาขนาดใหญ่กำลังเปลี่ยนแปลงอุตสาหกรรมต่างๆ แต่ก็ยังมีความท้าทายอยู่บ้าง เช่น การบิดเบือนข้อมูล (การสร้างข้อมูลที่ไม่ถูกต้องหรือไร้ความหมาย) และข้อจำกัดด้านความรู้นอกการฝึกอบรมของข้อมูล ซึ่งอาจขัดขวางการนำองค์กรไปใช้ กลไก Vertex AI RAG ช่วยให้นักพัฒนาซอฟต์แวร์และปัญญาประดิษฐ์สร้างโซลูชันปัญญาประดิษฐ์แบบเจนเนอเรชันที่มีรากฐานอย่างดี โดยการนำเทคโนโลยีการสร้างข้อมูลที่เพิ่มประสิทธิภาพในการดึงข้อมูล (RAG) มาใช้
Google เน้นย้ำข้อดีที่สำคัญหลายประการของเอ็นจิ้น Vertex AI RAG ประการแรก มันใช้งานง่ายมากและนักพัฒนาสามารถเริ่มต้นใช้งาน API เพื่อสร้างต้นแบบและการทดลองได้อย่างรวดเร็ว
ประการที่สอง กลไก RAG มอบความสามารถในการประสานการจัดการที่มีการจัดการ เพื่อจัดการการดึงข้อมูลและการรวม LLM ได้อย่างมีประสิทธิภาพ นอกจากนี้ นักพัฒนายังสามารถเลือกส่วนประกอบต่างๆ เช่น การแยกวิเคราะห์ การแบ่งส่วน คำอธิบายประกอบ การฝัง พื้นที่เก็บข้อมูลเวกเตอร์ และโมเดลโอเพ่นซอร์สได้ตามความต้องการ และยังสามารถปรับแต่งส่วนประกอบของตนเองได้ ซึ่งแสดงความยืดหยุ่นอย่างมาก
นอกจากนี้ เอ็นจิ้น Vertex AI RAG ยังรองรับการเชื่อมต่อกับฐานข้อมูลเวกเตอร์ที่หลากหลาย เช่น Pinecone และ Weaviate หรือการใช้การค้นหา Vertex AI โดยตรง
Google กล่าวถึงในบล็อกว่ากรณีการใช้งานกลไกนี้ในอุตสาหกรรมบริการทางการเงิน การแพทย์ และกฎหมาย แสดงให้เห็นถึงความสามารถในการนำไปใช้ในวงกว้าง ในเวลาเดียวกัน Google ยังมอบทรัพยากรมากมาย รวมถึงบันทึกเบื้องต้น ตัวอย่างการบูรณาการกับการค้นหาเวกเตอร์ Vertex AI, ไลบรารีฟีเจอร์ Vertex AI, Pinecone และ Weaviate ตลอดจนคำแนะนำในการปรับแต่งไฮเปอร์พารามิเตอร์ในการดึงข้อมูล เพื่อช่วยให้นักพัฒนาเชี่ยวชาญและประยุกต์ใช้สิ่งใหม่นี้ได้ดียิ่งขึ้น เครื่องมือ.
ด้วยความง่ายในการใช้งาน ความยืดหยุ่น และการนำไปใช้งานในวงกว้าง เครื่องยนต์ Vertex AI RAG ช่วยให้นักพัฒนามีเครื่องมือที่มีประสิทธิภาพในการสร้างแอปพลิเคชัน generative AI ที่ทรงพลังและเชื่อถือได้ และคาดว่าจะส่งเสริมการพัฒนาและการประยุกต์ใช้เทคโนโลยี generative AI ต่อไป