谷歌近日發布了Vertex AI RAG引擎,旨在簡化從知識庫檢索資訊並將其輸入大型語言模型(LLM)的流程。此工具作為Vertex AI平台的一部分,是一個託管的編排服務和資料框架,專門為開發上下文增強的LLM應用而設計。它旨在解決生成式AI和LLM面臨的挑戰,例如虛假資訊和知識局限性,從而幫助開發者建立更可靠的生成式AI解決方案。該引擎易於使用,提供託管的編排功能,並支援多種向量資料庫和自訂元件,靈活滿足不同需求。
Google最近正式推出了Vertex AI RAG 引擎,這是一款旨在簡化從知識庫中檢索相關資訊並將其輸入大型語言模型(LLM)的複雜流程的開發工具。作為Vertex AI 平台的一部分,Vertex AI RAG 引擎被定義為一種託管的編排服務和資料框架,專為開發上下文增強的LLM 應用而設計。
在1月15日的部落格中,Google提到,儘管生成式人工智慧和大型語言模型正在變革各行各業,但仍存在一些挑戰,例如虛假資訊(產生不準確或無意義的資訊)和超越訓練數據的知識局限性,這些都可能阻礙企業的採納。而Vertex AI RAG 引擎則透過實現檢索增強生成(RAG)技術,幫助軟體和人工智慧開發者建立有根據的生成式人工智慧解決方案。
Google強調了Vertex AI RAG 引擎的幾個關鍵優勢。首先,它的使用非常簡便,開發者可以透過API 迅速入手,進行原型設計和實驗。
其次,RAG 引擎提供了託管的編排功能,能夠有效處理資料檢索和LLM 整合。此外,開發者還可以根據需求選擇解析、分塊、註釋、嵌入、向量儲存以及開源模型等元件,甚至可以自訂自己的元件,展現了極大的靈活性。
另外,Vertex AI RAG 引擎也支援多種向量資料庫的連接,例如Pinecone 和Weaviate,或直接使用Vertex AI 搜尋。
谷歌在部落格中提到,該引擎在金融服務、醫療和法律等行業的應用案例,顯示了其廣泛的適用性。同時,Google也提供了豐富的資源,包括入門筆記、與Vertex AI 向量搜尋、Vertex AI 特徵庫、Pinecone 和Weaviate 的範例集成,以及檢索超參數調優的指南,幫助開發者更好地掌握和應用這款新工具。
Vertex AI RAG 引擎憑藉其易用性、靈活性和廣泛的適用性,為開發者提供了構建強大且可靠的生成式AI應用的有效工具,有望推動生成式AI技術的進一步發展和應用。