Google baru-baru ini merilis mesin Vertex AI RAG, yang bertujuan untuk menyederhanakan proses pengambilan informasi dari basis pengetahuan dan memasukkannya ke dalam model bahasa besar (LLM). Alat ini, bagian dari platform Vertex AI, adalah layanan orkestrasi terkelola dan kerangka data yang dirancang khusus untuk mengembangkan aplikasi LLM yang ditingkatkan konteks. Hal ini bertujuan untuk mengatasi tantangan yang dihadapi oleh AI generatif dan LLM, seperti informasi palsu dan keterbatasan pengetahuan, sehingga membantu pengembang membangun solusi AI generatif yang lebih andal. Mesinnya mudah digunakan, menyediakan kemampuan orkestrasi terkelola, dan mendukung berbagai database vektor dan komponen khusus untuk secara fleksibel memenuhi berbagai kebutuhan.
Google baru-baru ini secara resmi meluncurkan mesin Vertex AI RAG, alat pengembangan yang dirancang untuk menyederhanakan proses kompleks dalam mengambil informasi relevan dari basis pengetahuan dan memasukkannya ke dalam model bahasa besar (LLM). Sebagai bagian dari platform Vertex AI, mesin Vertex AI RAG didefinisikan sebagai layanan orkestrasi terkelola dan kerangka data yang dirancang untuk mengembangkan aplikasi LLM yang ditingkatkan konteks.
Dalam postingan blognya pada tanggal 15 Januari, Google menyebutkan bahwa meskipun kecerdasan buatan generatif dan model bahasa besar mengubah berbagai industri, masih ada beberapa tantangan, seperti disinformasi (menghasilkan informasi yang tidak akurat atau tidak berarti) dan di luar pelatihan. Keterbatasan pengetahuan atas data , yang dapat menghambat adopsi perusahaan. Mesin Vertex AI RAG membantu pengembang perangkat lunak dan kecerdasan buatan membangun solusi kecerdasan buatan generatif yang kuat dengan menerapkan teknologi retrieval-enhanced generation (RAG).
Google menyoroti beberapa keunggulan utama mesin Vertex AI RAG. Pertama-tama, ini sangat mudah digunakan. Pengembang dapat dengan cepat memulai melalui API untuk pembuatan prototipe dan eksperimen.
Kedua, mesin RAG menyediakan kemampuan orkestrasi terkelola untuk menangani pengambilan data dan integrasi LLM secara efisien. Selain itu, pengembang juga dapat memilih komponen seperti parsing, chunking, anotasi, penyematan, penyimpanan vektor, dan model sumber terbuka sesuai dengan kebutuhan mereka, dan mereka bahkan dapat menyesuaikan komponen mereka sendiri, sehingga menunjukkan fleksibilitas yang tinggi.
Selain itu, mesin Vertex AI RAG juga mendukung koneksi ke berbagai database vektor, seperti Pinecone dan Weaviate, atau penggunaan langsung pencarian Vertex AI.
Google menyebutkan dalam blognya bahwa kasus penerapan mesin ini di industri jasa keuangan, medis, dan hukum menunjukkan penerapannya yang luas. Pada saat yang sama, Google juga menyediakan banyak sumber daya, termasuk catatan pengantar, contoh integrasi dengan pencarian vektor Vertex AI, pustaka fitur Vertex AI, Pinecone dan Weaviate, serta panduan penyetelan hyperparameter pencarian untuk membantu pengembang lebih menguasai dan menerapkan hal baru ini. alat.
Dengan kemudahan penggunaan, fleksibilitas, dan penerapan yang luas, mesin Vertex AI RAG memberi pengembang alat yang efektif untuk membangun aplikasi AI generatif yang kuat dan andal, dan diharapkan dapat mendorong pengembangan lebih lanjut dan penerapan teknologi AI generatif.