Kerangka Kerja Cepat untuk membangun Saluran Pipa Enterprise RAG (Retriever Augmented Generation) dalam Skala Besar - didukung oleh watsonx
Selamat datang di repositori SuperKnowa GitHub! Kerangka kerja SuperKnowa mempercepat aplikasi AI Generatif Perusahaan Anda untuk mendapatkan solusi siap pakai dengan cepat pada data pribadi Anda. Di sini, Anda akan menemukan beragam koleksi komponen pluggable yang dirancang untuk menangani berbagai kasus penggunaan AI Generatif menggunakan Large Language Model (LLM). Bayangkan komponen-komponen ini sebagai elemen penyusun, seperti potongan Lego, yang dapat Anda rakit untuk mengatasi berbagai tantangan dalam bidang pembuatan teks berbasis AI. Ini telah teruji pertempuran dari 1 juta hingga 200 juta basis pengetahuan pribadi & ditingkatkan hingga miliaran token retriever.
Keseluruhan alur kerangka SuperKnowa RAG & blok bangunan utama:
Komponen yang dapat dikonfigurasi untuk pipeline SuperKnowa RAG menggunakan satu file:
SuperKnowa adalah kerangka kerja canggih yang dikembangkan menggunakan watsonx (tonton video di watsonx.ai di sini) yang memanfaatkan kemampuan Model Bahasa Besar (LLM) untuk menawarkan berbagai kasus penggunaan AI Generatif tingkat lanjut. Repositori ini memperkenalkan Anda pada berbagai kasus penggunaan yang dicakup oleh SuperKnowa.
Pelajari lebih lanjut tentang SuperKnowa di postingan blog kami yang penuh wawasan:
Blog Sampul - SuperKnowa: Membangun Solusi RAG Perusahaan dalam Skala Besar https://medium.com/towards-generative-ai/superknowa-simplest-framework-yet-to-swiftly-build-enterprise-rag-solutions-at-scale-ca90b49be28a
Cobalah kerangka SuperKnowa dengan aplikasi langsung yang dibangun di atas basis pengetahuan pribadi dari 1 juta dokumen yang beragam:
https://superknowa.tsglwatson.buildlab.cloud/
(Jika Anda tidak memiliki ID IBM, silakan dapatkan di sini - https://www.ibm.com/account/reg/us-en/signup?formid=urx-19776)
Anda dapat memulai dengan memperbarui file config.yaml
dan menjalankan skrip LLMQnA.py untuk mengonfigurasi pipeline RAG Anda dengan cepat:
retriever:
indexName: superknowa
query: What is IBM Cloud?
....
reranker:
query: What is IBM Data and Analytics Reference Architecture?
...
LLMQnA:
question: What is IBM Data and Analytics Reference Architecture?
...
Untuk menjelajahi fitur dan kemampuan SuperKnowa, lihat seri blog, contoh kode, dan sumber daya yang disediakan dalam repositori ini.
Untuk petunjuk dan contoh mendetail, navigasikan ke direktori masing-masing komponen. Bebaskan potensi Model Bahasa Besar dalam proyek Anda menggunakan Komponen Lego AI Generatif SuperKnowa!
Mari kita buka potensi AI Generatif dengan SuperKnowa dan bentuk masa depan pemrosesan pengetahuan yang didukung AI!
Mengindeks Dokumen
Pencarian Elastis
Solr
Penemuan Watson
Retriever Neural
Pencarian Elastis
Solr
Ranker Ulang
Pembelajaran dalam konteks menggunakan LLM
Evaluasi LLM
Evaluasi Model LLM
Integrasi MLFLOW
Penyempurnaan
Instruksikan DB
Menyempurnakan Falcon 7B menggunakan QLORA
Menyempurnakan LLAMA2 7B menggunakan QLORA
Model RLHF
Terapkan & Simpulkan
Bagian belakang
Penyebaran
Alat Penyelarasan AI
Kasus Penggunaan LLM Perusahaan
Ukur keselarasan model AI pada metrik manfaat, bahaya, dan akurasi dengan menangkap masukan manusia.
Bangun berbagai eksperimen online & offline untuk evaluasi dan bandingkan hasil penyelarasan AI menggunakan dasbor interaktif.
Eval_Package adalah alat yang dirancang untuk mengevaluasi kinerja LLM (Model Bahasa) pada kumpulan data yang berisi pertanyaan, konteks, dan jawaban ideal. Hal ini memungkinkan Anda menjalankan evaluasi pada berbagai kumpulan data dan menilai seberapa baik Model menghasilkan jawaban pada lusinan metrik statistik seperti BLUE, ROUGE, dll.
MLflow_Package adalah perangkat komprehensif yang dirancang untuk mengintegrasikan hasil dari Eval_Package dan melacak serta mengelola eksperimen secara efisien. Ini juga memungkinkan Anda membuat papan peringkat untuk perbandingan evaluasi dan memvisualisasikan metrik melalui dasbor.
Di bawah ini adalah daftar kasus penggunaan AI Generatif yang dibuat menggunakan kerangka SuperKnowa.
Terlibat dalam percakapan bahasa alami dengan sistem Tanya Jawab (Tanya Jawab) percakapan SuperKnowa. Ajukan pertanyaan berdasarkan basis pengetahuan perusahaan swasta, dan terima respons yang terperinci dan sesuai konteks.
Manfaatkan fitur "Tanyakan dokumen Anda" SuperKnowa untuk membuka potensi PDF dan dokumen teks Anda. SuperKnowa dapat membantu Anda mengekstrak informasi yang relevan, menjawab pertanyaan spesifik, dan membantu pencarian informasi.
Buat ringkasan yang koheren dan informatif dengan mudah menggunakan fitur ringkasan SuperKnowa di seluruh korpus teks besar menggunakan FlanT5 dan UL2. Ekstrak poin utama dan detail penting dari artikel, laporan, dan teks lainnya, sehingga memungkinkan pemahaman konten yang efisien.
Fitur peringkasan abstrak SuperKnowa lebih dari sekadar ekstraksi sederhana menggunakan FlanUL2, dan LLAMA2. Itu dapat menganalisis dokumen PDF yang panjang dan menghasilkan ringkasan abstraktif yang ringkas, menangkap esensi konten. Selain itu, SuperKnowa mengidentifikasi poin-poin penting, sehingga lebih mudah untuk memahami dan mengkomunikasikan informasi yang kompleks.
Rasakan kekuatan kemampuan Text-to-SQL SuperKnowa, yang mengubah kueri bahasa alami menjadi kueri SQL terstruktur. Berinteraksi dengan database menggunakan bahasa sederhana, sehingga menghilangkan kebutuhan akan keahlian dalam SQL.
Dibuat & Didesain Oleh
Pembangun
Kerangka kerja ini dikembangkan oleh Build Lab, IBM Ecosystem. Harap diperhatikan bahwa konten ini disediakan untuk mendorong adopsi teknologi AI yang Dapat Disematkan dan melayani mitra ekosistem. Kontennya mungkin mencakup sistem & metode yang menunggu paten dari USPTO dan dilindungi berdasarkan Undang-Undang Paten AS. SuperKnowa bukanlah sebuah produk melainkan kerangka kerja yang dibangun di atas IBM watsonx bersama dengan produk lain seperti model LLAMA dari Meta & ML Flow dari Databricks. Menggunakan SuperKnowa secara implisit memerlukan persetujuan terhadap Syarat dan ketentuan produk tersebut. Kerangka kerja ini tersedia apa adanya untuk mempercepat pengembangan aplikasi Enterprise GenAI. Jika ada pertanyaan, silakan hubungi [email protected].
Hak Cipta @ 2023 IBM Corporation.