用于大规模构建企业 RAG(Retriever Augmented Generation)管道的快速框架 - 由 watsonx 提供支持
欢迎来到 SuperKnowa GitHub 存储库! SuperKnowa 框架可加速您的企业生成式 AI 应用程序,以便根据您的私有数据快速获得产品就绪的解决方案。在这里,您会发现各种可插入组件,旨在使用大型语言模型 (LLM) 处理各种生成式 AI 用例。将这些组件视为构建块,就像乐高积木一样,您可以组装它们来解决人工智能驱动的文本生成领域的各种挑战。这些都经过了从 1M 到 200M 私人知识库的实战测试,并可扩展到数十亿个检索器代币。
SuperKnowa RAG 框架和关键构建块的整体流程:
使用单个文件的 SuperKnowa RAG 管道的可配置组件:
SuperKnowa 是一个使用 watsonx 开发的强大框架(在此处观看 watsonx.ai 上的视频),它利用大型语言模型 (LLM) 的功能来提供一系列高级生成式 AI 用例。该存储库向您介绍 SuperKnowa 涵盖的各种用例。
在我们富有洞察力的博客文章中了解有关 SuperKnowa 的更多信息:
封面博客 - SuperKnowa:大规模构建企业 RAG 解决方案 https://medium.com/towards-generative-ai/superknowa-simplest-framework-yet-to-swiftly-build-enterprise-rag-solutions-at-scale-ca90b49be28a
尝试使用 SuperKnowa 框架和基于 100 万个不同文档的私有知识库构建的实时应用程序:
https://superknowa.tsglwatson.buildlab.cloud/
(如果您没有 IBM ID,请在此处获取 - https://www.ibm.com/account/reg/us-en/signup?formid=urx-19776)
您可以通过更新config.yaml
文件开始并运行 LLMQnA.py 脚本来快速配置 RAG 管道:
retriever:
indexName: superknowa
query: What is IBM Cloud?
....
reranker:
query: What is IBM Data and Analytics Reference Architecture?
...
LLMQnA:
question: What is IBM Data and Analytics Reference Architecture?
...
要探索 SuperKnowa 的特性和功能,请参阅此存储库中提供的博客系列、代码示例和资源。
有关详细说明和示例,请导航至每个组件的目录。使用 SuperKnowa 的生成式 AI 乐高组件在您的项目中释放大型语言模型的潜力!
让我们通过 SuperKnowa 释放生成式人工智能的潜力,塑造人工智能驱动的知识处理的未来!
索引文档
弹性搜索
索尔
沃森发现
神经检索器
弹性搜索
索尔
重新排序
使用法学硕士进行情境学习
法学硕士评估
LLM模型评估
MLFLOW 集成
微调
指导数据库
使用 QLORA 微调 Falcon 7B
使用 QLORA 微调 LLAMA2 7B
RLHF模型
部署和推断
后端
部署
人工智能对齐工具
企业法学硕士用例
通过捕获人类输入,衡量人工智能模型在有用性、有害性和准确性指标上的一致性。
构建各种在线和离线实验进行评估,并使用交互式仪表板比较 AI 对齐结果。
Eval_Package 是一个工具,旨在评估 LLM(语言模型)在包含问题、上下文和理想答案的数据集上的性能。它允许您对各种数据集进行评估,并评估模型根据 BLUE、ROUGE 等数十种统计指标生成答案的效果。
MLflow_Package 是一个综合工具包,旨在集成 Eval_Package 的结果并有效跟踪和管理实验。它还使您能够创建用于评估比较的排行榜并通过仪表板可视化指标。
以下是使用 SuperKnowa 框架构建的生成式 AI 用例列表。
使用 SuperKnowa 的对话式问答 (Q&A) 系统进行自然语言对话。根据私营企业知识库提出问题,并获得详细的、上下文相关的答复。
利用 SuperKnowa 的“询问您的文档”功能来释放 PDF 和文本文档的潜力。 SuperKnowa 可以帮助您提取相关信息、回答特定问题并协助信息检索。
使用 FlanT5 和 UL2,利用 SuperKnowa 的摘要功能在大型文本语料库中轻松生成连贯且内容丰富的摘要。从文章、报告和其他文本中提取要点和基本细节,以便有效理解内容。
SuperKnowa 的抽象摘要功能超越了使用 FlanUL2 和 LLAMA2 的简单提取。它可以分析冗长的 PDF 文档并生成简洁的抽象摘要,捕捉内容的精髓。此外,SuperKnowa 还可以识别关键点,从而更容易理解和传达复杂的信息。
体验 SuperKnowa 文本到 SQL 功能的强大功能,它将自然语言查询转换为结构化 SQL 查询。使用简单语言与数据库交互,无需 SQL 专业知识。
创建和架构师
建设者
该框架由 IBM Ecosystem 的 Build Lab 开发。请注意,提供此内容是为了促进嵌入式人工智能技术的采用并为生态系统合作伙伴提供服务。内容可能包括正在向美国专利商标局申请专利并受美国专利法保护的系统和方法。 SuperKnowa 不是一个产品,而是一个构建在 IBM watsonx 之上的框架,以及其他产品,例如来自 Meta 的 LLAMA 模型和来自 Databricks 的 ML Flow。使用 SuperKnowa 隐式要求同意这些产品的条款和条件。该框架按原样提供,以加速企业 GenAI 应用程序的开发。如有任何疑问,请联系 [email protected]。
版权所有@2023 IBM 公司。