rhubarb
1.0.0
Rhubarb 是一个轻量级 Python 框架,可以使用多模式大型语言模型 (LLM) 和嵌入模型轻松构建文档理解应用程序。 Rhubarb 是从头开始创建的,可与 Amazon Bedrock 和 Anthropic Claude V3 多模态语言模型以及 Amazon Titan 多模态嵌入模型配合使用。
访问大黄文档。
Rhubarb 可以执行多种文档处理任务,例如
✅ 记录问答
✅ 流式传输文档聊天(问答)
✅ 文档总结
页面级别摘要
完整摘要
特定页面的摘要
流媒体摘要
✅ 结构化数据提取
✅ 命名实体识别(NER)
内置50个常用实体
✅ 使用内置实体进行 PII 识别
✅ 从文档中理解图形和图像
解释图表、图形和数字
进行表格推理(如图)
✅ 使用多模态嵌入模型进行矢量采样的文档分类
✅ 记录代币使用情况以帮助跟踪成本
Rhubarb 带有内置系统提示,可以轻松地将其用于许多不同的文档理解用例。您可以通过传入自己的系统提示来自定义 Rhubarb。它支持基于精确 JSON 模式的输出生成,这使得它可以轻松集成到下游应用程序中。
支持 PDF、TIFF、PNG、JPG 文件(即将支持 Word、Excel、PowerPoint、CSV、Webp、eml 文件)
在内部执行文档到图像的转换以使用多模式模型
适用于本地文件或存储在 S3 中的文件
支持指定多页文档的页码
支持基于聊天记录的文档聊天
支持流式和非流式模式
首先使用pip
安装 Rhubarb 。
pip install pyrhubarb
创建boto3
会话。
导入 boto3session = boto3.Session()
本地文件
从大黄导入 DocAnalysisda = DocAnalysis(file_path="./path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="员工的名字是什么?")resp
使用 Amazon S3 中的文件
从大黄导入 DocAnalysisda = DocAnalysis(file_path="s3://path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="员工的名字是什么?")resp
有关更多使用示例,请参阅食谱。
请参阅贡献以获取更多信息。
该项目根据 Apache-2.0 许可证获得许可。