Rhubarb は、マルチモーダル大規模言語モデル (LLM) と埋め込みモデルを使用して文書理解アプリケーションを簡単に構築できる軽量の Python フレームワークです。 Rhubarb は、Amazon Bedrock および Anthropic Claude V3 マルチモーダル言語モデル、および Amazon Titan マルチモーダル埋め込みモデルと連携するためにゼロから作成されました。
Rhubarb のドキュメントにアクセスしてください。
Rhubarb は、次のような複数の文書処理タスクを実行できます。
✅ ドキュメントQ&A
✅ ドキュメント付きストリーミングチャット (Q&A)
✅ 文書の要約
ページレベルの概要
完全な要約
特定のページの概要
ストリーミングサマリー
✅ 構造化データの抽出
✅ 固有表現認識 (NER)
50 個の共通エンティティが組み込まれている
✅ 組み込みエンティティによる PII 認識
✅ 資料からの図やイメージの理解
チャート、グラフ、数字を説明する
表推論を実行します (図として)
✅ マルチモーダル埋め込みモデルを使用したベクトルサンプリングによる文書分類
✅ コストの追跡に役立つトークンの使用状況をログに記録します
Rhubarb には、さまざまな文書理解のユースケースに簡単に使用できるシステムプロンプトが組み込まれています。独自のシステム プロンプトを渡すことで、Rhubarb をカスタマイズできます。正確な JSON スキーマ ベースの出力生成をサポートしているため、ダウンストリーム アプリケーションへの統合が容易になります。
PDF、TIFF、PNG、JPG ファイルをサポート (Word、Excel、PowerPoint、CSV、Webp、eml ファイルも近日サポート予定)
マルチモーダル モデルを操作するために、ドキュメントから画像への変換を内部で実行します。
ローカルファイルまたはS3に保存されたファイルで動作します
複数ページのドキュメントのページ番号の指定をサポート
チャット履歴ベースのドキュメントチャットをサポート
ストリーミングモードと非ストリーミングモードをサポート
まず、 pip
使用して Rhubarb をインストールします。
pip install pyrhubarb
boto3
セッションを作成します。
インポート boto3session = boto3.Session()
ローカルファイル
rhubarb から import DocAnalogyda = DocAnaracy(file_path="./path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="従業員の名前は何ですか?")resp
Amazon S3 にファイルがある場合
rhubarb から import DocAnalogyda = DocAnaracy(file_path="s3://path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="従業員の名前は何ですか?")resp
その他の使用例については、クックブックを参照してください。
詳細については、「貢献」を参照してください。
このプロジェクトは、Apache-2.0 ライセンスに基づいてライセンスされています。