フランセ |ポルトガル語 |スペイン語 | 中国語
Parsrは、最小限のフットプリントでドキュメント ( image、pdf、docx、eml ) のクリーニング、解析、抽出を行うツールチェーンであり、すぐに利用可能で整理された使用可能なデータをJSON、Markdown (MD)、CSV/Pandas DFまたはTXT形式で生成します。
アナリスト、データ サイエンティスト、開発者に、データ入力やドキュメント アナリストの自動化、アーカイブなどに至る、すぐに使用できるアプリケーション向けに、整理された構造化され、ラベルが強化された情報セットを提供します。
現在、Parsr は、ドキュメントのクリーニング、階層の再生成(単語、行、段落)、見出し、表、リスト、目次、ページ番号、ヘッダー/フッター、リンクなどの検出を実行できます。すべての機能をチェックしてください。
-- 高度なインストール ガイドはここから入手できます --
Parsr API をインストールして実行する最も簡単な方法は、Docker イメージを使用することです。
docker pull axarev/parsr
ドキュメントを送信して結果を視覚化するための GUI もインストールしたい場合は、次のようにします。
docker pull axarev/parsr-ui-localhost
注: Parsr は (Docker コンテナ経由ではなく) ベアメタルでインストールすることもできます。その手順はインストール ガイドに記載されています。
-- 高度な使用ガイドはここから入手できます --
API を実行するには、次を発行します。
docker run -p 3001:3001 axarev/parsr
これにより、http://localhost:3001 で起動されます。
API の使用法についてはドキュメントを参照してください。
Pythonクライアントから Parsr API にアクセスするには、次のコマンドを発行します。
pip install parsr-client
Python クライアントを使用してJupyter Notebook をサンプルするには、jupyter デモに移動してください。
docker run -t -p 8080:80 axarev/parsr-ui-localhost:latest
GUI ビューアで構成可能なオプションを解釈するには、構成ドキュメントを参照してください。
API ベースの使用法とコマンド ラインの使用法については、高度な使用法ガイドに記載されています。
すべてのドキュメント ファイルはここにあります。
投稿ガイドラインを参照してください。
サードパーティ ライブラリの依存関係のライセンス:
Copyright 2020 AXA Group Operations SA
Apache 2.0 ライセンスに基づいてライセンスされています (LICENSE ファイルを参照)。