Document AI Toolbox: Document AI Toolbox は、Document AI BatchProcessDocuments()
(ユーザー管理の GCS バケットに書き込まれる JSON ファイル) およびProcessDocument()
メソッドの出力からプログラムで情報を管理、操作、抽出する手間を軽減することを目的としています。
免責事項
Document AI Toolbox は実験段階にあります。このライブラリは進行中のものであり、下位互換性のない変更が含まれる可能性があります。ツールボックスのユーザーは、ツールボックスのバージョンをアップグレードするときにコードを書き直す必要がある場合があります。
このライブラリを使用するには、まず次の手順を実行する必要があります。
ProcessDocument()
使用が意図されていない限り、このライブラリを使用するために Document AI を有効にすることは技術的に必要ではありません。ただし、 BatchProcessDocument()
の出力を含む GCS バケットにアクセスするには、Storage API を有効にする必要があります。 BigQuery の機能を使用する場合は、BigQuery API を有効にする必要があります。
pip を使用して、このライブラリを virtualenv にインストールします。 virtualenv は、分離された Python 環境を作成するツールです。これが対処する基本的な問題は、依存関係とバージョン、および間接的なアクセス許可の 1 つです。
virtualenv を使用すると、システムのインストール権限を必要とせず、インストールされているシステムの依存関係と衝突することなく、このライブラリをインストールできます。
コード サンプルとスニペットは、samples/ フォルダーにあります。
当社のクライアント ライブラリは、Python の現在のすべてのアクティブ バージョンとメンテナンス バージョンと互換性があります。
Python >= 3.8
Python <= 3.7
注: Python 3.7 は、2023 年 6 月に Python コミュニティによってサポートされていないとマークされました。すべての開発者は、できるだけ早く Python 3.8 以降にアップグレードすることをお勧めします。 Python 3.7 のサポートは、2024 年 1 月 1 日以降、すべてのクライアント ライブラリから削除されます。Python 3.7 をサポートするクライアント ライブラリは引き続きダウンロードできますが、2024 年 1 月 1 日以降のリリースは Python 3.8 以降のみを対象とします。
Python のサポート終了バージョンを使用している場合は、アクティブにサポートされているバージョンにできるだけ早く更新することをお勧めします。
pip install virtualenv
virtualenv <your-env>
source <your-env>/bin/activate
<your-env>/bin/pip install google-cloud-documentai-toolbox
pip install virtualenv
virtualenv <your-env>
<your-env>Scriptsactivate
<your-env>Scriptspip.exe install google-cloud-documentai-toolbox