Document AI Toolbox:Document AI Toolbox 旨在减少以编程方式从 Document AI BatchProcessDocuments()
(写入用户管理的 GCS 存储桶的 JSON 文件)和ProcessDocument()
方法的输出中管理、操作和提取信息的摩擦。
免责声明
Document AI Toolbox 处于实验状态。该库正在开发中,可能会有向后不兼容的更改。工具箱的用户在升级工具箱版本时可能需要重写代码。
为了使用这个库,您首先需要执行以下步骤:
从技术上讲,使用此库可能不需要启用文档 AI,除非打算使用ProcessDocument()
。但您必须启用存储 API 才能访问包含BatchProcessDocument()
输出的 GCS 存储桶。如果您打算使用 BigQuery 功能,则需要启用 BigQuery API。
使用 pip 在 virtualenv 中安装此库。 virtualenv 是一个创建隔离的 Python 环境的工具。它解决的基本问题是依赖关系和版本以及间接权限之一。
使用 virtualenv,可以在不需要系统安装权限的情况下安装此库,并且不会与已安装的系统依赖项发生冲突。
代码示例和片段位于示例/文件夹中。
我们的客户端库与所有当前有效和维护版本的 Python 兼容。
Python >= 3.8
Python <= 3.7
注意:2023 年 6 月,Python 社区将 Python 3.7 标记为不受支持。我们建议所有开发人员尽快升级到 Python 3.8 及更高版本。 2024 年 1 月 1 日之后,将对 Python 3.7 的支持将从所有客户端库中删除。支持 Python 3.7 的客户端库将继续可供下载,但 2024 年 1 月 1 日之后的版本将仅针对 Python 3.8 及更高版本。
如果您使用的是 Python 的终止版本,我们建议您尽快更新到受积极支持的版本。
pip install virtualenv
virtualenv <your-env>
source <your-env>/bin/activate
<your-env>/bin/pip install google-cloud-documentai-toolbox
pip install virtualenv
virtualenv <your-env>
<your-env>Scriptsactivate
<your-env>Scriptspip.exe install google-cloud-documentai-toolbox