Claude 3.5 Sonnet模型增加PDF 文件处理功能可分析文档图像、图表和表格

作者：Eve Cole 更新时间：2025-01-08 14:48:01

Anthropic近日宣布其Claude 3.5 Sonnet模型新增PDF文件处理功能，现已进入公共测试阶段。该功能允许用户分析PDF文档中的文本、图像、图表和表格等，适用范围广泛，包括金融报告、法律文件和文档翻译等。Downcodes小编将为您详细解读这一新功能的特性、使用方法以及需要注意的事项，帮助您更好地理解并使用这项强大的AI工具。

Claude 3.5 Sonnet 的 PDF 处理过程分为三个步骤。首先，系统会从文档中提取文本内容。接着，每一页文档会被转换为图像，以便进行更深入的分析。这样一来，用户不仅可以获取文本信息，还能够洞悉 PDF 文件中的视觉信息。

值得一提的是，Claude 的 PDF 功能还可以与其他功能结合使用，比如提取特定信息并将其用作工具输入。需要注意的是，上传的文件必须小于 32MB，且页面数量不得超过 100 页。该系统目前不支持加密或密码保护的文档。

处理 PDF 文件的费用会根据文档的长度和内容密度有所不同。通常，每页文档会消耗 1，500 到 3，000 个 tokens，而不收取超过标准 token 费用的额外费用。用户可以通过 Claude Chat 功能预览和 API 访问来使用这一新特性，API 请求中需要使用特定的请求头 “anthropic-beta: pdfs-2024-09-25”。Anthropic 计划未来将此功能扩展到 Amazon Bedrock 和 Google Vertex AI 平台。

为了提高处理效果，Anthropic 建议用户确保文档中有清晰可读的文本，以及页面布局正确。此外，在引用特定内容时，用户应使用 PDF 阅读器中显示的页码。而在 API 使用过程中，PDF 文件应放置在文本之前。如果文档较大，超过了限制，Anthropic 建议将其拆分为较小的部分。最后，当多次分析同一文档时，用户还可以考虑使用提示缓存，以提高处理效率。

Claude 3.5 Sonnet 的 PDF 处理功能为用户提供了更加高效便捷的文档处理方式，相信未来将会在更多领域得到广泛应用。 Anthropic 持续的改进和优化也值得期待！

Claude 3.5 Sonnet模型增加PDF 文件处理功能 可分析文档图像、图表和表格

Claude 3.5 Sonnet模型增加PDF 文件处理功能可分析文档图像、图表和表格