Claude 3.5 Sonnet模型增加PDF 文件處理功能可分析文檔圖像、圖表和表格- AI文章

作者：Eve Cole 更新時間：2025-02-16 21:00:02

Anthropic近日宣布其Claude 3.5 Sonnet模型新增PDF文件處理功能，現已進入公開測試階段。此功能允許用戶分析PDF文檔中的文本和視覺元素，包括圖像、圖表和表格等，應用範圍廣泛，涵蓋金融報告、法律文件及文檔翻譯等。此舉進一步擴展了Claude的功能，為用戶提供更強大的文檔處理能力，提升工作效率。

近日，人工智能公司Anthropic 宣布，在其Claude 3.5 Sonnet 模型中增加了PDF 文件處理的功能，目前該功能已進入公共測試階段。用戶現在可以使用該模型分析PDF 文檔中的文本和視覺元素，包括圖像、圖表和表格等，適用於金融報告、法律文件以及文檔翻譯等多種場景。

Claude 3.5 Sonnet 的PDF 處理過程分為三個步驟。首先，系統會從文檔中提取文本內容。接著，每一頁文檔會被轉換為圖像，以便進行更深入的分析。這樣一來，用戶不僅可以獲取文本信息，還能夠洞悉PDF 文件中的視覺信息。

值得一提的是，Claude 的PDF 功能還可以與其他功能結合使用，比如提取特定信息並將其用作工具輸入。需要注意的是，上傳的文件必須小於32MB，且頁面數量不得超過100 頁。該系統目前不支持加密或密碼保護的文檔。

處理PDF 文件的費用會根據文檔的長度和內容密度有所不同。通常，每頁文檔會消耗1，500 到3，000 個tokens，而不收取超過標準token 費用的額外費用。用戶可以通過Claude Chat 功能預覽和API 訪問來使用這一新特性，API 請求中需要使用特定的請求頭“anthropic-beta: pdfs-2024-09-25”。 Anthropic 計劃未來將此功能擴展到Amazon Bedrock 和Google Vertex AI 平台。

為了提高處理效果，Anthropic 建議用戶確保文檔中有清晰可讀的文本，以及頁面佈局正確。此外，在引用特定內容時，用戶應使用PDF 閱讀器中顯示的頁碼。而在API 使用過程中，PDF 文件應放置在文本之前。如果文檔較大，超過了限制，Anthropic 建議將其拆分為較小的部分。最後，當多次分析同一文檔時，用戶還可以考慮使用提示緩存，以提高處理效率。

劃重點：

Anthropic 推出Claude 3.5 Sonnet，增加PDF 文件處理功能，支持文本和圖像分析。

處理過程分為提取文本、轉換頁面為圖像和綜合分析三個步驟。

處理費用根據文檔長度和內容密度而異，用戶需遵循文件大小和頁數限制。

Claude 3.5 Sonnet 的PDF 處理功能為用戶提供了高效便捷的文檔分析解決方案，未來其應用範圍將進一步擴大，值得期待其在更多平台的應用和功能升級。