Claude 3.5 Sonnet模型增加PDF 文件處理功能可分析文件影像、圖表和表格

作者：Eve Cole 更新時間：2025-01-08 14:48:01

Anthropic近日宣布其Claude 3.5 Sonnet模型新增PDF檔案處理功能，現已進入公開測試階段。此功能可讓使用者分析PDF文件中的文字、圖像、圖表和表格等，適用範圍廣泛，包括金融報告、法律文件和文件翻譯等。 Downcodes小編將為您詳細解讀這項新功能的特性、使用方法以及需要注意的事項，幫助您更好地理解並使用這項強大的AI工具。

Claude 3.5 Sonnet 的PDF 處理流程分為三個步驟。首先，系統會從文件中提取文字內容。接著，每一頁文件會被轉換為影像，以便進行更深入的分析。這樣一來，用戶不僅可以獲得文字訊息，還能夠洞悉PDF 文件中的視覺資訊。

值得一提的是，Claude 的PDF 功能還可以與其他功能結合使用，例如提取特定資訊並將其用作工具輸入。需要注意的是，上傳的檔案必須小於32MB，且頁面數量不得超過100 頁。該系統目前不支援加密或密碼保護的文件。

處理PDF 文件的費用會根據文件的長度和內容密度而有所不同。通常，每頁文件會消耗1，500 到3，000 個tokens，而不收取超過標準token 費用的額外費用。使用者可以透過Claude Chat 功能預覽和API 存取來使用此新特性，API 請求中需要使用特定的請求頭「anthropic-beta: pdfs-2024-09-25」。 Anthropic 計劃未來將此功能擴展到Amazon Bedrock 和Google Vertex AI 平台。

為了提高處理效果，Anthropic 建議使用者確保文件中有清晰可讀的文本，以及頁面佈局正確。此外，在引用特定內容時，使用者應使用PDF 閱讀器中顯示的頁碼。而在API 使用過程中，PDF 檔案應放置在文字之前。如果文件較大，超過了限制，Anthropic 建議將其拆分為較小的部分。最後，當多次分析相同文件時，使用者還可以考慮使用提示緩存，以提高處理效率。

Claude 3.5 Sonnet 的PDF 處理功能為使用者提供了更有效率且方便的文件處理方式，相信未來將會在更多領域廣泛應用。 Anthropic 持續的改進和優化也值得期待！