Anthropic近日宣布其Claude 3.5 Sonnet模型新增PDF文件處理功能,現已進入公開測試階段。此功能允許用戶分析PDF文檔中的文本和視覺元素,包括圖像、圖表和表格等,應用範圍廣泛,涵蓋金融報告、法律文件及文檔翻譯等。此舉進一步擴展了Claude的功能,為用戶提供更強大的文檔處理能力,提升工作效率。
近日,人工智能公司Anthropic 宣布,在其Claude 3.5 Sonnet 模型中增加了PDF 文件處理的功能,目前該功能已進入公共測試階段。用戶現在可以使用該模型分析PDF 文檔中的文本和視覺元素,包括圖像、圖表和表格等,適用於金融報告、法律文件以及文檔翻譯等多種場景。
Claude 3.5 Sonnet 的PDF 處理過程分為三個步驟。首先,系統會從文檔中提取文本內容。接著,每一頁文檔會被轉換為圖像,以便進行更深入的分析。這樣一來,用戶不僅可以獲取文本信息,還能夠洞悉PDF 文件中的視覺信息。
值得一提的是,Claude 的PDF 功能還可以與其他功能結合使用,比如提取特定信息並將其用作工具輸入。需要注意的是,上傳的文件必須小於32MB,且頁面數量不得超過100 頁。該系統目前不支持加密或密碼保護的文檔。
處理PDF 文件的費用會根據文檔的長度和內容密度有所不同。通常,每頁文檔會消耗1,500 到3,000 個tokens,而不收取超過標準token 費用的額外費用。用戶可以通過Claude Chat 功能預覽和API 訪問來使用這一新特性,API 請求中需要使用特定的請求頭“anthropic-beta: pdfs-2024-09-25”。 Anthropic 計劃未來將此功能擴展到Amazon Bedrock 和Google Vertex AI 平台。
為了提高處理效果,Anthropic 建議用戶確保文檔中有清晰可讀的文本,以及頁面佈局正確。此外,在引用特定內容時,用戶應使用PDF 閱讀器中顯示的頁碼。而在API 使用過程中,PDF 文件應放置在文本之前。如果文檔較大,超過了限制,Anthropic 建議將其拆分為較小的部分。最後,當多次分析同一文檔時,用戶還可以考慮使用提示緩存,以提高處理效率。
劃重點:
Anthropic 推出Claude 3.5 Sonnet,增加PDF 文件處理功能,支持文本和圖像分析。
處理過程分為提取文本、轉換頁面為圖像和綜合分析三個步驟。
處理費用根據文檔長度和內容密度而異,用戶需遵循文件大小和頁數限制。
Claude 3.5 Sonnet 的PDF 處理功能為用戶提供了高效便捷的文檔分析解決方案,未來其應用範圍將進一步擴大,值得期待其在更多平台的應用和功能升級。