Anthropic近日宣布其Claude 3.5 Sonnet模型新增PDF檔案處理功能,現已進入公開測試階段。此功能可讓使用者分析PDF文件中的文字、圖像、圖表和表格等,適用範圍廣泛,包括金融報告、法律文件和文件翻譯等。 Downcodes小編將為您詳細解讀這項新功能的特性、使用方法以及需要注意的事項,幫助您更好地理解並使用這項強大的AI工具。
Claude 3.5 Sonnet 的PDF 處理流程分為三個步驟。首先,系統會從文件中提取文字內容。接著,每一頁文件會被轉換為影像,以便進行更深入的分析。這樣一來,用戶不僅可以獲得文字訊息,還能夠洞悉PDF 文件中的視覺資訊。
值得一提的是,Claude 的PDF 功能還可以與其他功能結合使用,例如提取特定資訊並將其用作工具輸入。需要注意的是,上傳的檔案必須小於32MB,且頁面數量不得超過100 頁。該系統目前不支援加密或密碼保護的文件。
處理PDF 文件的費用會根據文件的長度和內容密度而有所不同。通常,每頁文件會消耗1,500 到3,000 個tokens,而不收取超過標準token 費用的額外費用。使用者可以透過Claude Chat 功能預覽和API 存取來使用此新特性,API 請求中需要使用特定的請求頭「anthropic-beta: pdfs-2024-09-25」。 Anthropic 計劃未來將此功能擴展到Amazon Bedrock 和Google Vertex AI 平台。
為了提高處理效果,Anthropic 建議使用者確保文件中有清晰可讀的文本,以及頁面佈局正確。此外,在引用特定內容時,使用者應使用PDF 閱讀器中顯示的頁碼。而在API 使用過程中,PDF 檔案應放置在文字之前。如果文件較大,超過了限制,Anthropic 建議將其拆分為較小的部分。最後,當多次分析相同文件時,使用者還可以考慮使用提示緩存,以提高處理效率。
Claude 3.5 Sonnet 的PDF 處理功能為使用者提供了更有效率且方便的文件處理方式,相信未來將會在更多領域廣泛應用。 Anthropic 持續的改進和優化也值得期待!