Anthropic은 최근 자사의 Claude 3.5 Sonnet 모델에 PDF 파일 처리 기능이 추가되었으며 이제 공개 테스트 단계에 진입했다고 발표했습니다. 이 기능을 사용하면 PDF 문서의 텍스트, 이미지, 차트 및 표를 분석할 수 있으며 재무 보고서, 법률 문서 및 문서 번역을 포함한 광범위한 응용 프로그램에 적용할 수 있습니다. 다운코드 편집자는 이 강력한 AI 도구를 더 잘 이해하고 사용할 수 있도록 이 새로운 기능의 기능, 사용법 및 주의 사항을 자세히 설명합니다.
Claude 3.5 Sonnet의 PDF 처리 과정은 세 단계로 나뉩니다. 먼저 시스템은 문서에서 텍스트 콘텐츠를 추출합니다. 그런 다음 문서의 각 페이지는 심층 분석을 위해 이미지로 변환됩니다. 이러한 방식으로 사용자는 텍스트 정보를 얻을 수 있을 뿐만 아니라 PDF 파일의 시각적 정보에 대한 통찰력도 얻을 수 있습니다.
Claude의 PDF 기능은 특정 정보를 추출하고 이를 도구 입력으로 사용하는 등 다른 기능과 함께 사용할 수도 있다는 점은 언급할 가치가 있습니다. 업로드되는 파일은 32MB 미만이어야 하며 페이지 수는 100페이지를 초과할 수 없다는 점에 유의하세요. 시스템은 현재 암호화되거나 비밀번호로 보호된 문서를 지원하지 않습니다.
PDF 파일 처리 비용은 문서의 길이와 내용 밀도에 따라 달라집니다. 일반적으로 표준 토큰 수수료 이상의 추가 비용 없이 문서 페이지당 1,500~3,000개의 토큰이 소비됩니다. 사용자는 Claude Chat 기능 미리보기 및 API 액세스를 통해 이 새로운 기능을 사용할 수 있습니다. API 요청에는 특정 요청 헤더 "anthropic-beta: pdfs-2024-09-25"를 사용해야 합니다. Anthropic은 향후 이 기능을 Amazon Bedrock 및 Google Vertex AI 플랫폼으로 확장할 계획입니다.
처리를 개선하기 위해 Anthropic은 사용자가 문서에 명확하고 읽기 쉬운 텍스트가 있고 페이지 레이아웃이 올바른지 확인할 것을 권장합니다. 또한 특정 콘텐츠를 참조할 때 사용자는 PDF 리더에 표시된 페이지 번호를 사용해야 합니다. API를 사용할 때 PDF 파일은 텍스트 앞에 배치되어야 합니다. 문서가 제한보다 큰 경우 Anthropic은 문서를 더 작은 부분으로 분할할 것을 권장합니다. 마지막으로, 동일한 문서를 여러 번 분석할 때 사용자는 처리 효율성을 높이기 위해 힌트 캐싱 사용을 고려할 수도 있습니다.
Claude 3.5 Sonnet의 PDF 처리 기능은 사용자에게 보다 효율적이고 편리한 문서 처리 방법을 제공하며 앞으로 더 많은 분야에서 널리 사용될 것이라고 믿습니다. Anthropic의 지속적인 개선과 최적화도 기대해볼 가치가 있습니다!