A Anthropic anunciou recentemente que seu modelo Claude 3.5 Sonnet adicionou recursos de processamento de arquivos PDF e agora entrou na fase de testes públicos. Esta função permite aos usuários analisar textos, imagens, gráficos e tabelas em documentos PDF e é aplicável a uma ampla gama de aplicações, incluindo relatórios financeiros, documentos jurídicos e tradução de documentos. O editor de Downcodes explicará detalhadamente os recursos, uso e precauções deste novo recurso para ajudá-lo a entender e usar melhor esta poderosa ferramenta de IA.
O processo de processamento de PDF do Claude 3.5 Sonnet é dividido em três etapas. Primeiro, o sistema extrai o conteúdo textual do documento. Cada página do documento é então convertida em uma imagem para análise mais aprofundada. Dessa forma, os usuários podem não apenas obter informações de texto, mas também obter informações visuais em arquivos PDF.
Vale ressaltar que a funcionalidade PDF do Claude também pode ser utilizada em conjunto com outros recursos, como extrair informações específicas e utilizá-las como entrada da ferramenta. Ressalta-se que o arquivo enviado deve ter menos de 32 MB e o número de páginas não deve ultrapassar 100 páginas. Atualmente, o sistema não oferece suporte a documentos criptografados ou protegidos por senha.
O custo do processamento de arquivos PDF irá variar dependendo do comprimento e da densidade do conteúdo do documento. Normalmente, 1.500 a 3.000 tokens são consumidos por página do documento sem custo adicional acima da taxa de token padrão. Os usuários podem usar esse novo recurso por meio da visualização do recurso Claude Chat e acesso à API. O cabeçalho de solicitação específico "anthropic-beta: pdfs-2024-09-25" precisa ser usado na solicitação da API. A Anthropic planeja expandir essa funcionalidade para as plataformas Amazon Bedrock e Google Vertex AI no futuro.
Para melhorar o processamento, a Anthropic recomenda que os usuários garantam que os documentos tenham texto claro e legível e que o layout da página esteja correto. Além disso, ao fazer referência a conteúdos específicos, os usuários devem utilizar os números das páginas exibidos no leitor de PDF. Ao utilizar a API, o arquivo PDF deve ser colocado antes do texto. Caso o documento seja maior que o limite, a Anthropic recomenda dividi-lo em partes menores. Finalmente, ao analisar o mesmo documento várias vezes, os usuários também podem considerar o uso de cache de dicas para melhorar a eficiência do processamento.
A função de processamento de PDF do Claude 3.5 Sonnet oferece aos usuários uma maneira mais eficiente e conveniente de processar documentos e acredito que será amplamente utilizada em mais campos no futuro. Também vale a pena esperar pelas melhorias e otimizações contínuas do Anthropic!