Anthropic недавно объявила, что в ее модель Claude 3.5 Sonnet добавлены возможности обработки PDF-файлов, и теперь она вступила в стадию публичного тестирования. Эта функция позволяет пользователям анализировать текст, изображения, диаграммы и таблицы в документах PDF и применима к широкому спектру приложений, включая финансовые отчеты, юридические документы и перевод документов. Редактор Downcodes подробно объяснит функции, использование и меры предосторожности этой новой функции, чтобы помочь вам лучше понять и использовать этот мощный инструмент искусственного интеллекта.
Процесс обработки PDF-файлов в Claude 3.5 Sonnet разделен на три этапа. Сначала система извлекает текстовое содержимое из документа. Каждая страница документа затем преобразуется в изображение для более глубокого анализа. Таким образом, пользователи могут не только получать текстовую информацию, но и получать представление о визуальной информации в файлах PDF.
Стоит отметить, что PDF-функциональность Claude также можно использовать в сочетании с другими функциями, такими как извлечение конкретной информации и ее использование в качестве входных данных для инструмента. Следует отметить, что размер загружаемого файла должен быть менее 32 МБ, а количество страниц не должно превышать 100 страниц. В настоящее время система не поддерживает зашифрованные или защищенные паролем документы.
Стоимость обработки PDF-файлов будет варьироваться в зависимости от объема и плотности содержания документа. Обычно на страницу документа расходуется от 1500 до 3000 токенов без дополнительной оплаты сверх стандартной платы за токен. Пользователи могут использовать эту новую функцию через предварительный просмотр функции Claude Chat и доступ к API. В запросе API необходимо использовать конкретный заголовок запроса «anthropic-beta: pdfs-2024-09-25». В будущем Anthropic планирует распространить эту функциональность на платформы Amazon Bedrock и Google Vertex AI.
Чтобы улучшить обработку, Anthropic рекомендует пользователям следить за тем, чтобы в документах был четкий, читаемый текст и чтобы макет страницы был правильным. Кроме того, при ссылке на определенный контент пользователи должны использовать номера страниц, отображаемые в программе чтения PDF-файлов. При использовании API файл PDF должен располагаться перед текстом. Если документ превышает лимит, Anthropic рекомендует разделить его на более мелкие части. Наконец, при многократном анализе одного и того же документа пользователи могут также рассмотреть возможность использования кэширования подсказок для повышения эффективности обработки.
Функция обработки PDF-файлов Claude 3.5 Sonnet предоставляет пользователям более эффективный и удобный способ обработки документов, и я считаю, что в будущем она будет широко использоваться во многих областях. Также стоит с нетерпением ждать дальнейших улучшений и оптимизаций Anthropic!