Anthropic a récemment annoncé que son modèle Claude 3.5 Sonnet avait ajouté des capacités de traitement de fichiers PDF et était désormais entré dans la phase de test public. Cette fonction permet aux utilisateurs d'analyser du texte, des images, des graphiques et des tableaux dans des documents PDF et s'applique à un large éventail d'applications, notamment les rapports financiers, les documents juridiques et la traduction de documents. L'éditeur de Downcodes vous expliquera en détail les fonctionnalités, l'utilisation et les précautions de cette nouvelle fonctionnalité pour vous aider à mieux comprendre et utiliser ce puissant outil d'IA.
Le processus de traitement PDF de Claude 3.5 Sonnet est divisé en trois étapes. Tout d'abord, le système extrait le contenu textuel du document. Chaque page du document est ensuite convertie en image pour une analyse plus approfondie. De cette manière, les utilisateurs peuvent non seulement obtenir des informations textuelles, mais également avoir un aperçu des informations visuelles contenues dans les fichiers PDF.
Il convient de mentionner que la fonctionnalité PDF de Claude peut également être utilisée conjointement avec d’autres fonctionnalités, telles que l’extraction d’informations spécifiques et leur utilisation comme entrée d’outil. Il est à noter que le fichier téléchargé doit faire moins de 32 Mo et le nombre de pages ne doit pas dépasser 100 pages. Le système ne prend actuellement pas en charge les documents cryptés ou protégés par mot de passe.
Le coût de traitement des fichiers PDF varie en fonction de la longueur et de la densité du contenu du document. En règle générale, 1 500 à 3 000 jetons sont consommés par page de document sans frais supplémentaires supérieurs aux frais de jeton standard. Les utilisateurs peuvent utiliser cette nouvelle fonctionnalité via l'aperçu de la fonctionnalité Claude Chat et l'accès à l'API. L'en-tête de requête spécifique "anthropic-beta : pdfs-2024-09-25" doit être utilisé dans la requête API. Anthropic prévoit d'étendre cette fonctionnalité aux plates-formes Amazon Bedrock et Google Vertex AI à l'avenir.
Pour améliorer le traitement, Anthropic recommande aux utilisateurs de s'assurer que les documents contiennent un texte clair et lisible et que la mise en page est correcte. De plus, lorsqu'ils référencent un contenu spécifique, les utilisateurs doivent utiliser les numéros de page affichés dans le lecteur PDF. Lors de l'utilisation de l'API, le fichier PDF doit être placé avant le texte. Si le document est plus grand que la limite, Anthropic recommande de le diviser en parties plus petites. Enfin, lors de l’analyse répétée du même document, les utilisateurs peuvent également envisager d’utiliser la mise en cache des indices pour améliorer l’efficacité du traitement.
La fonction de traitement PDF de Claude 3.5 Sonnet offre aux utilisateurs un moyen plus efficace et plus pratique de traiter les documents, et je pense qu'elle sera largement utilisée dans davantage de domaines à l'avenir. Les améliorations et optimisations continues d’Anthropic méritent également d’être attendues !