Anthropic gab kürzlich bekannt, dass sein Claude 3.5 Sonnet-Modell über Funktionen zur Verarbeitung von PDF-Dateien verfügt und nun in die öffentliche Testphase eingetreten ist. Diese Funktion ermöglicht Benutzern die Analyse von Texten, Bildern, Diagrammen und Tabellen in PDF-Dokumenten und ist auf eine Vielzahl von Anwendungen anwendbar, darunter Finanzberichte, Rechtsdokumente und die Übersetzung von Dokumenten. Der Herausgeber von Downcodes wird die Funktionen, Verwendung und Vorsichtsmaßnahmen dieser neuen Funktion ausführlich erläutern, um Ihnen zu helfen, dieses leistungsstarke KI-Tool besser zu verstehen und zu verwenden.
Der PDF-Verarbeitungsprozess von Claude 3.5 Sonnet ist in drei Schritte unterteilt. Zunächst extrahiert das System Textinhalte aus dem Dokument. Anschließend wird jede Seite des Dokuments zur tieferen Analyse in ein Bild umgewandelt. Auf diese Weise können Benutzer nicht nur Textinformationen erhalten, sondern auch Einblick in die visuellen Informationen in PDF-Dateien erhalten.
Erwähnenswert ist, dass die PDF-Funktionalität von Claude auch in Verbindung mit anderen Funktionen verwendet werden kann, beispielsweise zum Extrahieren spezifischer Informationen und deren Verwendung als Werkzeugeingabe. Dabei ist zu beachten, dass die hochgeladene Datei weniger als 32 MB groß sein darf und die Seitenanzahl 100 Seiten nicht überschreiten darf. Das System unterstützt derzeit keine verschlüsselten oder passwortgeschützten Dokumente.
Die Kosten für die Verarbeitung von PDF-Dateien variieren je nach Länge und Inhaltsdichte des Dokuments. In der Regel werden 1.500 bis 3.000 Token pro Dokumentseite verbraucht, ohne dass über die Standard-Token-Gebühr hinaus zusätzliche Kosten anfallen. Benutzer können diese neue Funktion über die Funktionsvorschau von Claude Chat und den API-Zugriff nutzen. Der spezifische Anforderungsheader „anthropic-beta: pdfs-2024-09-25“ muss in der API-Anfrage verwendet werden. Anthropic plant, diese Funktionalität in Zukunft auf die KI-Plattformen Amazon Bedrock und Google Vertex auszuweiten.
Um die Verarbeitung zu verbessern, empfiehlt Anthropic Benutzern, sicherzustellen, dass Dokumente klaren, lesbaren Text enthalten und dass das Seitenlayout korrekt ist. Darüber hinaus sollten Benutzer beim Verweisen auf bestimmte Inhalte die im PDF-Reader angezeigten Seitenzahlen verwenden. Bei Verwendung der API sollte die PDF-Datei vor dem Text platziert werden. Wenn das Dokument größer als das Limit ist, empfiehlt Anthropic, es in kleinere Teile aufzuteilen. Schließlich können Benutzer bei der mehrfachen Analyse desselben Dokuments auch die Verwendung von Hinweis-Caching in Betracht ziehen, um die Verarbeitungseffizienz zu verbessern.
Die PDF-Verarbeitungsfunktion von Claude 3.5 Sonnet bietet Benutzern eine effizientere und bequemere Möglichkeit, Dokumente zu verarbeiten, und ich glaube, dass sie in Zukunft in weiteren Bereichen weit verbreitet sein wird. Es lohnt sich auch, sich auf die kontinuierlichen Verbesserungen und Optimierungen von Anthropic zu freuen!