أعلنت الأنثروبور مؤخرًا أن طراز Claude 3.5 Sonnet قد أضاف إمكانيات معالجة ملفات PDF ، وقد دخلت الآن مرحلة الإصدار التجريبي العام. تتيح هذه الوظيفة للمستخدمين تحليل النصوص والبصرية في مستندات PDF ، بما في ذلك الصور والمخططات والجداول. تعمل هذه الخطوة على توسيع وظائف كلود ، مما يوفر للمستخدمين إمكانات معالجة المستندات الأقوى وتحسين كفاءة العمل.
في الآونة الأخيرة ، أعلنت شركة الذكاء الاصطناعي الأنثروبولوجيا أنها أضافت إمكانيات معالجة ملفات PDF إلى طراز Claude 3.5 Sonnet ، الذي دخل الآن مرحلة الاختبار العام. يمكن للمستخدمين الآن استخدام النموذج لتحليل العناصر النصية والعناصر المرئية في مستندات PDF ، بما في ذلك الصور والمخططات والجداول ، لمجموعة متنوعة من السيناريوهات مثل التقارير المالية والوثائق القانونية وترجمة المستندات.
تنقسم عملية معالجة PDF لـ Claude 3.5 Sonnet إلى ثلاث خطوات. أولاً ، يستخرج النظام محتوى النص من المستند. ثم ، يتم تحويل كل صفحة من المستند إلى صورة لمزيد من التحليل المتعمق. هذا يتيح للمستخدمين فقط الحصول على معلومات نصية ، ولكن أيضًا للحصول على نظرة ثاقبة على المعلومات المرئية في ملفات PDF.
تجدر الإشارة إلى أنه يمكن أيضًا استخدام ميزة PDF الخاصة بـ Claude بالاقتران مع ميزات أخرى ، مثل استخراج معلومات محددة واستخدامها كإدخال أداة. تجدر الإشارة إلى أن الملفات التي تم تحميلها يجب أن تكون أقل من 32 ميجابايت ، ويجب ألا يتجاوز عدد الصفحات 100 صفحة. لا يدعم النظام حاليًا المستندات المشفرة أو المحمية بكلمة المرور.
تختلف تكلفة معالجة ملفات PDF وفقًا لطول المستند وكثافة المحتوى. عادة ، يتم استهلاك 1500 إلى 3000 رمز لكل صفحة دون رسوم إضافية تتجاوز رسوم الرمز القياسي. يمكن للمستخدمين استخدام هذه الميزة الجديدة من خلال معاينة ميزة الدردشة Claude والوصول إلى واجهة برمجة التطبيقات ، والتي تتطلب استخدام رأس طلب محدد "أنثروبور بيتا: PDFS-2024-09-25" في طلبات API. تخطط الإنسان لتوسيع هذه الميزة إلى منصات Amazon Bedrock و Google Vertex AI في المستقبل.
لتحسين المعالجة ، يوصي الأنثروبور بأن يضمن المستخدمون أن يكون للوثيقة نصًا واضحًا وقابل للقراءة وأن تخطيط الصفحة صحيح. بالإضافة إلى ذلك ، عند الإشارة إلى محتوى محدد ، يجب على المستخدمين استخدام رقم الصفحة المعروض في قارئ PDF. وأثناء استخدام API ، يجب وضع ملفات PDF قبل النص. إذا كانت الوثيقة أكبر وتتجاوز الحد الأقصى ، فإن الأنثروبور توصي بتقسيمه إلى أقسام أصغر. أخيرًا ، عند تحليل المستند نفسه عدة مرات ، يمكن للمستخدمين أيضًا التفكير في استخدام ذاكرة التخزين المؤقت السريعة لتحسين كفاءة المعالجة.
النقاط الرئيسية:
يطلق الأنثروبور كلود 3.5 Sonnet ، إضافة قدرات معالجة ملفات PDF لدعم تحليل النص والصور.
تنقسم عملية المعالجة إلى ثلاث خطوات: استخراج النص وتحويل الصفحات إلى صور وتحليل شامل.
تختلف تكاليف المعالجة وفقًا لطول المستند وكثافة المحتوى ، ويخضع المستخدمون لحجم الملف وحدود الصفحة.
توفر وظيفة معالجة PDF لـ Claude 3.5 للمستخدمين حلول تحليل وثيقة فعالة.