أصبح مشروع مفتوح المصدر يسمى gptpdf على GitHub شائعًا مؤخرًا، حيث حصل على 1.1 ألف نجمة في فترة زمنية قصيرة. يستخدم هذا المشروع 293 سطرًا فقط من التعليمات البرمجية لتحقيق وظيفة تحويل ملفات PDF إلى تنسيق Markdown، وقدرات التحليل القوية المذهلة. يستخدم نموذج VLLM مشابهًا لـ GPT-4o ويمكنه التعامل بشكل مثالي مع مختلف المحتويات المعقدة، بما في ذلك التنضيد والصيغ الرياضية والجداول والصور والرسوم البيانية وما إلى ذلك، مما يحسن بشكل كبير من كفاءة معالجة المستندات. لقد وفر المشروع مدخلاً للمنتج لتسهيل تجربة المستخدمين لوظائفه المريحة. وفيما يلي مقدمة تفصيلية للمشروع:
في الآونة الأخيرة، يحتوي مشروع مفتوح المصدر يسمى gptpdf على 1.1 ألف نجمة على github، ويستخدم نموذج VLLM مشابهًا لـ GPT-4o لتحليل ملفات PDF وتحويلها إلى تنسيق Markdown.
مدخل منتج gptpdf: https://top.aibase.com/tool/gptpdf
من المفهوم أن كود هذا المشروع يحتوي على 293 سطرًا فقط، لكنه يمكنه تحليل محتويات مختلفة بشكل مثالي تقريبًا مثل التنضيد والصيغ الرياضية والجداول والصور والمخططات وما إلى ذلك.
خطوات تنفيذ gptpdf هي:
1) استخدم مكتبة PyMuPDF لتحليل جميع المناطق غير النصية ووضع علامة عليها (لحفظ الرموز المميزة)
2) استخدم نماذج متعددة الوسائط (مثل GPT-4o) لتحليل ملفات تخفيض السعر والحصول عليها
ومن الجدير بالذكر أن تكلفة gptpdf تبلغ في المتوسط 0.013 دولارًا لكل صفحة.
أبرز النقاط:
- يستخدم هذا المشروع مفتوح المصدر نموذجًا متعدد الوسائط مشابهًا لـ GPT-4o لتحليل ملفات PDF وتحويلها إلى تنسيق Markdown.
- رمز المشروع موجز وفعال، مكون من 293 سطرًا فقط.
- تشتمل نتائج التحليل بشكل مثالي تقريبًا على محتويات مختلفة مثل التنضيد والصيغ الرياضية والجداول والصور والرسوم البيانية وما إلى ذلك.
بفضل التعليمات البرمجية الفعالة والموجزة والوظائف القوية، يوفر gptpdf بلا شك حلاً فعالاً واقتصاديًا لتحويل PDF إلى Markdown. كما أن تكلفتها المنخفضة تجعلها فعالة للغاية من حيث التكلفة. ويعتقد أن هذا المشروع سيتم استخدامه وتطويره على نطاق أوسع في المستقبل.