تنزيل txtmarker - تنزيل رمز مصدر txtmarker

txtmarker

شفرة المصدر الأخرى

v1.0.0

تنزيل

يسلط txtmarker الضوء على النص في المستندات. يأخذ txtmarker قائمة بأزواج (الاسم والنص)، ويقوم بمسح مستند إدخال ضوئيًا ويقوم بإنشاء نسخة معدلة مع تضمين الإبرازات.

تنسيقات الملفات الحالية المدعومة:

قوات الدفاع الشعبي

تثبيت

أسهل طريقة للتثبيت هي عبر النقطة وPyPI

 pip install txtmarker

يمكنك أيضًا تثبيت txtmarker مباشرة من GitHub. يوصى باستخدام بيئة Python الافتراضية.

 pip install git+https://github.com/neuml/txtmarker

بايثون 3.8+ مدعوم

أمثلة

يحتوي دليل الأمثلة على سلسلة من الأمثلة والدفاتر التي تقدم نظرة عامة على txtmarker. انظر قائمة دفاتر الملاحظات أدناه.

دفاتر الملاحظات

دفتر	وصف
تقديم تكستماركر	نظرة عامة على الوظائف التي يوفرها txtmarker
تسليط الضوء على المحولات	تسليط الضوء على AI باستخدام Transformers

إعدادات

يقدم القسم التالي نظرة عامة على أدوات التمييز والأساليب/التكوينات المتاحة. راجع دفاتر الملاحظات أعلاه للحصول على أمثلة تفصيلية.

قم بإنشاء قلم تمييز جديد

 from txtmarker . factory import Factory
highlighter = Factory . create ( "pdf" )

امتداد

 extension : string

نوع أداة التمييز المطلوب إنشاؤها (أي pdf)

وسيطات المنشئ الاختيارية:

المنسق

 formatter : callable

تنسيق الاستعلامات وإدخال النص باستخدام هذه الطريقة. يساعد في تنظيف الملفات التي تحتوي على الكثير من الرموز والمحتويات الأخرى.

قطع

 chunks : int

يقسم الاستعلامات إلى أجزاء متعددة. تم تصميم هذا لمطابقات النص الطويلة جدًا.

تسليط الضوء على النص

 highlighter . highlight ( "input.pdf" , "output.pdf" , [( "name" , "text to highlight" )])

ملف

 infile : string

المسار الكامل لملف الإدخال

ملف خارجي

 outfile : string

المسار الكامل لملف الإخراج، أي الملف المميز

يسلط الضوء

 highlights : list of (string, string|regex)

قائمة العناصر المميزة. كل زوج له اسم (يمكن أن يكون لا شيء) وقيمة نصية. يمكن أن يكون النص إما سلسلة أو تعبيرًا عاديًا.

يوسع

معلومات إضافية

الإصدار v1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2024-12-25
الحجم 752.18KB
من Github

تطبيقات ذات صلة

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل