# موظف
لديك عدد كبير من الملفات سيئة التنظيم والتي تقع ضمن عدد محدد من العلامات أو الفئات وتريد أتمتة عملية الاقتران بهذه العلامات حتى يمكن تنظيمها بشكل أفضل.
يستخدم Clerk LLMs لتوفير سياق حول ملفاتك بطريقة سحرية!
يعمل Clerk على الدليل الحالي ويتطلب تكوين YAML. الاسم الافتراضي لهذا الملف هو clerk.yml
ومن المتوقع وجوده في دليل العمل.
categories :
genre:
- autobiography
- fantasy
- historical fiction
- non fiction
- romance
- science fiction
بالنسبة لكل ملف ينتقل بشكل متكرر من دليل العمل الحالي، نقوم بإنشاء مطالبة لـ LLM نطلب منها إسناد إحدى قيم كل فئة إلى الملف بناءً على اسم الملف وبعض محتويات الملف.
يمكن زيادة أو تقليل مقدار محتوى الملف المرسل كجزء من المطالبة. إذا قمت بتقليلها سيكون لديك مساحة أكبر لقيم الفئة في الموجه. إذا قمت بزيادة ذلك قد يكون لديك المزيد من الدقة.
يقوم الموظف حاليًا بإخراج سطر JSON لكل ملف مع المسار إلى الملف ومفتاح وقيمة لكل فئة والتنبؤ بقيمة الفئة من LLM
{ "path": "/some/long/path/book1.pdf", "genre": "fiction" }
{ "path": "/some/long/path/book2_2022-01-03-harry-potter.pdf", "genre": "fiction" }
يدعم الكاتب حاليًا نموذج OpenAI GPT-4 فقط؛ سيتعين عليك استخدام هذا النموذج ومفتاح واجهة برمجة التطبيقات (API) في متغير البيئة OPENAI_API_KEY
Usage: clerk [OPTIONS]
Options:
-m, --max-read-length <MAX_READ_LENGTH>
Maximum length of content to read from files for matching [default: 10000]
-e, --exclude-file-type <EXCLUDE_FILE_TYPE>
Excluded File Type [default: zip xlsx yml]
-c, --config-file <CONFIG_FILE>
Location of Configuration file that defines file categories [default: clerk.yml]
-h, --help
Print help
-V, --version
Print version