# พนักงาน
คุณมีไฟล์ที่มีการจัดระเบียบไม่ดีจำนวนมากซึ่งจัดอยู่ในแท็กหรือหมวดหมู่ตามจำนวนที่กำหนด และคุณต้องการทำให้กระบวนการเชื่อมโยงกับแท็กเหล่านั้นเป็นแบบอัตโนมัติ เพื่อให้สามารถจัดระเบียบได้ดียิ่งขึ้น
เสมียนใช้ LLM เพื่อให้บริบทเกี่ยวกับไฟล์ของคุณอย่างน่าอัศจรรย์!
พนักงานทำงานในไดเรกทอรีปัจจุบันและต้องมีการกำหนดค่า YAML ชื่อดีฟอลต์สำหรับไฟล์นี้คือ clerk.yml
และคาดว่าจะอยู่ในไดเร็กทอรีการทำงาน
categories :
genre:
- autobiography
- fantasy
- historical fiction
- non fiction
- romance
- science fiction
สำหรับแต่ละไฟล์ที่เดินลงมาจากไดเร็กทอรีการทำงานปัจจุบันแบบวนซ้ำ เราสร้างพรอมต์สำหรับ LLM เพื่อขอให้ระบุแอตทริบิวต์หนึ่งในค่าหมวดหมู่แต่ละค่าให้กับไฟล์ตามชื่อของไฟล์และเนื้อหาบางส่วนของไฟล์
จำนวนเนื้อหาไฟล์ที่ส่งโดยเป็นส่วนหนึ่งของพร้อมท์สามารถเพิ่มหรือลดลงได้ หากคุณลดลง คุณจะมีพื้นที่มากขึ้นสำหรับค่าหมวดหมู่ในพรอมต์ หากคุณเพิ่มขึ้นคุณ อาจ มีความแม่นยำมากขึ้น
ขณะนี้พนักงานส่งออกบรรทัด JSON สำหรับแต่ละไฟล์พร้อมเส้นทางไปยังไฟล์ และคีย์ ค่าสำหรับแต่ละหมวดหมู่ และการคาดคะเนสำหรับค่าหมวดหมู่จาก LLM
{ "path": "/some/long/path/book1.pdf", "genre": "fiction" }
{ "path": "/some/long/path/book2_2022-01-03-harry-potter.pdf", "genre": "fiction" }
ปัจจุบันพนักงานรองรับเฉพาะรุ่น OpenAI GPT-4 เท่านั้น คุณจะต้องไปที่โมเดลนั้นและคีย์ API ในตัวแปรสภาพแวดล้อม OPENAI_API_KEY
Usage: clerk [OPTIONS]
Options:
-m, --max-read-length <MAX_READ_LENGTH>
Maximum length of content to read from files for matching [default: 10000]
-e, --exclude-file-type <EXCLUDE_FILE_TYPE>
Excluded File Type [default: zip xlsx yml]
-c, --config-file <CONFIG_FILE>
Location of Configuration file that defines file categories [default: clerk.yml]
-h, --help
Print help
-V, --version
Print version