ยูทิลิตี้บรรทัดคำสั่งสำหรับการสืบค้นรูปแบบภาษาขนาดใหญ่
repo นี้ถูกสร้างขึ้นรอบ ๆ ทำให้ง่ายต่อการเรียกใช้ชุดของการสืบค้นผ่าน CLI ในรูปแบบภาษาขนาดใหญ่ (LM) และกลับชุดของความสมบูรณ์ ที่จัดรูปแบบลงในเอกสารเดียว นอกจากนี้ยังมี Python API พื้นฐาน
เวิร์กโฟลว์ทั่วไป:
CSV
/ .xlsx
/ ฯลฯ ไฟล์ที่มีแบบสอบถามแบบจำลองเป็นแถวlm-api
ด้วย -i /path/to/my/queries.csv
และใช้ -kc
เพื่อระบุชื่อคอลัมน์ด้วยแบบสอบถามคาดว่าจะมีการสืบค้นในรูปแบบที่เข้ากันได้กับแพนด้าและผลลัพธ์จะถูกเขียนลงในไฟล์ข้อความที่มีการจัดรูปแบบ markdown เพื่อการดู/การแบ่งปันที่ง่าย
ไฟล์เอาต์พุตตัวอย่างมีให้ใน data/lm-api-output
ติดตั้งโดยตรงผ่าน pip
+ git
:
# create a virtual environment (optional): pyenv virtualenv 3.8.5 lm-api
pip install git+https://github.com/pszemraj/lm-api.git
อีกทางเลือกหนึ่งหลังจากโคลนนิ่ง cd
ลงในไดเรกทอรี lm-api
และเรียกใช้:
git clone https://github.com/pszemraj/lm-api.git
cd lm-api
# create a virtual environment (optional): pyenv virtualenv 3.8.5 lm-api
pip install -e .
การทดสอบอย่างรวดเร็วสามารถทำงานได้ด้วยสคริปต์ src/lm_api/test_goose_api.py
คุณจะต้องใช้คีย์ API สำหรับผู้ให้บริการแต่ละรายที่คุณต้องการสอบถาม ปัจจุบันผู้ให้บริการต่อไปนี้ได้รับการสนับสนุน:
ปุ่ม API สามารถตั้งค่าในตัวแปรสภาพแวดล้อม GOOSE
และ OPENAI
:
export OPENAI=api_key11111114234234etc
# or
export GOOSE=api_key11111114234234etc
อีกทางเลือกหนึ่งส่งเป็นอาร์กิวเมนต์เมื่อเรียก lm-api
ด้วยสวิตช์ -k
สคริปต์บรรทัดคำสั่งอยู่ใน src/lm_api/
และติดตั้งเป็นคำสั่ง CLI ที่สามารถเรียกใช้ได้จากทุกที่ ปัจจุบันคำสั่งถูก จำกัด ไว้ที่ lm-api
( เพิ่มเติมมา )
lm-api
ด้วยการตั้งค่าสถานะ -k
เพื่อเรียกใช้แบบสอบถามใด ๆ
lm-api -i data/test_queries.xlsx -o ./my-test-folder
สิ่งนี้จะเรียกใช้การสืบค้นใน data/test_queries.xlsx
และเขียนผลลัพธ์ไปยังไฟล์ .md
ใน my-test-folder/
ในไดเรกทอรีการทำงานปัจจุบันของคุณ
มีตัวเลือกมากมายสำหรับสคริปต์ซึ่งสามารถดูได้ด้วยธง -h
(เช่น lm-api -h
)
usage: lm-api [-h] [-i INPUT_FILE] [-o OUTPUT_DIR] [-provider PROVIDER_ID] [-k KEY] [-p PREFIX] [-s SUFFIX] [-simple]
[-kc KEY_COLUMN] [-m MODEL_ID] [-n N_TOKENS] [-t TEMPERATURE] [-f2 FREQUENCY_PENALTY]
[-p2 PRESENCE_PENALTY] [-v]
ไฟล์อินพุตควรอยู่ในรูปแบบที่เข้ากันได้กับแพนด้า (เช่น. .csv
, .xlsx
ฯลฯ ) ชื่อคอลัมน์เริ่มต้นสำหรับแบบสอบถามคือ query
ซึ่งสามารถเปลี่ยนแปลงได้ด้วยธง -kc
ไฟล์อินพุตตัวอย่างมีให้ใน data/test_queries.xlsx
หมายเหตุ: นี่เป็นงานที่กำลังดำเนินการและต่อไปนี้เป็นรายการที่ใช้งานของสิ่งที่ต้องทำ อาจมีการอัปเดตนี้และน่าจะได้รับการอัปเดต
--prefix
และ --suffix
flag เป็นสวิตช์ "engine promple" ที่สามารถเพิ่ม/อัปเดตพรอมต์ด้วยตัวเลือกที่หลากหลาย (เช่น --prompt-engine=prefix
หรือ --prompt-engine=prefix+suffix
) lm_api
ควรทำงานและมีฟังก์ชั่นเต็มรูปแบบ wrt cli) เรากำลังรวบรวม/พูดคุยเกี่ยวกับรายการคุณสมบัติที่เป็นไปได้ในส่วนการอภิปรายดังนั้นโปรดเพิ่มความคิดของคุณที่นั่น!