structured generation benchmark
1.0.0
為了有效、可靠地使用大型語言模型 (LLM),必須包含結構化生成技術。能夠獲得正規表示式、JSON 或 Pydantic 資料模型等輸出是製作有用軟體的關鍵。
但是使用 Outlines 或 Instructor 等函式庫來實現這一目標的真正效果是什麼?
該存儲庫匯總了評估來回答這個問題。
LLM 呼叫函數的能力。
AST simple
評估類別的 Gorilla BFCL 腳本 [2024 年 4 月 6 日版本]。使用法學碩士創建人工數據。