structured generation benchmark
1.0.0
为了有效、可靠地使用大型语言模型 (LLM),必须包含结构化生成技术。能够获得正则表达式、JSON 或 Pydantic 数据模型等输出是制作有用软件的关键。
但是使用 Outlines 或 Instructor 等库来实现这一目标的真正效果是什么?
该存储库汇总了评估来回答这个问题。
LLM 调用函数的能力。
AST simple
评估类别的 Gorilla BFCL 脚本 [2024 年 4 月 6 日版本]。使用法学硕士创建人工数据。