llm-table-survey
基准
数据集
大语言模型
前LLM时代桌培训
桌子说明
代码llm
表和代码的混合物
多模式表理解和提取
表示
提示
工具
民意调查
NL2SQL
表格
电子表格
多任务框架
目录
纸张清单
数据集和基准
GPT-3,语言模型是很少的学习者。神经20。[纸]
T5,使用统一的文本到文本变压器探索转移学习的极限。 [纸]
Flan,FineTuned语言模型是零拍的学习者。 ICLR 22。[纸] [代码]
DPO,直接偏好优化:您的语言模型是秘密的奖励模型。神经23。[纸]
PEFT,用于参数有效及时调整的比例功能。 EMNLP 21。[纸]
洛拉(Lora):大型语言模型的低排名适应。 ICLR 22。[纸]
经过思考的促进链,经过思考链,促使大语言模型引起推理。神经22。[纸]
最小至最小的提示,最小提示可以在大型语言模型中进行复杂的推理。 ICLR 23。[纸]
自一致性提示,自洽性改善了语言模型中的思想推理链。 ICLR 23。[纸]
反应,反应:在语言模型中协同推理和作用。 ICLR 23。[纸] [代码]
Tabert,Tabert:预处理文本和表格数据的联合理解。 ACL 20主。 [纸] [代码]
TAPEX,TAPEX:通过学习神经SQL执行者的表格进行培训。 ICLR 22。[paper] [代码] [模型]
塔比(Tabbie),塔比(Tabbie):表格数据的预估计表示。 NAACL 21主。 [纸] [代码]
TURL,TURL:通过表示学习的理解。 VLDB 21。[纸] [代码]
ResdsQL,Resdsql:用于文本到SQL的链接链接和骨架解析。 AAAI 23。[纸] [代码]
Unifiedskg,Unifiedskg:统一和多任任务结构化知识接地与文本到文本语言模型。 EMNLP 22主。 [纸] [代码]
电子表格编码器,电子表格编码器:半结构化上下文的公式预测。 ICML 21。[纸] [代码]
Table-gpt,表格GPT:用于不同表任务的表调整的GPT。 Arxiv 2023。[纸]
Tablellama,Tablellama:迈向开放桌子的大型通才模型。 NAACL 24。[PAPER] [代码] [模型:Tablellama 7b] [数据集:TableInstruct]
法典,评估经过代码训练的大型语言模型。 Arxiv 21。[纸]
Starcoder,Starcoder:愿来源与您同在! TMLR 23。[纸] [代码] [模型]
代码骆驼,代码骆驼:代码的开放基础模型。 Arxiv 23。[Paper] [代码]
Wizardlm,Wizardlm:授权大型预训练的语言模型遵循复杂的说明。 ICLR 24。[Paper] [模型:Wizardlm 13b] [模型:Wizardlm 70b]
WizardCoder,WizardCoder:用Evol-Inscruct授权代码大语言模型。 ICLR 24。[PAPER] [代码] [模型:WizardCoder 15b]
Magicoder,Magicoder:您需要的全部源代码。 ICML 24。[Paper] [代码] [型号6.7b/7b]
Lemur,Lemur:协调语言代理的自然语言和代码。 ICLR 24。[PAPER] [代码] [模型:Lemur 70B] [模型:Lemur 70B Chat]
Infiagent-Dabench,Infiagent-Dabench:评估数据分析任务的代理。 ICML 24。[纸] [代码]
TABLELM,TABLELMM:在真实办公用法方案中,LLMS启用表格数据操作。 [纸] [型号7b] [型号Tablellm 13b]
structlm,structlm:建立用于结构化知识接地的通才模型。 Arxiv 24。[Paper] [模型:structlm 7b] [模型:structlm 13b] [模型:structlm 34b] [数据集:SKGINSTRUCT]
Finsql,FinsQL:基于模型的agnostic LLMS基于文本到SQL框架,用于财务分析。 Sigmod Companion 24。[[Paper](https://arxiv.org/pdf/2401.10506)]
感觉,从弱和强LLM中综合文本到SQL数据。 ACL 24。[纸]
Zeronl2SQL,将小语言模型和大型语言模型结合在一起,用于零击NL2SQL。 VLDB 24。[纸]
Layoutlm,Layoutlm:文本和布局的预培训,以了解文档图像的理解。 KDD 20。[纸]
PubTabnet,基于图像的表识别:数据,模型和评估。 ECCV 20。[纸] [代码和数据]
表格,多模式表的理解。 ACL 24。[纸] [代码] [模型]
TabLELVM,TableVLM:用于表结构识别的多模式预训练。 ACL 23。[纸]
PIXT3,PIXT3:基于像素的表到文本生成。 ACL 24。[纸]
表格表示,嘈杂的操作员以及对LLMS中理解任务的表结构的影响。神经2023第二桌表示学习研讨会。 [纸]
电子表格,电子表格:编码大型语言模型的电子表格。 Arxiv 24。[纸]
增强大语模型的文本到SQL功能:及时设计策略的研究。 EMNLP 23。[纸] [代码]
表作为文本或图像的表:评估LLM和MLLM的表推理能力。 Arxiv 24。[纸]
自然语言降临到SQL:我们已经准备好了吗? VLDB 24。[纸] [代码]
MCS-SQL,MCS-SQL:利用多个提示和多项选择的选择来生成。 [纸]
DIN-SQL,DIN-SQL:通过自校正提示,分解的文本到SQL的分解文本到SQL。神经23。[纸] [代码]
dail-sql,大型语言模型授权的文本到SQL:基准评估。 VLDB 24。[纸] [代码]
C3,C3:用chatgpt零击文本到sql。 Arxiv 24。[纸] [代码]
大型语言模型是多功能的分解器:分解基于桌子的推理的证据和问题。 Sigir 23。[Paper] [代码]
活页夹,符号语言的绑定语言模型。 ICLR 23。[纸] [代码]
可反应的:增强桌子答案的反应。 VLDB 24。[纸] [代码]
E5,E5:通过解释,提取,执行,展览和推断使用增强LLM的零射击层次表分析。 NAACL 24。[纸] [代码]
链链,桌子链:推理链中的不断发展的表,以理解桌子。 ICLR 24。[纸]
ITR,一个内在的桌子检索器,用于可靠的表问题回答。 ACL 23。[纸]
Li-rage,Li-rage:较晚的互动检索增强产生,并具有明确的信号,用于开放域桌子答案。 ACL 23。[纸]
SheetCopilot,SheetCopilot:通过大语言模型代理将软件生产率带入下一个水平。神经23。[纸] [代码]
STEWAGENT,STEWAGENT:通过大型语言模型进行电子表格推理和操纵的通才代理。 Arxiv 24。[纸]
电子表格理解的视觉语言模型:挑战和机遇。 Arxiv 24。[纸]
结构争议:大型语言模型对结构化数据进行推理的一般框架。 EMNLP 23主。 [纸] [代码]
TAP4LLM,TAP4LLM:用于大型语言模型推理的采样,增强和包装半结构化数据的表提供商。 Arxiv 23。[纸]
UNIDM,UNIDM:使用大语言模型进行数据操作的统一框架。 MLSYS 24。[纸]
数据 - 操作,数据 - 操作:桥接数十亿个数据和人类具有自主工作流程。 Arxiv 23。[Paper] [代码]
Llamaindex
Pandasai
瓦纳
DB-GPT。 DB-GPT:授权与私人大语言模型的数据库交互。 [纸] [代码]
retclean。 RetClean:使用基础模型和数据湖泊进行基于检索的数据清洁。 [纸] [代码]
大型语言模型的调查。 [纸]
一项基于大语言模型的自主代理的调查。 [纸]
表预训练:关于模型体系结构,预训练目标和下游任务的调查。 [纸]
用于表格数据表示的变压器:模型和应用的调查。 [纸]
与大语言模型的桌子推理调查。 [纸]
关于桌面问题的调查回答:最新进展。 [纸]
表格数据上的大型语言模型(LLM) - 调查。 [纸]
对文本到SQL解析的调查:概念,方法和未来方向。 [纸]
姓名 | 关键字 | 人工制品 | 纸 |
---|---|---|---|
MBPP | 代码 | 关联 | Arxiv 21 |
人类 | 代码 | 关联 | Arxiv 21 |
Spider博士 | NL2SQL,健壮性 | 关联 | ICLR 23 |
wikiable questions | 表格 | 关联 | ACL 15 |
Wikisql | 表质量质量检查,NL2SQL | 关联 | Arxiv 17 |
Tabfact | 表事实验证 | 关联 | ICLR 20 |
Hybirdqa | 表格 | 关联 | EMNLP 20 |
fetaqa | 表事实验证 | 关联 | 塔克尔22 |
野蛮 | 表格 | 关联 | ACL 23 |
Anameta | 表元数据 | 关联 | ACL 23 |
gpt4table | 表质量质量检查,表格到文本 | 关联 | WSDM 24 |
托托 | 桌面到文本 | 关联 | EMNLP 20 |
电子表格板 | 电子表格操纵 | 关联 | 神经24 |
鸟 | NL2SQL | 关联 | 神经23 |
蜘蛛 | NL2SQL | 关联 | EMNLP 18 |
Spider博士 | NL2SQL | 关联 | ICLR 23 |
ScienceBenchmark | NL2SQL | 关联 | VLDB 24 |
DS-1000 | 数据分析 | 关联 | ICML 23 |
Infiagent-Dabench | 数据分析 | 关联 | ICML 24 |
桌面 | 表检测 | 关联 | LERC 20 |
Pubtabnet | 表提取 | 关联 | ECCV 20 |
COMTQA | 视觉表QA,表检测,表提取 | 关联 | Arxiv 24 |
姓名 | 关键字 | 人工制品 | 纸 |
---|---|---|---|
TableInstruct | 表指令调整 | 关联 | Arxiv 23 |
WDC | 网络桌 | 关联 | www 16 |
Gittables | GitHub CSV | 关联 | Sigmod 23 |
镖 | 桌面到文本 | 关联 | NAACL 21 |
mmtab | 多模式表理解 | 关联 | ACL 24 |
图式 | 数据库模式 | 关联 | Sigmod 24 |