llm table survey下载llm table survey源代码下载

llm table survey

Ai源码

1.0.0

下载

llm-table-survey

纸张清单

大语言模型

GPT-3，语言模型是很少的学习者。神经20。[纸]
T5，使用统一的文本到文本变压器探索转移学习的极限。 [纸]
Flan，FineTuned语言模型是零拍的学习者。 ICLR 22。[纸] [代码]
DPO，直接偏好优化：您的语言模型是秘密的奖励模型。神经23。[纸]
PEFT，用于参数有效及时调整的比例功能。 EMNLP 21。[纸]
洛拉（Lora）：大型语言模型的低排名适应。 ICLR 22。[纸]
经过思考的促进链，经过思考链，促使大语言模型引起推理。神经22。[纸]
最小至最小的提示，最小提示可以在大型语言模型中进行复杂的推理。 ICLR 23。[纸]
自一致性提示，自洽性改善了语言模型中的思想推理链。 ICLR 23。[纸]
反应，反应：在语言模型中协同推理和作用。 ICLR 23。[纸] [代码]

前LLM时代桌培训

Tabert，Tabert：预处理文本和表格数据的联合理解。 ACL 20主。 [纸] [代码]
TAPEX，TAPEX：通过学习神经SQL执行者的表格进行培训。 ICLR 22。[paper] [代码] [模型]
塔比（Tabbie），塔比（Tabbie）：表格数据的预估计表示。 NAACL 21主。 [纸] [代码]
TURL，TURL：通过表示学习的理解。 VLDB 21。[纸] [代码]
ResdsQL，Resdsql：用于文本到SQL的链接链接和骨架解析。 AAAI 23。[纸] [代码]
Unifiedskg，Unifiedskg：统一和多任任务结构化知识接地与文本到文本语言模型。 EMNLP 22主。 [纸] [代码]
电子表格编码器，电子表格编码器：半结构化上下文的公式预测。 ICML 21。[纸] [代码]

桌子说明

Table-gpt，表格GPT：用于不同表任务的表调整的GPT。 Arxiv 2023。[纸]
Tablellama，Tablellama：迈向开放桌子的大型通才模型。 NAACL 24。[PAPER] [代码] [模型：Tablellama 7b] [数据集：TableInstruct]

代码llm

法典，评估经过代码训练的大型语言模型。 Arxiv 21。[纸]
Starcoder，Starcoder：愿来源与您同在！ TMLR 23。[纸] [代码] [模型]
代码骆驼，代码骆驼：代码的开放基础模型。 Arxiv 23。[Paper] [代码]
Wizardlm，Wizardlm：授权大型预训练的语言模型遵循复杂的说明。 ICLR 24。[Paper] [模型：Wizardlm 13b] [模型：Wizardlm 70b]
WizardCoder，WizardCoder：用Evol-Inscruct授权代码大语言模型。 ICLR 24。[PAPER] [代码] [模型：WizardCoder 15b]
Magicoder，Magicoder：您需要的全部源代码。 ICML 24。[Paper] [代码] [型号6.7b/7b]
Lemur，Lemur：协调语言代理的自然语言和代码。 ICLR 24。[PAPER] [代码] [模型：Lemur 70B] [模型：Lemur 70B Chat]
Infiagent-Dabench，Infiagent-Dabench：评估数据分析任务的代理。 ICML 24。[纸] [代码]

表和代码的混合物

TABLELM，TABLELMM：在真实办公用法方案中，LLMS启用表格数据操作。 [纸] [型号7b] [型号Tablellm 13b]
structlm，structlm：建立用于结构化知识接地的通才模型。 Arxiv 24。[Paper] [模型：structlm 7b] [模型：structlm 13b] [模型：structlm 34b] [数据集：SKGINSTRUCT]

参数有效的微调

Finsql，FinsQL：基于模型的agnostic LLMS基于文本到SQL框架，用于财务分析。 Sigmod Companion 24。[[Paper]（https://arxiv.org/pdf/2401.10506）]

直接优先优化

感觉，从弱和强LLM中综合文本到SQL数据。 ACL 24。[纸]

小语言模型 +大语言模型

Zeronl2SQL，将小语言模型和大型语言模型结合在一起，用于零击NL2SQL。 VLDB 24。[纸]

多模式表理解和提取

Layoutlm，Layoutlm：文本和布局的预培训，以了解文档图像的理解。 KDD 20。[纸]
PubTabnet，基于图像的表识别：数据，模型和评估。 ECCV 20。[纸] [代码和数据]
表格，多模式表的理解。 ACL 24。[纸] [代码] [模型]
TabLELVM，TableVLM：用于表结构识别的多模式预训练。 ACL 23。[纸]
PIXT3，PIXT3：基于像素的表到文本生成。 ACL 24。[纸]

表示

表格表示，嘈杂的操作员以及对LLMS中理解任务的表结构的影响。神经2023第二桌表示学习研讨会。 [纸]
电子表格，电子表格：编码大型语言模型的电子表格。 Arxiv 24。[纸]
增强大语模型的文本到SQL功能：及时设计策略的研究。 EMNLP 23。[纸] [代码]
表作为文本或图像的表：评估LLM和MLLM的表推理能力。 Arxiv 24。[纸]

提示

NL2SQL

自然语言降临到SQL：我们已经准备好了吗？ VLDB 24。[纸] [代码]
MCS-SQL，MCS-SQL：利用多个提示和多项选择的选择来生成。 [纸]
DIN-SQL，DIN-SQL：通过自校正提示，分解的文本到SQL的分解文本到SQL。神经23。[纸] [代码]
dail-sql，大型语言模型授权的文本到SQL：基准评估。 VLDB 24。[纸] [代码]
C3，C3：用chatgpt零击文本到sql。 Arxiv 24。[纸] [代码]

表格

大型语言模型是多功能的分解器：分解基于桌子的推理的证据和问题。 Sigir 23。[Paper] [代码]
活页夹，符号语言的绑定语言模型。 ICLR 23。[纸] [代码]
可反应的：增强桌子答案的反应。 VLDB 24。[纸] [代码]
E5，E5：通过解释，提取，执行，展览和推断使用增强LLM的零射击层次表分析。 NAACL 24。[纸] [代码]
链链，桌子链：推理链中的不断发展的表，以理解桌子。 ICLR 24。[纸]
ITR，一个内在的桌子检索器，用于可靠的表问题回答。 ACL 23。[纸]
Li-rage，Li-rage：较晚的互动检索增强产生，并具有明确的信号，用于开放域桌子答案。 ACL 23。[纸]

电子表格

SheetCopilot，SheetCopilot：通过大语言模型代理将软件生产率带入下一个水平。神经23。[纸] [代码]
STEWAGENT，STEWAGENT：通过大型语言模型进行电子表格推理和操纵的通才代理。 Arxiv 24。[纸]
电子表格理解的视觉语言模型：挑战和机遇。 Arxiv 24。[纸]

多任务框架

结构争议：大型语言模型对结构化数据进行推理的一般框架。 EMNLP 23主。 [纸] [代码]
TAP4LLM，TAP4LLM：用于大型语言模型推理的采样，增强和包装半结构化数据的表提供商。 Arxiv 23。[纸]
UNIDM，UNIDM：使用大语言模型进行数据操作的统一框架。 MLSYS 24。[纸]
数据 - 操作，数据 - 操作：桥接数十亿个数据和人类具有自主工作流程。 Arxiv 23。[Paper] [代码]

工具

Llamaindex
Pandasai
瓦纳
DB-GPT。 DB-GPT：授权与私人大语言模型的数据库交互。 [纸] [代码]
retclean。 RetClean：使用基础模型和数据湖泊进行基于检索的数据清洁。 [纸] [代码]

民意调查

大型语言模型的调查。 [纸]
一项基于大语言模型的自主代理的调查。 [纸]
表预训练：关于模型体系结构，预训练目标和下游任务的调查。 [纸]
用于表格数据表示的变压器：模型和应用的调查。 [纸]
与大语言模型的桌子推理调查。 [纸]
关于桌面问题的调查回答：最新进展。 [纸]
表格数据上的大型语言模型（LLM） - 调查。 [纸]
对文本到SQL解析的调查：概念，方法和未来方向。 [纸]

数据集和基准

基准

姓名	关键字	人工制品	纸
MBPP	代码	关联	Arxiv 21
人类	代码	关联	Arxiv 21
Spider博士	NL2SQL，健壮性	关联	ICLR 23
wikiable questions	表格	关联	ACL 15
Wikisql	表质量质量检查，NL2SQL	关联	Arxiv 17
Tabfact	表事实验证	关联	ICLR 20
Hybirdqa	表格	关联	EMNLP 20
fetaqa	表事实验证	关联	塔克尔22
野蛮	表格	关联	ACL 23
Anameta	表元数据	关联	ACL 23
gpt4table	表质量质量检查，表格到文本	关联	WSDM 24
托托	桌面到文本	关联	EMNLP 20
电子表格板	电子表格操纵	关联	神经24
鸟	NL2SQL	关联	神经23
蜘蛛	NL2SQL	关联	EMNLP 18
Spider博士	NL2SQL	关联	ICLR 23
ScienceBenchmark	NL2SQL	关联	VLDB 24
DS-1000	数据分析	关联	ICML 23
Infiagent-Dabench	数据分析	关联	ICML 24
桌面	表检测	关联	LERC 20
Pubtabnet	表提取	关联	ECCV 20
COMTQA	视觉表QA，表检测，表提取	关联	Arxiv 24

数据集

姓名	关键字	人工制品	纸
TableInstruct	表指令调整	关联	Arxiv 23
WDC	网络桌	关联	www 16
Gittables	GitHub CSV	关联	Sigmod 23
镖	桌面到文本	关联	NAACL 21
mmtab	多模式表理解	关联	ACL 24
图式	数据库模式	关联	Sigmod 24