llm table survey下載llm table survey源代碼下載

llm table survey

Ai源碼

1.0.0

下載

llm-table-survey

紙張清單

大語言模型

GPT-3，語言模型是很少的學習者。神經20。[紙]
T5，使用統一的文本到文本變壓器探索轉移學習的極限。 [紙]
Flan，FineTuned語言模型是零拍的學習者。 ICLR 22。[紙] [代碼]
DPO，直接偏好優化：您的語言模型是秘密的獎勵模型。神經23。[紙]
PEFT，用於參數有效及時調整的比例功能。 EMNLP 21。[紙]
洛拉（Lora）：大型語言模型的低排名適應。 ICLR 22。[紙]
經過思考的促進鏈，經過思考鏈，促使大語言模型引起推理。神經22。[紙]
最小至最小的提示，最小提示可以在大型語言模型中進行複雜的推理。 ICLR 23。[紙]
自一致性提示，自洽性改善了語言模型中的思想推理鏈。 ICLR 23。[紙]
反應，反應：在語言模型中協同推理和作用。 ICLR 23。[紙] [代碼]

前LLM時代桌培訓

Tabert，Tabert：預處理文本和表格數據的聯合理解。 ACL 20主。 [紙] [代碼]
TAPEX，TAPEX：通過學習神經SQL執行者的表格進行培訓。 ICLR 22。[paper] [代碼] [模型]
塔比（Tabbie），塔比（Tabbie）：表格數據的預估計表示。 NAACL 21主。 [紙] [代碼]
TURL，TURL：通過表示學習的理解。 VLDB 21。[紙] [代碼]
ResdsQL，Resdsql：用於文本到SQL的鏈接鏈接和骨架解析。 AAAI 23。[紙] [代碼]
Unifiedskg，Unifiedskg：統一和多任任務結構化知識接地與文本到文本語言模型。 EMNLP 22主。 [紙] [代碼]
電子表格編碼器，電子表格編碼器：半結構化上下文的公式預測。 ICML 21。[紙] [代碼]

桌子說明

Table-gpt，表格GPT：用於不同表任務的表調整的GPT。 Arxiv 2023。[紙]
Tablellama，Tablellama：邁向開放桌子的大型通才模型。 NAACL 24。[PAPER] [代碼] [模型：Tablellama 7b] [數據集：TableInstruct]

代碼llm

法典，評估經過代碼訓練的大型語言模型。 Arxiv 21。[紙]
Starcoder，Starcoder：願來源與您同在！ TMLR 23。[紙] [代碼] [模型]
代碼駱駝，代碼駱駝：代碼的開放基礎模型。 Arxiv 23。[Paper] [代碼]
Wizardlm，Wizardlm：授權大型預訓練的語言模型遵循複雜的說明。 ICLR 24。[Paper] [模型：Wizardlm 13b] [模型：Wizardlm 70b]
WizardCoder，WizardCoder：用Evol-Inscruct授權代碼大語言模型。 ICLR 24。[PAPER] [代碼] [模型：WizardCoder 15b]
Magicoder，Magicoder：您需要的全部源代碼。 ICML 24。[Paper] [代碼] [型號6.7b/7b]
Lemur，Lemur：協調語言代理的自然語言和代碼。 ICLR 24。[PAPER] [代碼] [模型：Lemur 70B] [模型：Lemur 70B Chat]
Infiagent-Dabench，Infiagent-Dabench：評估數據分析任務的代理。 ICML 24。[紙] [代碼]

表和代碼的混合物

TABLELM，TABLELMM：在真實辦公用法方案中，LLMS啟用表格數據操作。 [紙] [型號7b] [型號Tablellm 13b]
structlm，structlm：建立用於結構化知識接地的通才模型。 Arxiv 24。[Paper] [模型：structlm 7b] [模型：structlm 13b] [模型：structlm 34b] [數據集：SKGINSTRUCT]

參數有效的微調

Finsql，FinsQL：基於模型的agnostic LLMS基於文本到SQL框架，用於財務分析。 Sigmod Companion 24。[[Paper]（https://arxiv.org/pdf/2401.10506）]

直接優先優化

感覺，從弱和強LLM中綜合文本到SQL數據。 ACL 24。[紙]

小語言模型 +大語言模型

Zeronl2SQL，將小語言模型和大型語言模型結合在一起，用於零擊NL2SQL。 VLDB 24。[紙]

多模式表理解和提取

Layoutlm，Layoutlm：文本和佈局的預培訓，以了解文檔圖像的理解。 KDD 20。[紙]
PubTabnet，基於圖像的表識別：數據，模型和評估。 ECCV 20。[紙] [代碼和數據]
表格，多模式表的理解。 ACL 24。[紙] [代碼] [模型]
TabLELVM，TableVLM：用於表結構識別的多模式預訓練。 ACL 23。[紙]
PIXT3，PIXT3：基於像素的表到文本生成。 ACL 24。[紙]

表示

表格表示，嘈雜的操作員以及對LLMS中理解任務的表結構的影響。神經2023第二桌表示學習研討會。 [紙]
電子表格，電子表格：編碼大型語言模型的電子表格。 Arxiv 24。[紙]
增強大語模型的文本到SQL功能：及時設計策略的研究。 EMNLP 23。[紙] [代碼]
表作為文本或圖像的表：評估LLM和MLLM的表推理能力。 Arxiv 24。[紙]

提示

NL2SQL

自然語言降臨到SQL：我們已經準備好了嗎？ VLDB 24。[紙] [代碼]
MCS-SQL，MCS-SQL：利用多個提示和多項選擇的選擇來生成。 [紙]
DIN-SQL，DIN-SQL：通過自校正提示，分解的文本到SQL的分解文本到SQL。神經23。[紙] [代碼]
dail-sql，大型語言模型授權的文本到SQL：基準評估。 VLDB 24。[紙] [代碼]
C3，C3：用chatgpt零擊文本到sql。 Arxiv 24。[紙] [代碼]

表格

大型語言模型是多功能的分解器：分解基於桌子的推理的證據和問題。 Sigir 23。[Paper] [代碼]
活頁夾，符號語言的綁定語言模型。 ICLR 23。[紙] [代碼]
可反應的：增強桌子答案的反應。 VLDB 24。[紙] [代碼]
E5，E5：通過解釋，提取，執行，展覽和推斷使用增強LLM的零射擊層次表分析。 NAACL 24。[紙] [代碼]
鍊鍊，桌子鏈：推理鏈中的不斷發展的表，以理解桌子。 ICLR 24。[紙]
ITR，一個內在的桌子檢索器，用於可靠的表問題回答。 ACL 23。[紙]
Li-rage，Li-rage：較晚的互動檢索增強產生，並具有明確的信號，用於開放域桌子答案。 ACL 23。[紙]

試算表

SheetCopilot，SheetCopilot：通過大語言模型代理將軟件生產率帶入下一個水平。神經23。[紙] [代碼]
STEWAGENT，STEWAGENT：通過大型語言模型進行電子表格推理和操縱的通才代理。 Arxiv 24。[紙]
電子表格理解的視覺語言模型：挑戰和機遇。 Arxiv 24。[紙]

多任務框架

結構爭議：大型語言模型對結構化數據進行推理的一般框架。 EMNLP 23主。 [紙] [代碼]
TAP4LLM，TAP4LLM：用於大型語言模型推理的採樣，增強和包裝半結構化數據的表提供商。 Arxiv 23。[紙]
UNIDM，UNIDM：使用大語言模型進行數據操作的統一框架。 MLSYS 24。[紙]
數據 - 操作，數據 - 操作：橋接數十億個數據和人類具有自主工作流程。 Arxiv 23。[Paper] [代碼]

工具

Llamaindex
Pandasai
瓦納
DB-GPT。 DB-GPT：授權與私人大語言模型的數據庫交互。 [紙] [代碼]
retclean。 RetClean：使用基礎模型和數據湖泊進行基於檢索的數據清潔。 [紙] [代碼]

民意調查

大型語言模型的調查。 [紙]
一項基於大語言模型的自主代理的調查。 [紙]
表預訓練：關於模型體系結構，預訓練目標和下游任務的調查。 [紙]
用於表格數據表示的變壓器：模型和應用的調查。 [紙]
與大語言模型的桌子推理調查。 [紙]
關於桌面問題的調查回答：最新進展。 [紙]
表格數據上的大型語言模型（LLM） - 調查。 [紙]
對文本到SQL解析的調查：概念，方法和未來方向。 [紙]

數據集和基準

基準

姓名	關鍵字	人工製品	紙
MBPP	代碼	關聯	Arxiv 21
人類	代碼	關聯	Arxiv 21
Spider博士	NL2SQL，健壯性	關聯	ICLR 23
wikiable questions	表格	關聯	ACL 15
Wikisql	表質量質量檢查，NL2SQL	關聯	Arxiv 17
Tabfact	表事實驗證	關聯	ICLR 20
Hybirdqa	表格	關聯	EMNLP 20
fetaqa	表事實驗證	關聯	塔克爾22
野蠻	表格	關聯	ACL 23
Anameta	表元數據	關聯	ACL 23
gpt4table	表質量質量檢查，表格到文本	關聯	WSDM 24
托托	桌面到文本	關聯	EMNLP 20
電子表格板	電子表格操縱	關聯	神經24
鳥	NL2SQL	關聯	神經23
蜘蛛	NL2SQL	關聯	EMNLP 18
Spider博士	NL2SQL	關聯	ICLR 23
ScienceBenchmark	NL2SQL	關聯	VLDB 24
DS-1000	數據分析	關聯	ICML 23
Infiagent-Dabench	數據分析	關聯	ICML 24
桌面	表檢測	關聯	LERC 20
Pubtabnet	表提取	關聯	ECCV 20
COMTQA	視覺表QA，表檢測，表提取	關聯	Arxiv 24

數據集

姓名	關鍵字	人工製品	紙
TableInstruct	表指令調整	關聯	Arxiv 23
WDC	網絡桌	關聯	www 16
Gittables	GitHub CSV	關聯	Sigmod 23
鏢	桌面到文本	關聯	NAACL 21
mmtab	多模式表理解	關聯	ACL 24
圖式	數據庫模式	關聯	Sigmod 24