llm-table-survey
基準
數據集
大語言模型
前LLM時代桌培訓
桌子說明
代碼llm
表和代碼的混合物
多模式表理解和提取
表示
提示
工具
民意調查
NL2SQL
表格
試算表
多任務框架
目錄
紙張清單
數據集和基準
GPT-3,語言模型是很少的學習者。神經20。[紙]
T5,使用統一的文本到文本變壓器探索轉移學習的極限。 [紙]
Flan,FineTuned語言模型是零拍的學習者。 ICLR 22。[紙] [代碼]
DPO,直接偏好優化:您的語言模型是秘密的獎勵模型。神經23。[紙]
PEFT,用於參數有效及時調整的比例功能。 EMNLP 21。[紙]
洛拉(Lora):大型語言模型的低排名適應。 ICLR 22。[紙]
經過思考的促進鏈,經過思考鏈,促使大語言模型引起推理。神經22。[紙]
最小至最小的提示,最小提示可以在大型語言模型中進行複雜的推理。 ICLR 23。[紙]
自一致性提示,自洽性改善了語言模型中的思想推理鏈。 ICLR 23。[紙]
反應,反應:在語言模型中協同推理和作用。 ICLR 23。[紙] [代碼]
Tabert,Tabert:預處理文本和表格數據的聯合理解。 ACL 20主。 [紙] [代碼]
TAPEX,TAPEX:通過學習神經SQL執行者的表格進行培訓。 ICLR 22。[paper] [代碼] [模型]
塔比(Tabbie),塔比(Tabbie):表格數據的預估計表示。 NAACL 21主。 [紙] [代碼]
TURL,TURL:通過表示學習的理解。 VLDB 21。[紙] [代碼]
ResdsQL,Resdsql:用於文本到SQL的鏈接鏈接和骨架解析。 AAAI 23。[紙] [代碼]
Unifiedskg,Unifiedskg:統一和多任任務結構化知識接地與文本到文本語言模型。 EMNLP 22主。 [紙] [代碼]
電子表格編碼器,電子表格編碼器:半結構化上下文的公式預測。 ICML 21。[紙] [代碼]
Table-gpt,表格GPT:用於不同表任務的表調整的GPT。 Arxiv 2023。[紙]
Tablellama,Tablellama:邁向開放桌子的大型通才模型。 NAACL 24。[PAPER] [代碼] [模型:Tablellama 7b] [數據集:TableInstruct]
法典,評估經過代碼訓練的大型語言模型。 Arxiv 21。[紙]
Starcoder,Starcoder:願來源與您同在! TMLR 23。[紙] [代碼] [模型]
代碼駱駝,代碼駱駝:代碼的開放基礎模型。 Arxiv 23。[Paper] [代碼]
Wizardlm,Wizardlm:授權大型預訓練的語言模型遵循複雜的說明。 ICLR 24。[Paper] [模型:Wizardlm 13b] [模型:Wizardlm 70b]
WizardCoder,WizardCoder:用Evol-Inscruct授權代碼大語言模型。 ICLR 24。[PAPER] [代碼] [模型:WizardCoder 15b]
Magicoder,Magicoder:您需要的全部源代碼。 ICML 24。[Paper] [代碼] [型號6.7b/7b]
Lemur,Lemur:協調語言代理的自然語言和代碼。 ICLR 24。[PAPER] [代碼] [模型:Lemur 70B] [模型:Lemur 70B Chat]
Infiagent-Dabench,Infiagent-Dabench:評估數據分析任務的代理。 ICML 24。[紙] [代碼]
TABLELM,TABLELMM:在真實辦公用法方案中,LLMS啟用表格數據操作。 [紙] [型號7b] [型號Tablellm 13b]
structlm,structlm:建立用於結構化知識接地的通才模型。 Arxiv 24。[Paper] [模型:structlm 7b] [模型:structlm 13b] [模型:structlm 34b] [數據集:SKGINSTRUCT]
Finsql,FinsQL:基於模型的agnostic LLMS基於文本到SQL框架,用於財務分析。 Sigmod Companion 24。[[Paper](https://arxiv.org/pdf/2401.10506)]
感覺,從弱和強LLM中綜合文本到SQL數據。 ACL 24。[紙]
Zeronl2SQL,將小語言模型和大型語言模型結合在一起,用於零擊NL2SQL。 VLDB 24。[紙]
Layoutlm,Layoutlm:文本和佈局的預培訓,以了解文檔圖像的理解。 KDD 20。[紙]
PubTabnet,基於圖像的表識別:數據,模型和評估。 ECCV 20。[紙] [代碼和數據]
表格,多模式表的理解。 ACL 24。[紙] [代碼] [模型]
TabLELVM,TableVLM:用於表結構識別的多模式預訓練。 ACL 23。[紙]
PIXT3,PIXT3:基於像素的表到文本生成。 ACL 24。[紙]
表格表示,嘈雜的操作員以及對LLMS中理解任務的表結構的影響。神經2023第二桌表示學習研討會。 [紙]
電子表格,電子表格:編碼大型語言模型的電子表格。 Arxiv 24。[紙]
增強大語模型的文本到SQL功能:及時設計策略的研究。 EMNLP 23。[紙] [代碼]
表作為文本或圖像的表:評估LLM和MLLM的表推理能力。 Arxiv 24。[紙]
自然語言降臨到SQL:我們已經準備好了嗎? VLDB 24。[紙] [代碼]
MCS-SQL,MCS-SQL:利用多個提示和多項選擇的選擇來生成。 [紙]
DIN-SQL,DIN-SQL:通過自校正提示,分解的文本到SQL的分解文本到SQL。神經23。[紙] [代碼]
dail-sql,大型語言模型授權的文本到SQL:基準評估。 VLDB 24。[紙] [代碼]
C3,C3:用chatgpt零擊文本到sql。 Arxiv 24。[紙] [代碼]
大型語言模型是多功能的分解器:分解基於桌子的推理的證據和問題。 Sigir 23。[Paper] [代碼]
活頁夾,符號語言的綁定語言模型。 ICLR 23。[紙] [代碼]
可反應的:增強桌子答案的反應。 VLDB 24。[紙] [代碼]
E5,E5:通過解釋,提取,執行,展覽和推斷使用增強LLM的零射擊層次表分析。 NAACL 24。[紙] [代碼]
鍊鍊,桌子鏈:推理鏈中的不斷發展的表,以理解桌子。 ICLR 24。[紙]
ITR,一個內在的桌子檢索器,用於可靠的表問題回答。 ACL 23。[紙]
Li-rage,Li-rage:較晚的互動檢索增強產生,並具有明確的信號,用於開放域桌子答案。 ACL 23。[紙]
SheetCopilot,SheetCopilot:通過大語言模型代理將軟件生產率帶入下一個水平。神經23。[紙] [代碼]
STEWAGENT,STEWAGENT:通過大型語言模型進行電子表格推理和操縱的通才代理。 Arxiv 24。[紙]
電子表格理解的視覺語言模型:挑戰和機遇。 Arxiv 24。[紙]
結構爭議:大型語言模型對結構化數據進行推理的一般框架。 EMNLP 23主。 [紙] [代碼]
TAP4LLM,TAP4LLM:用於大型語言模型推理的採樣,增強和包裝半結構化數據的表提供商。 Arxiv 23。[紙]
UNIDM,UNIDM:使用大語言模型進行數據操作的統一框架。 MLSYS 24。[紙]
數據 - 操作,數據 - 操作:橋接數十億個數據和人類具有自主工作流程。 Arxiv 23。[Paper] [代碼]
Llamaindex
Pandasai
瓦納
DB-GPT。 DB-GPT:授權與私人大語言模型的數據庫交互。 [紙] [代碼]
retclean。 RetClean:使用基礎模型和數據湖泊進行基於檢索的數據清潔。 [紙] [代碼]
大型語言模型的調查。 [紙]
一項基於大語言模型的自主代理的調查。 [紙]
表預訓練:關於模型體系結構,預訓練目標和下游任務的調查。 [紙]
用於表格數據表示的變壓器:模型和應用的調查。 [紙]
與大語言模型的桌子推理調查。 [紙]
關於桌面問題的調查回答:最新進展。 [紙]
表格數據上的大型語言模型(LLM) - 調查。 [紙]
對文本到SQL解析的調查:概念,方法和未來方向。 [紙]
姓名 | 關鍵字 | 人工製品 | 紙 |
---|---|---|---|
MBPP | 代碼 | 關聯 | Arxiv 21 |
人類 | 代碼 | 關聯 | Arxiv 21 |
Spider博士 | NL2SQL,健壯性 | 關聯 | ICLR 23 |
wikiable questions | 表格 | 關聯 | ACL 15 |
Wikisql | 表質量質量檢查,NL2SQL | 關聯 | Arxiv 17 |
Tabfact | 表事實驗證 | 關聯 | ICLR 20 |
Hybirdqa | 表格 | 關聯 | EMNLP 20 |
fetaqa | 表事實驗證 | 關聯 | 塔克爾22 |
野蠻 | 表格 | 關聯 | ACL 23 |
Anameta | 表元數據 | 關聯 | ACL 23 |
gpt4table | 表質量質量檢查,表格到文本 | 關聯 | WSDM 24 |
托托 | 桌面到文本 | 關聯 | EMNLP 20 |
電子表格板 | 電子表格操縱 | 關聯 | 神經24 |
鳥 | NL2SQL | 關聯 | 神經23 |
蜘蛛 | NL2SQL | 關聯 | EMNLP 18 |
Spider博士 | NL2SQL | 關聯 | ICLR 23 |
ScienceBenchmark | NL2SQL | 關聯 | VLDB 24 |
DS-1000 | 數據分析 | 關聯 | ICML 23 |
Infiagent-Dabench | 數據分析 | 關聯 | ICML 24 |
桌面 | 表檢測 | 關聯 | LERC 20 |
Pubtabnet | 表提取 | 關聯 | ECCV 20 |
COMTQA | 視覺表QA,表檢測,表提取 | 關聯 | Arxiv 24 |
姓名 | 關鍵字 | 人工製品 | 紙 |
---|---|---|---|
TableInstruct | 表指令調整 | 關聯 | Arxiv 23 |
WDC | 網絡桌 | 關聯 | www 16 |
Gittables | GitHub CSV | 關聯 | Sigmod 23 |
鏢 | 桌面到文本 | 關聯 | NAACL 21 |
mmtab | 多模式表理解 | 關聯 | ACL 24 |
圖式 | 數據庫模式 | 關聯 | Sigmod 24 |