LLM-Table-Survey
เกณฑ์มาตรฐาน
ชุดข้อมูล
รูปแบบภาษาขนาดใหญ่
การฝึกอบรมตาราง pre-llm ERA
การปรับแต่งคำสั่งตาราง
รหัส LLM
ไฮบริดของตารางและรหัส
ความเข้าใจและการสกัดของตารางหลายรูปแบบ
การแสดง
การแจ้งเตือน
เครื่องมือ
สำรวจ
NL2SQL
ตาราง QA
สเปรดชีต
เฟรมเวิร์กหลายงาน
สารบัญ
รายการกระดาษ
ชุดข้อมูลและมาตรฐาน
GPT-3 แบบจำลองภาษาเป็นผู้เรียนไม่กี่คน NEURIPS 20. [กระดาษ]
T5, สำรวจขีด จำกัด ของการเรียนรู้การถ่ายโอนด้วยหม้อแปลงข้อความเป็นข้อความแบบครบวงจร [กระดาษ]
รูปแบบภาษา Flan ที่มี finetuned เป็นศูนย์ผู้เรียน ICLR 22. [กระดาษ] [รหัส]
DPO, การเพิ่มประสิทธิภาพการตั้งค่าโดยตรง: แบบจำลองภาษาของคุณเป็นแบบจำลองรางวัล NEURIPS 23. [กระดาษ]
Peft พลังของสเกลสำหรับการปรับแต่งพารามิเตอร์ที่มีประสิทธิภาพ emnlp 21. [กระดาษ]
Lora, Lora: การปรับระดับต่ำของแบบจำลองภาษาขนาดใหญ่ ICLR 22. [กระดาษ]
การกระตุ้นด้วยความคิดแบบห่วงโซ่ทำให้เกิดการกระตุ้นให้เกิดการให้เหตุผลในรูปแบบภาษาขนาดใหญ่ Neurips 22. [กระดาษ]
การแจ้งเตือนน้อยที่สุดการแจ้งเตือนน้อยที่สุดจะช่วยให้การให้เหตุผลที่ซับซ้อนในรูปแบบภาษาขนาดใหญ่ ICLR 23. [กระดาษ]
การกระตุ้นความพร้อมด้วยตนเองการแสดงความพร้อมด้วยตนเองช่วยเพิ่มห่วงโซ่ของการให้เหตุผลทางความคิดในแบบจำลองภาษา ICLR 23. [กระดาษ]
React, React: การประสานการใช้เหตุผลและทำหน้าที่ในแบบจำลองภาษา ICLR 23. [กระดาษ] [รหัส]
TABERT, TABERT: การเตรียมการเพื่อความเข้าใจร่วมกันของข้อมูลที่เป็นข้อความและตาราง ACL 20 หลัก [กระดาษ] [รหัส]
TAPEX, TAPEX: การฝึกอบรมล่วงหน้าด้วยการเรียนรู้ผู้บริหาร SQL Neural ICLR 22. [กระดาษ] [รหัส] [รุ่น]
TABBIE, TABBIE: การเป็นตัวแทนของข้อมูลตาราง NAACL 21 หลัก [กระดาษ] [รหัส]
Turl, Turl: การทำความเข้าใจตารางผ่านการเรียนรู้การเป็นตัวแทน VLDB 21. [กระดาษ] [รหัส]
resdsql, resdsql: decoupling schema linking และการแยกวิเคราะห์โครงกระดูกสำหรับข้อความถึง SQL Aaai 23. [กระดาษ] [รหัส]
UnifiedSKG, UnifiedSKG: ความรู้ที่มีโครงสร้างแบบรวมและมัลติทาสกิ้งแบบมีโครงสร้างด้วยแบบจำลองภาษาข้อความเป็นข้อความ EMNLP 22 หลัก [กระดาษ] [รหัส]
SpreadsheetCoder, SpreadsheetCoder: การทำนายสูตรจากบริบทกึ่งโครงสร้าง ICML 21. [กระดาษ] [รหัส]
Table-GPT, Table-GPT: GPT ที่ได้รับการปรับตารางสำหรับงานตารางที่หลากหลาย Arxiv 2023. [กระดาษ]
Tablellama, Tablellama: ไปสู่รุ่นทั่วไปที่เปิดกว้างสำหรับโต๊ะ NAACL 24. [กระดาษ] [รหัส] [รุ่น: Tablelama 7b] [ชุดข้อมูล: TableInstruct]
Codex, การประเมินแบบจำลองภาษาขนาดใหญ่ที่ผ่านการฝึกอบรมเกี่ยวกับรหัส arxiv 21. [กระดาษ]
StarCoder, StarCoder: ขอให้แหล่งข่าวอยู่กับคุณ! tmlr 23. [กระดาษ] [รหัส] [รุ่น]
รหัส LLAMA, CODE LLAMA: แบบเปิดพื้นฐานสำหรับรหัส arxiv 23. [กระดาษ] [รหัส]
Wizardlm, Wizardlm: เพิ่มขีดความสามารถของแบบจำลองภาษาที่ผ่านการฝึกอบรมมาก่อนเพื่อทำตามคำแนะนำที่ซับซ้อน ICLR 24. [กระดาษ] [รุ่น: Wizardlm 13b] [รุ่น: Wizardlm 70b]
WizardCoder, WizardCoder: เพิ่มขีดความสามารถของรหัสแบบจำลองภาษาขนาดใหญ่ด้วย Evol-Instruct ICLR 24. [กระดาษ] [รหัส] [รุ่น: WizardCoder 15B]
Magicoder, Magicoder: ซอร์สโค้ดคือสิ่งที่คุณต้องการ ICML 24. [กระดาษ] [รหัส] [รุ่น 6.7b/7b]
LeMur, LeMur: การประสานภาษาธรรมชาติและรหัสสำหรับตัวแทนภาษา ICLR 24. [กระดาษ] [รหัส] [รุ่น: LeMur 70b] [รุ่น: Lemur 70b Chat]
Infiagent-Dabench, Infiagent-Dabench: การประเมินตัวแทนในงานการวิเคราะห์ข้อมูล ICML 24. [กระดาษ] [รหัส]
Tablellm, Tablellm: การเปิดใช้งานการจัดการข้อมูลแบบตารางโดย LLMs ในสถานการณ์การใช้งานจริง [Paper] [Model Tablellm 7b] [Model Tablellm 13b]
structlm, structlm: ไปสู่การสร้างแบบจำลองทั่วไปสำหรับการต่อสายดินความรู้ที่มีโครงสร้าง arxiv 24. [กระดาษ] [โมเดล: structlm 7b] [โมเดล: structlm 13b] [โมเดล: structlm 34b] [ชุดข้อมูล: SkginStruct]
FINSQL, FINSQL: เฟรมเวิร์ก Model-Agnostic LLMS-based LLMS สำหรับการวิเคราะห์ทางการเงิน Sigmod Companion 24. [[กระดาษ] (https://arxiv.org/pdf/2401.10506)]]
ความรู้สึกการสังเคราะห์ข้อมูลข้อความถึง SQL จาก LLM ที่อ่อนแอและแข็งแกร่ง ACL 24. [กระดาษ]
Zeronl2Sql รวมโมเดลภาษาขนาดเล็กและรุ่นภาษาขนาดใหญ่สำหรับศูนย์ NL2SQL VLDB 24. [กระดาษ]
layoutlm, layoutlm: การฝึกอบรมล่วงหน้าของข้อความและเลย์เอาต์สำหรับการทำความเข้าใจภาพเอกสาร kdd 20. [กระดาษ]
PubTabnet การจดจำตารางที่อิงภาพ: ข้อมูลโมเดลและการประเมินผล ECCV 20. [กระดาษ] [รหัสและข้อมูล]
Table-llava, การทำความเข้าใจตารางหลายรูปแบบ ACL 24. [กระดาษ] [รหัส] [รุ่น]
tablevm, tablevlm: การฝึกอบรมล่วงหน้าหลายโมดอลสำหรับการจดจำโครงสร้างตาราง ACL 23. [กระดาษ]
PIXT3, PIXT3: การสร้างตารางเป็นข้อความที่ใช้พิกเซล ACL 24. [กระดาษ]
การเป็นตัวแทนแบบตารางตัวดำเนินการที่มีเสียงดังและผลกระทบต่อโครงสร้างการทำความเข้าใจโครงสร้างตารางใน LLMS Neurips 2023 การประชุมเชิงปฏิบัติการการเรียนรู้ตารางที่สอง [กระดาษ]
Spreadsheetllm, Spreadsheetllm: การเข้ารหัสสเปรดชีตสำหรับรุ่นภาษาขนาดใหญ่ arxiv 24. [กระดาษ]
การเพิ่มขีดความสามารถของข้อความถึง SQL ของแบบจำลองภาษาขนาดใหญ่: การศึกษาเกี่ยวกับกลยุทธ์การออกแบบที่รวดเร็ว emnlp 23. [กระดาษ] [รหัส]
ตารางเป็นข้อความหรือรูปภาพ: การประเมินความสามารถในการใช้เหตุผลของตารางของ LLMS และ MLLMS arxiv 24. [กระดาษ]
รุ่งอรุณของภาษาธรรมชาติถึง SQL: เราพร้อมหรือยัง? VLDB 24. [กระดาษ] [รหัส]
MCS-SQL, MCS-SQL: ใช้ประโยชน์จากการแจ้งเตือนหลายครั้งและการเลือกแบบปรนัยสำหรับการสร้างข้อความถึง SQL [กระดาษ]
DIN-SQL, DIN-SQL: ย่อยสลายการเรียนรู้ในบริบทของข้อความถึง SQL ด้วยการแจ้งเตือนการแก้ไขตนเองสลายตัว Neurips 23. [กระดาษ] [รหัส]
Dail-SQL, text-to-SQL ได้รับพลังจากแบบจำลองภาษาขนาดใหญ่: การประเมินเกณฑ์มาตรฐาน VLDB 24. [กระดาษ] [รหัส]
C3, C3: zero-shot text-to-sql พร้อม chatgpt arxiv 24. [กระดาษ] [รหัส]
Dater แบบจำลองภาษาขนาดใหญ่เป็นตัวย่อยสลายที่หลากหลาย: สลายหลักฐานและคำถามสำหรับการใช้เหตุผลบนโต๊ะ Sigir 23. [กระดาษ] [รหัส]
สารยึดเกาะแบบจำลองภาษาที่มีผลผูกพันในภาษาสัญลักษณ์ ICLR 23. [กระดาษ] [รหัส]
ตอบสนองได้ง่าย: เพิ่มปฏิกิริยาตอบสนองสำหรับการตอบคำถามบนตาราง VLDB 24. [กระดาษ] [รหัส]
E5, E5: การวิเคราะห์ตารางลำดับชั้นแบบไม่มีการยิงโดยใช้ LLM แบบเพิ่มผ่านการอธิบาย, สารสกัด, ดำเนินการ, จัดแสดงและการคาดการณ์ NAACL 24. [กระดาษ] [รหัส]
โซ่ของโต๊ะโซ่ของโต๊ะ: การพัฒนาตารางในห่วงโซ่การให้เหตุผลสำหรับการทำความเข้าใจตาราง ICLR 24. [กระดาษ]
ITR ซึ่งเป็นโต๊ะเก็บข้อมูลภายในสำหรับการตอบคำถามตารางที่แข็งแกร่ง ACL 23. [กระดาษ]
Li-Rage, Li-Rage: การดึงการดึงปฏิสัมพันธ์ล่าช้าพร้อมสัญญาณที่ชัดเจนสำหรับการตอบคำถามตารางโดเมนแบบเปิด ACL 23. [กระดาษ]
SheetCopilot, SheetCopilot: นำประสิทธิภาพการผลิตซอฟต์แวร์ไปสู่อีกระดับผ่านตัวแทนรุ่นภาษาขนาดใหญ่ Neurips 23. [กระดาษ] [รหัส]
Sheetagent, Sheetagent: ตัวแทนทั่วไปสำหรับการใช้เหตุผลสเปรดชีตและการจัดการผ่านแบบจำลองภาษาขนาดใหญ่ arxiv 24. [กระดาษ]
แบบจำลองภาษาวิสัยทัศน์สำหรับการทำความเข้าใจสเปรดชีต: ความท้าทายและโอกาส arxiv 24. [กระดาษ]
structGPT, structGPT: กรอบทั่วไปสำหรับแบบจำลองภาษาขนาดใหญ่เพื่อให้เหตุผลมากกว่าข้อมูลที่มีโครงสร้าง EMNLP 23 หลัก [กระดาษ] [รหัส]
TAP4LLM, TAP4LLM: ผู้ให้บริการตารางในการสุ่มตัวอย่างการเพิ่มและการบรรจุข้อมูลกึ่งโครงสร้างสำหรับการใช้เหตุผลแบบจำลองภาษาขนาดใหญ่ arxiv 23. [กระดาษ]
UNIDM, UNIDM: เฟรมเวิร์กแบบครบวงจรสำหรับการจัดการข้อมูลด้วยแบบจำลองภาษาขนาดใหญ่ MLSYS 24. [กระดาษ]
ข้อมูลโค้ชข้อมูลโค้ช: เชื่อมโยงข้อมูลหลายพันล้านและมนุษย์ด้วยเวิร์กโฟลว์อัตโนมัติ arxiv 23. [กระดาษ] [รหัส]
llamainedex
แพนด้า
Vanna
db-gpt DB-GPT: การเพิ่มขีดความสามารถในการโต้ตอบฐานข้อมูลกับโมเดลภาษาขนาดใหญ่ส่วนตัว [กระดาษ] [รหัส]
Retclean Retclean: การทำความสะอาดข้อมูลแบบดึงข้อมูลโดยใช้แบบจำลองพื้นฐานและทะเลสาบข้อมูล [กระดาษ] [รหัส]
การสำรวจแบบจำลองภาษาขนาดใหญ่ [กระดาษ]
การสำรวจเกี่ยวกับเอเจนต์อิสระที่ใช้ภาษาขนาดใหญ่ [กระดาษ]
ตารางการฝึกอบรมล่วงหน้า: การสำรวจเกี่ยวกับสถาปัตยกรรมแบบจำลองวัตถุประสงค์ก่อนการฝึกอบรมและงานดาวน์สตรีม [กระดาษ]
หม้อแปลงสำหรับการแสดงข้อมูลแบบตาราง: การสำรวจของแบบจำลองและแอปพลิเคชัน [กระดาษ]
การสำรวจการให้เหตุผลของตารางด้วยแบบจำลองภาษาขนาดใหญ่ [กระดาษ]
แบบสำรวจเกี่ยวกับการตอบคำถามตาราง: ความก้าวหน้าล่าสุด [กระดาษ]
แบบจำลองภาษาขนาดใหญ่ (LLMS) บนข้อมูลแบบตาราง - การสำรวจ [กระดาษ]
การสำรวจการแยกวิเคราะห์แบบข้อความถึง SQL: แนวคิดวิธีการและทิศทางในอนาคต [กระดาษ]
ชื่อ | คำสำคัญ | สิ่งประดิษฐ์ | กระดาษ |
---|---|---|---|
MBPP | รหัส | การเชื่อมโยง | arxiv 21 |
เกี่ยวกับมนุษย์ | รหัส | การเชื่อมโยง | arxiv 21 |
ดร. สปอร์ | nl2sql ความทนทาน | การเชื่อมโยง | ICLR 23 |
Wikitablequestions | ตาราง QA | การเชื่อมโยง | ACL 15 |
Wikisql | ตาราง QA, NL2SQL | การเชื่อมโยง | arxiv 17 |
แท็บ | การตรวจสอบข้อเท็จจริงของตาราง | การเชื่อมโยง | ICLR 20 |
Hybirdqa | ตาราง QA | การเชื่อมโยง | emnlp 20 |
เฟต้า | การตรวจสอบข้อเท็จจริงของตาราง | การเชื่อมโยง | tacl 22 |
คนเคราะห์ร้าย | ตาราง QA | การเชื่อมโยง | ACL 23 |
Anameta | ข้อมูลเมตาตาราง | การเชื่อมโยง | ACL 23 |
gpt4table | ตาราง QA, ตารางเป็นข้อความ | การเชื่อมโยง | WSDM 24 |
Totto | แบบตารางเป็นข้อความ | การเชื่อมโยง | emnlp 20 |
สเปรดชีต | การจัดการสเปรดชีต | การเชื่อมโยง | NEURIPS 24 |
นก | NL2SQL | การเชื่อมโยง | NEURIPS 23 |
แมงมุม | NL2SQL | การเชื่อมโยง | emnlp 18 |
ดร. สปอร์ | NL2SQL | การเชื่อมโยง | ICLR 23 |
ScienceBenchmark | NL2SQL | การเชื่อมโยง | VLDB 24 |
DS-1000 | การวิเคราะห์ข้อมูล | การเชื่อมโยง | ICML 23 |
อินฟราเรด | การวิเคราะห์ข้อมูล | การเชื่อมโยง | ICML 24 |
ธนาคารบนโต๊ะ | การตรวจจับตาราง | การเชื่อมโยง | lerc 20 |
pubtabnet | การสกัดตาราง | การเชื่อมโยง | ECCV 20 |
comtqa | Visual Table QA, การตรวจจับตาราง, การสกัดตาราง | การเชื่อมโยง | arxiv 24 |
ชื่อ | คำสำคัญ | สิ่งประดิษฐ์ | กระดาษ |
---|---|---|---|
tableinstruct | การปรับแต่งคำสั่งตาราง | การเชื่อมโยง | arxiv 23 |
WDC | ตารางเว็บ | การเชื่อมโยง | www 16 |
gittables | GitHub CSVS | การเชื่อมโยง | Sigmod 23 |
โผ | แบบตารางเป็นข้อความ | การเชื่อมโยง | NAACL 21 |
mmtab | ความเข้าใจตารางหลายรูปแบบ | การเชื่อมโยง | ACL 24 |
schemapile | แผนผังฐานข้อมูล | การเชื่อมโยง | Sigmod 24 |