LLM-TABLE-SURVEY
Tolok ukur
Kumpulan data
Model Bahasa Besar
Pelatihan Tabel Era Pra-Llm
Table Instruction-Tuning
Kode LLM
Hibrida Tabel & Kode
Pemahaman & Ekstraksi Tabel Multimodal
Perwakilan
Dorongan
Peralatan
Survei
Nl2sql
Tabel QA
Spreadsheet
Kerangka kerja multi-tugas
Daftar isi
Daftar Kertas
Dataset & tolok ukur
GPT-3, Model Bahasa adalah pelajar beberapa shot. Neurips 20. [Kertas]
T5, mengeksplorasi batas-batas pembelajaran transfer dengan transformator teks-ke-teks terpadu. [Kertas]
Flan, model bahasa finetuned adalah pelajar nol-shot. ICLR 22. [Kertas] [Kode]
DPO, Optimalisasi Preferensi Langsung: Model bahasa Anda diam -diam merupakan model hadiah. Neurips 23. [Kertas]
PEFT, kekuatan skala untuk penyetelan prompt yang efisien parameter. EMNLP 21. [Kertas]
Lora, Lora: Adaptasi rendah dari model bahasa besar. ICLR 22. [Kertas]
Rantai-pemikiran yang mendorong, rantai-pemikiran yang mendorong memunculkan penalaran dalam model bahasa besar. Neurips 22. [Kertas]
Yang paling tidak paling diminta, dorongan paling tidak paling penting memungkinkan penalaran kompleks dalam model bahasa besar. Iclr 23. [Kertas]
Konsistensi diri yang mendorong, konsistensi diri meningkatkan rantai penalaran pemikiran dalam model bahasa. Iclr 23. [Kertas]
Bereaksi, Bereaksi: Penalaran Sinergi dan Bertindak dalam Model Bahasa. ICLR 23. [Kertas] [Kode]
Tabert, Tabert: Pretraining untuk pemahaman bersama data tekstual dan tabular. ACL 20 Utama. [Kertas] [kode]
Tapex, Tapex: Tabel Pra-Pelatihan Melalui Belajar Eksekutor SQL Neural. ICLR 22. [Kertas] [Kode] [Model]
Tabbie, Tabbie: Representasi pretrain dari data tabel. NAACL 21 Main. [Kertas] [kode]
Turl, Turl: Pemahaman Tabel Melalui Pembelajaran Representasi. Vldb 21. [kertas] [kode]
Resdsql, resdsql: Decoupling Schema Linking dan Skeleton Parsing untuk Text-to-SQL. Aaai 23. [kertas] [Kode]
UnifiedSKG, UnifiedSKG: menyatukan dan multi-tasking pengetahuan terstruktur dengan model bahasa teks-ke-teks. EMNLP 22 Main. [Kertas] [kode]
SpreadsheetCoder, spreadsheetcoder: prediksi rumus dari konteks semi-terstruktur. ICML 21. [kertas] [kode]
Table-GPT, Table-GPT: GPT yang disetel meja untuk beragam tugas meja. Arxiv 2023. [Kertas]
Tablellama, Tablellama: Menuju model generalis besar terbuka untuk tabel. NAACL 24. [Kertas] [Kode] [Model: Tablellama 7B] [Dataset: TableInstruct]
Codex, mengevaluasi model bahasa besar yang dilatih pada kode. Arxiv 21. [Kertas]
Starcoder, Starcoder: Semoga sumbernya menyertai Anda!. TMLR 23. [Kertas] [kode] [Model]
Kode Llama, kode llama: Model Yayasan Terbuka untuk Kode. arxiv 23. [kertas] [kode]
Wizardlm, Wizardlm: Memberdayakan Model Bahasa Pra-Terlatih Besar untuk mengikuti instruksi yang kompleks. ICLR 24. [Kertas] [Model: Wizardlm 13b] [Model: Wizardlm 70b]
WizardCoder, WizardCoder: memberdayakan kode model bahasa besar dengan evol-instruct. ICLR 24. [Kertas] [Kode] [Model: WizardCoder 15b]
Magicoder, Magicoder: Kode sumber adalah yang Anda butuhkan. ICML 24. [kertas] [kode] [Model 6.7b/7b]
Lemur, Lemur: Menyelaraskan bahasa alami dan kode untuk agen bahasa. ICLR 24. [Kertas] [Kode] [Model: Lemur 70b] [Model: Lemur 70B Chat]
Infiagent-Dabench, Infiagent-Dabench: Mengevaluasi Agen pada Tugas Analisis Data. ICML 24. [Kertas] [Kode]
Tablellm, Tablellm: Mengaktifkan manipulasi data tabel oleh LLMS dalam skenario penggunaan kantor nyata. [Kertas] [Model Tablellm 7b] [Model Tablellm 13b]
Structlm, structlm: Menuju membangun model generalis untuk landasan pengetahuan terstruktur. ARXIV 24. [Kertas] [Model: Structlm 7b] [Model: Structlm 13b] [Model: Structlm 34b] [Dataset: SKGInstruct]
FINSQL, FINSQL: Model-agnostic LLMS berbasis kerangka kerja-ke-SQL untuk analisis keuangan. Sigmod Companion 24. [Paper] (https://arxiv.org/pdf/2401.10506)]]
Sense, mensintesis data teks-ke-SQL dari LLM yang lemah dan kuat. ACL 24. [Kertas]
ZeronL2SQL, menggabungkan model bahasa kecil dan model bahasa besar untuk nlot-shot NL2SQL. Vldb 24. [kertas]
Layoutlm, LayoutLM: Pra-pelatihan teks dan tata letak untuk pemahaman gambar dokumen. KDD 20. [Kertas]
Pubtabnet, pengenalan tabel berbasis gambar: data, model, dan evaluasi. ECCV 20. [Kertas] [Kode & Data]
Table -lava, pemahaman tabel multimodal. ACL 24. [Kertas] [Kode] [Model]
Tabelvm, tablevlm: pra-pelatihan multi-modal untuk pengenalan struktur tabel. ACL 23. [Kertas]
PIXT3, PIXT3: Generasi Tabel-ke-Teks Berbasis Pixel. ACL 24. [Kertas]
Representasi tabel, operator bising, dan dampak pada tugas pemahaman struktur tabel di LLMS. Neurips 2023 Lokakarya Pembelajaran Representasi Tabel Kedua. [Kertas]
Spreadsheetllm, spreadsheetllm: encoding spreadsheet untuk model bahasa besar. Arxiv 24. [Kertas]
Meningkatkan kemampuan teks-ke-SQL dari model bahasa besar: Studi tentang strategi desain yang cepat. EMNLP 23. [Kertas] [Kode]
Tabel sebagai teks atau gambar: Mengevaluasi kemampuan penalaran tabel LLMS dan MLLMS. Arxiv 24. [Kertas]
Dawn of Natural Language to SQL: Apakah kita sepenuhnya siap? Vldb 24. [kertas] [kode]
MCS-SQL, MCS-SQL: Memanfaatkan beberapa petunjuk beberapa pilihan pilihan ganda untuk pembuatan teks-ke-SQL. [Kertas]
DIN-SQL, DIN-SQL: Pembelajaran dalam konteks yang terurai dari Text-to-SQL dengan dorongan koreksi diri, terurai. Neurips 23. [kertas] [kode]
Dail-sql, teks-ke-sql diberdayakan oleh model bahasa besar: evaluasi benchmark. Vldb 24. [kertas] [kode]
C3, C3: Teks ke-sql nol-shot dengan chatgpt. arxiv 24. [kertas] [kode]
Dater, model bahasa besar adalah pengurai fleksibel: Mengurai bukti dan pertanyaan untuk penalaran berbasis tabel. SIGIR 23. [Kertas] [Kode]
Binder, Model Bahasa yang Mengikat dalam Bahasa Simbolik. ICLR 23. [Kertas] [Kode]
Dapat Diakses, Bereaksi: Meningkatkan Bereaksi untuk menjawab pertanyaan tabel. Vldb 24. [kertas] [kode]
E5, E5: Analisis tabel hierarkis zero-shot menggunakan LLM augmented melalui menjelaskan, mengekstrak, mengeksekusi, menunjukkan dan mengekstrapolasi. NAACL 24. [Kertas] [Kode]
Rantai-of-table, rantai-meja: Tabel yang berkembang dalam rantai penalaran untuk pemahaman tabel. ICLR 24. [Kertas]
ITR, retriever meja dalam untuk menjawab pertanyaan tabel yang kuat. ACL 23. [Kertas]
Li-Rage, Li-Rage: Akhir pengambilan generasi augmented dengan sinyal eksplisit untuk pertanyaan tabel domain terbuka menjawab. ACL 23. [Kertas]
Sheetcopilot, SheetCopilot: Membawa produktivitas perangkat lunak ke tingkat berikutnya melalui agen model bahasa besar. Neurips 23. [kertas] [kode]
Sheetagent, SheetAgent: Agen generalis untuk penalaran spreadsheet dan manipulasi melalui model bahasa besar. Arxiv 24. [Kertas]
Model bahasa visi untuk pemahaman spreadsheet: tantangan dan peluang. Arxiv 24. [Kertas]
Structgpt, structgpt: Kerangka kerja umum untuk model bahasa besar untuk beralasan atas data terstruktur. EMNLP 23 Main. [Kertas] [kode]
TAP4LLM, TAP4LLM: Penyedia tabel pada pengambilan sampel, augmenting, dan pengemasan data semi-terstruktur untuk penalaran model bahasa besar. Arxiv 23. [Kertas]
UNIDM, UNIDM: Kerangka kerja terpadu untuk manipulasi data dengan model bahasa besar. MLSYS 24. [Kertas]
Data-Copilot, Data-Copilot: Menjembatani miliaran data dan manusia dengan alur kerja otonom. arxiv 23. [kertas] [kode]
Llamaindex
Pandasai
Vanna
DB-GPT. DB-GPT: Memberdayakan interaksi basis data dengan model bahasa besar pribadi. [Kertas] [kode]
RetClean. RetClean: Pembersihan data berbasis pengambilan menggunakan model pondasi dan danau data. [Kertas] [kode]
Survei model bahasa besar. [Kertas]
Survei tentang agen otonom berbasis model bahasa besar. [Kertas]
Table Pre-Training: Survei tentang arsitektur model, tujuan pra-pelatihan, dan tugas hilir. [Kertas]
Transformers untuk Representasi Data Tabular: Survei Model dan Aplikasi. [Kertas]
Survei penalaran tabel dengan model bahasa besar. [Kertas]
Sebuah survei tentang pertanyaan menjawab: Kemajuan terbaru. [Kertas]
Model Bahasa Besar (LLM) tentang Data Tabel - Survei. [Kertas]
Sebuah survei tentang penguraian teks-ke-sql: konsep, metode, dan arah masa depan. [Kertas]
Nama | Kata kunci | Artefak | Kertas |
---|---|---|---|
Mbpp | Kode | link | Arxiv 21 |
Humaneval | Kode | link | Arxiv 21 |
Dr.Spider | Nl2sql, ketahanan | link | Iclr 23 |
Perjanjian Wikitable | Tabel QA | link | ACL 15 |
Wikisql | Tabel QA, NL2SQL | link | Arxiv 17 |
Tabfact | Verifikasi Fakta Tabel | link | Iclr 20 |
Hybirdqa | Tabel QA | link | EMNLP 20 |
Fetaqa | Verifikasi Fakta Tabel | link | TACL 22 |
Robut | Tabel QA | link | ACL 23 |
Anameta | Metadata meja | link | ACL 23 |
Gpt4table | Tabel QA, tabel-ke-teks | link | WSDM 24 |
Totto | Tabel-ke-teks | link | EMNLP 20 |
Spreadsheetbench | Manipulasi spreadsheet | link | Neurips 24 |
BURUNG | Nl2sql | link | Neurips 23 |
Laba -laba | Nl2sql | link | EMNLP 18 |
Dr.Spider | Nl2sql | link | Iclr 23 |
ScienceBenchmark | Nl2sql | link | Vldb 24 |
DS-1000 | Analisis Data | link | ICML 23 |
Infiagent-Dabench | Analisis Data | link | ICML 24 |
TableBank | Deteksi meja | link | LERC 20 |
Pubtabnet | Ekstraksi meja | link | ECCV 20 |
Comtqa | QA tabel visual, deteksi tabel, ekstraksi tabel | link | Arxiv 24 |
Nama | Kata kunci | Artefak | Kertas |
---|---|---|---|
Tableinstruct | Penyetelan instruksi tabel | link | Arxiv 23 |
WDC | Tabel web | link | Www 16 |
Gittables | CSV GitHub | link | Sigmod 23 |
ANAK PANAH | Tabel-ke-teks | link | NAACL 21 |
Mmtab | Pemahaman tabel multimodal | link | ACL 24 |
SCHEMAPILE | Skema Basis Data | link | Sigmod 24 |