LLM-Table-Survey
Тесты
Наборы данных
Большая языковая модель
Обучение таблицами эпохи до LLM
Таблица настройка
Код LLM
Гибрид таблицы и кода
Понимание и извлечение мультимодальной таблицы
Представительство
Подсказка
Инструменты
Опрос
Nl2sql
Таблица QA
Электронная таблица
Фреймворк с несколькими задачами
Оглавление
Бумажный список
Наборы данных и тестов
GPT-3, языковые модели-это несколько выстрелов. Neurips 20. [Paper]
T5, исследуя пределы обучения передачи с помощью унифицированного трансформатора текста в текст. [Бумага]
Флан, современные языковые модели являются учениками с нулевым выстрелом. ICLR 22. [Paper] [Код]
DPO, Прямая оптимизация предпочтений: ваша языковая модель тайно является моделью вознаграждения. Neurips 23. [Paper]
PEFT, мощность масштаба для настройки параметров. EMNLP 21. [Paper]
Лора, Лора: Низкая адаптация крупных языковых моделей. ICLR 22. [Paper]
Подразделение цепочки мыслей, подсказка для цепочки мыслей вызывает рассуждения в крупных языковых моделях. Neurips 22. [Paper]
Наименьшее количество подсказок, наименьшее количество подсказок позволяет сложные рассуждения в крупных языковых моделях. ICLR 23. [Paper]
Подсказка самосогласованности, самосогласованность улучшает цепочку мышления в языковых моделях. ICLR 23. [Paper]
Реактируйте, реагируйте: синергирующие рассуждения и действие в языковых моделях. ICLR 23. [Paper] [Код]
Tabert, Tabert: Предварительная подготовка для совместного понимания текстовых и табличных данных. ACL 20 Main. [Paper] [Код]
Tailx, tailx: предварительная тренировка таблицы через изучение нейронного исполнителя SQL. ICLR 22. [Paper] [CODE] [Модели]
Tabbie, Tabbie: предварительно проведенные представления табличных данных. NAACL 21 Main. [Paper] [Код]
Турл, Турл: Понимание таблицы через репрезентативное обучение. VLDB 21. [Paper] [Код]
Resdsql, resdsql: схема развязки, связывание и анализ скелета для текста в Sql. AAAI 23. [Paper] [Код]
Unifiedskg, Unifiedskg: Объединение и многозадачное структурированное знание, заземленное с помощью текстовых моделей языка. EMNLP 22 Main. [Paper] [Код]
Spreadsheetcoder, Spreadsheetcoder: прогноз формулы из полуструктурированного контекста. ICML 21. [Paper] [Код]
Table-GPT, Table-GPT: Table-Hun GPT для разнообразных задач таблицы. Arxiv 2023. [Paper]
Таблеллама, Таблеллама: к открытым большим моделям генералиста для таблиц. NAACL 24.
Кодекс, оценка больших языковых моделей, обученных коду. arxiv 21. [Paper]
Starcoder, StarCoder: Пусть Источник будет с вами!. TMLR 23. [Paper] [CODE] [Модели]
Код Llama, Code Llama: Open Foundation Models для кода. arxiv 23. [Paper] [Код]
Wizardlm, Wizardlm: расширение возможностей крупных предварительно обученных языковых моделей для выполнения сложных инструкций. ICLR 24.
WizardCoder, WizardCoder: расширение возможностей кода большие языковые модели с помощью Evol-Instruct. ICLR 24. [Paper] [Код] [Модели: WizardCoder 15b]
Magicoder, Magicoder: исходный код - это все, что вам нужно. ICML 24. [Paper] [CODE] [Модели 6.7B/7B]
Лемур, Лемур: гармонизирующий естественный язык и код для языковых агентов. ICLR 24.
Infiagent-Dabench, Infiagent-Dabench: оценка агентов по задачам анализа данных. ICML 24. [Paper] [Код]
Tablellm, Tablellm: включение манипулирования таблицами данных LLMS в реальных сценариях использования офиса. [Paper] [Model Tablellm 7b] [Model Tablellm 13b]
Structlm, structlm: к созданию моделей генералиста для структурированных знаний заземления. arxiv 24.
FINSQL, FINSQL: модель-агрессия на основе LLMS Framework для финансового анализа. Sigmod Companion 24. [[Paper] (https://arxiv.org/pdf/2401.10506)]]
Смысл, синтезирование данных текста до SQL из слабых и сильных LLMS. ACL 24. [Бумага]
Zeronl2SQL, объединяя модели небольших языков и большие языковые модели для нулевого выстрела NL2SQL. Vldb 24. [Бумага]
Layoutlm, Layoutlm: предварительное обучение текста и макета для понимания изображения документов. KDD 20. [Paper]
Pubtabnet, распознавание таблиц на основе изображений: данные, модель и оценка. ECCV 20. [Paper] [Код и данные]
Таблица-лопава, мультимодальное понимание таблицы. ACL 24. [Paper] [CODE] [Модель]
TableLVM, TableVlm: мультимодальное предварительное обучение для распознавания структуры таблицы. ACL 23. [Paper]
Pixt3, Pixt3: Generation на основе пикселей на основе пикселей. ACL 24. [Бумага]
Табличное представление, шумные операторы и влияние на задачи понимания структуры таблицы в LLMS. Neurips 2023 Вторая таблица. [Бумага]
Spreadsheetllm, Spreadsheetllm: кодирование электронных таблиц для больших языковых моделей. arxiv 24. [Бумага]
Улучшение возможностей текста до SQL крупных языковых моделей: исследование стратегий быстрого проектирования. EMNLP 23. [Paper] [Код]
Таблицы как тексты или изображения: оценка способности рассуждения таблицы LLMS и MLLMS. arxiv 24. [Бумага]
Рассвет естественного языка для SQL: мы полностью готовы? VLDB 24. [Paper] [Код]
MCS-SQL, MCS-SQL: использование нескольких подсказок и выбор с множественным выбором для генерации текста в SQL. [Бумага]
DIN-SQL, DIN-SQL: разлагаемое в контекстном контексте обучение текста к SQL с самокоррекцией подсказки, разлагается. Neurips 23. [Paper] [Код]
Dail-SQL, текст к SQL, уполномоченные крупными языковыми моделями: эталонная оценка. VLDB 24. [Paper] [Код]
C3, C3: с нулевым выстрелом текст в SQL с CHATGPT. arxiv 24. [Paper] [Код]
Dater, крупные языковые модели являются универсальными декомпозиторами: разлагают доказательства и вопросы для рассуждений на основе таблиц. Sigir 23. [Paper] [Код]
Переплет, связующие языковые модели на символических языках. ICLR 23. [Paper] [Код]
Реактивные, реагируемые: улучшение реагирования для ответа на вопрос о таблице. VLDB 24. [Paper] [Код]
E5, E5: иерархический анализ таблиц с нулевым выстрелом с использованием дополненных LLM с помощью объяснения, извлечения, выполнения, демонстрации и экстраполяции. NAACL 24. [Paper] [Код]
Цепочка до таблицы, цепь таблица: развивающиеся таблицы в цепочке рассуждений для понимания таблицы. ICLR 24. [Бумага]
ITR, внутренний ретривер для ответа на вопрос о надежном вопросе. ACL 23. [Paper]
Li-Rage, Li-Rage: Позднее извлечение в поисках добычи с явными сигналами для ответа на вопрос с открытым доменом. ACL 23. [Paper]
SheetCopilot, Sheetcopilot: вывод производительности программного обеспечения на следующий уровень через агент крупных языковых моделей. Neurips 23. [Paper] [Код]
Sheetagent, Sheetagent: универсальный агент для рассуждений и манипуляций с электронными таблицами с помощью крупных языковых моделей. arxiv 24. [Бумага]
Языковые модели зрения для понимания электронных таблиц: проблемы и возможности. arxiv 24. [Бумага]
Structgpt, structgpt: общая структура для модели большой языка для разумного разума по структурированным данным. EMNLP 23 Main. [Paper] [Код]
TAP4LLM, TAP4LLM: поставщик таблиц по отбору отбора проб, увеличения и упаковки полуструктурированных данных для рассуждений с большим языком. arxiv 23. [Бумага]
UNIDM, UNIDM: унифицированная структура для манипулирования данными с большими языковыми моделями. MLSYS 24. [Бумага]
Data-Copilot, Data-Copilot: соединение миллиардов данных и людей с автономным рабочим процессом. arxiv 23. [Paper] [Код]
Lmamaindex
Пандасай
Ванна
DB-GPT. DB-GPT: расширение возможностей взаимодействия базы данных с частными крупными языковыми моделями. [Paper] [Код]
Retclean. RETCLEAN: Очистка данных на основе поиска с использованием основных моделей и озеров данных. [Paper] [Код]
Обзор крупных языковых моделей. [Бумага]
Опрос о автономных агентах на основе крупных языковых моделей. [Бумага]
Предварительное обучение таблицы: обзор по архитектурам моделей, целям предварительного обучения и нисходящими задачами. [Бумага]
Трансформаторы для табличного представления данных: обзор моделей и приложений. [Бумага]
Обзор рассуждений за таблицы с большими языковыми моделями. [Бумага]
Опрос вопросов на таблице отвечает: последние достижения. [Бумага]
Большие языковые модели (LLMS) на табличных данных - опрос. [Бумага]
Опрос по анализу текста к SQL: концепции, методы и будущие направления. [Бумага]
Имя | Ключевые слова | Артефакт | Бумага |
---|---|---|---|
MBPP | Код | связь | arxiv 21 |
Гуманевал | Код | связь | arxiv 21 |
Dr.spider | Nl2sql, надежность | связь | ICLR 23 |
Wikible -questions | Таблица QA | связь | ACL 15 |
Wikisql | Таблица QA, NL2SQL | связь | arxiv 17 |
TabFact | Проверка фактов таблицы | связь | ICLR 20 |
Hybirdqa | Таблица QA | связь | EMNLP 20 |
Фетака | Проверка фактов таблицы | связь | TACL 22 |
Робот | Таблица QA | связь | ACL 23 |
Анамета | Таблицы метаданных | связь | ACL 23 |
GPT4Table | Таблица QA, таблица к тексту | связь | WSDM 24 |
Тотто | Таблица к тексту | связь | EMNLP 20 |
Электронная таблица | Манипуляция с таблицей | связь | Neurips 24 |
ПТИЦА | Nl2sql | связь | Neurips 23 |
Паук | Nl2sql | связь | EMNLP 18 |
Dr.spider | Nl2sql | связь | ICLR 23 |
Sciencebenchmark | Nl2sql | связь | VLDB 24 |
DS-1000 | Анализ данных | связь | ICML 23 |
Инфиагент-дюйм | Анализ данных | связь | ICML 24 |
TableBank | Обнаружение таблицы | связь | Lerc 20 |
Pubtabnet | Извлечение таблицы | связь | ECCV 20 |
Comtqa | Визуальная таблица QA, обнаружение таблицы, извлечение таблицы | связь | arxiv 24 |
Имя | Ключевые слова | Артефакт | Бумага |
---|---|---|---|
Таблица | Настройка инструкции таблицы | связь | Arxiv 23 |
Wdc | Веб -таблица | связь | Www 16 |
Gittables | GitHub CSVS | связь | Сигмод 23 |
Дрэк | Таблица к тексту | связь | NAACL 21 |
MMTAB | Понимание мультимодального таблицы | связь | ACL 24 |
Схемапиль | Схемы базы данных | связь | Сигмод 24 |