该存储库包含有关大型语言模型推理的论文和资源的集合。
欲了解更多详细信息,请参阅大型语言模型中的推理:调查
请随时让我知道丢失的文件(问题或请求请求)。
贡献者:黄杰@UIUC
感谢 Kevin Chen-Chuan Chang @UIUC、Jason Wei @Google Brain、Denny Zhou @Google Brain 富有洞察力的讨论和建议。
黄杰、张震川
杰森·魏、Yi Tay、Rishi Bommasani、Colin Raffel、Barret Zoph、Sebastian Borgeaud、Dani Yogatama、Maarten Bosma、Denny Zhou、Donald Metzler、Ed H. Chi、Tatsunori Hashimoto、Oriol Vinyals、Percy Liang、Jeff Dean、William Fedus
大卫·多汉、徐文妮、艾托·卢科维奇、雅各布·奥斯汀、大卫·比伯、拉斐尔·贡蒂霍·洛佩斯、吴玉怀、亨利克·米查勒夫斯基、Rif A. Saurous、Jascha Sohl-dickstein、凯文·墨菲、查尔斯·萨顿
姚付、郝鹏、图沙尔·射击
乔硕飞、欧一欣、张宁宇、陈翔、姚云智、邓淑敏、谭传奇、黄飞、陈华军
潘璐、邱亮、于文浩、Sean Welleck、张凯伟
董庆秀、李雷、戴大麦、郑策、吴志勇、常宝宝、孙旭、徐晶晶、李雷、隋志芳
杨宗林、杜新亚、毛锐、倪金杰、Erik Cambria
于飞、张宏波、王本友
我们主要关注适用于在 GPT-3 (175B) 等大型语言模型中改进或引发“推理”的技术
这种范式的论文差异很大,通常基于在特定数据集上训练的小型模型。我们在这里列出几篇论文供参考(即列表并不完整)。请参阅我们的调查以进行一些讨论。
纳兹宁·法特玛·拉加尼、布莱恩·麦凯恩、蔡明·熊、理查德·索彻
阿隆·塔尔莫、奥伊温德·塔菲尤德、彼得·克拉克、约夫·戈德堡、乔纳森·贝兰特
丹·亨德里克斯、科林·伯恩斯、索拉夫·卡达瓦斯、阿库尔·阿罗拉、史蒂文·巴沙特、埃里克·唐、道恩·宋、雅各布·斯坦哈特
麦克斯韦·奈伊、安德斯·约翰·安德烈森、盖伊·古尔-阿里、亨里克·米查勒夫斯基、雅各布·奥斯汀、大卫·比伯、大卫·多汉、艾托·卢科维奇、马丁·博斯马、大卫·栾、查尔斯·萨顿、奥古斯都·奥德纳
苏米亚·桑亚尔、哈曼·辛格、向仁
卫杰森、王学智、Dale Schuurmans、Maarten Bosma、Brian Ichter、Fei Xia、Ed Chi、Quoc Le、Denny Zhou
王博士、邓翔、孙焕
小岛武、顾世翔、马歇尔·里德、松尾裕、岩泽佑介
本·普莱斯托斯基、保罗·锡伯杜、诺亚·古德曼
Freda Shi、Mirac Suzgun、Markus Freitag、Xuezhi Wang、Suraj Srivats、Soroush Vosoughi、Hyung Won Chung、Yi Tay、Sebastian Ruder、Denny Zhou、Dipanjan Das、Jason Wei
陈文虎
Aman Madaan、周书彦、Uri Alon、杨一鸣、Graham Neubig
Luyu Gau*、Aman Madaan*、Shuyan Zhou*、Uri Alon、Pengfei Liu、Yiming Yang、Jamie Callan、Graham Neubig
陈文虎、马学光、王欣怡、William W. Cohen
何航峰、张宏明、丹·罗斯
卡尔·科布、维尼特·科萨拉朱、穆罕默德·巴伐利亚、马克·陈、全希宇、卢卡斯·凯撒、马蒂亚斯·普拉珀特、杰里·特沃雷克、雅各布·希尔顿、中野礼一郎、克里斯托弗·黑塞、约翰·舒尔曼
王学智、Jason Wei、Dale Schuurmans、Quoc Le、Ed Chi、Sharan Narang、Aakanksha Chowdhery、Denny Zhou
李逸飞、林泽琪、张世卓、付强、陈蓓、楼建光、陈伟柱
付耀、彭浩、Ashish Sabharwal、Peter Clark、Tushar Khot
张卓胜、张阿斯顿、穆里、亚历克斯·斯莫拉
海蒂·周、阿扎德·诺瓦、雨果·拉罗谢尔、亚伦·考维尔、Behnam Neyshabur、哈妮·塞吉
翁宜轩、朱敏君、何世柱、刘康、赵军
周丹尼、纳撒内尔·沙利、侯乐、贾森·魏、内森·斯凯尔斯、王学智、戴尔·舒曼斯、克莱尔·崔、奥利维尔·布斯克特、Quoc Le、Ed Chi
Andrew Drozdov、Nathanael Schärli、Ekin Akyürek、Nathan Scales、Xinying Song、Xinyun Chen、Olivier Bousquet、Denny Zhou
图沙尔·科特、哈什·特里维迪、马修·芬利森、姚夫、凯尔·理查德森、彼得·克拉克、阿什什·萨巴瓦尔
Ofir Press、Muru 张、Sewon Min、Ludwig Schmidt、Noah A. Smith、Mike Lewis
Dheeru Dua、Shivanshu Gupta、萨米尔·辛格、马特·加德纳
叶云虎、惠斌源、杨敏、李斌华、黄飞、李永斌
黄文龙、彼得·阿贝尔、迪帕克·帕塔克、伊戈尔·莫达奇
安东尼娅·克雷斯韦尔、穆雷·沙纳汉、伊琳娜·希金斯
Jaehun Jung、秦连辉、Sean Welleck、Faeze Brahman、Chandra Bhagavatula、Ronan Le Bras、Yejin Choi
安东尼娅·克雷斯韦尔,穆雷·沙纳汉
潘璐、Swaroop Mishra、托尼·夏、梁秋、张凯伟、朱松春、Oyvind Tafjord、Peter Clark、Ashwin Kalyan
李世阳、陈建树、沉业龙、陈志宇、张新录、李泽坤、王宏、钱静、彭宝林、毛毅、陈文虎、严西峰
库马尔·施里达尔、亚历山德罗·斯托尔福、Mrinmaya Sachan
露西·夏洛特·玛格斯特、乔纳森·马林森、雅库布·阿达梅克、埃里克·马尔米、阿利亚克塞·塞维林
Seyed Mehran Kazemi、Najoung Kim、Deepti Bhatia、徐鑫、Deepak Ramachandran
郝世博、谷一、马浩迪、洪佳华、王震、王喆、胡志婷
皮新宇、刘谦、陈蓓、Morteza Ziyadi、林泽琪、付强、高岩、楼建光、陈伟柱
艾托·莱科维奇、安德斯·安德烈森、大卫·多汉、伊桑·戴尔、亨利克·米查勒夫斯基、维奈·拉马塞什、安布罗斯·斯隆、杰姆·阿尼尔、伊曼诺尔·施拉格、西奥·古特曼-索罗、吴玉怀、Behnam Neyshabur、Guy Gur-Ari、Vedant Misra
Cem Anil、吴玉怀、Anders Andreassen、Aitor Lewkowycz、Vedant Misra、Vinay Ramasesh、Ambrose Slone、Guy Gur-Ari、Ethan Dyer、Behnam Neyshabur
Hyung Won Chung、Le Hou、Shayne Longpre、Barret Zoph、Yi Tay、William Fedus、Yunxuan Li、Xuezhi Wang、Mostafa Dehghani、Siddhartha Brahma、Albert Webson、Shishan Shane Gu、Zhuyun Dai、Mirac Suzgun、Xinyun Chen、Aakanksha Chowdhery、亚历克斯·卡斯特罗-罗斯、玛丽·佩拉特、凯文·罗宾逊、达莎·瓦尔特、沙兰·纳朗、高拉夫Mishra、Adams Yu、Vincent Zhao、Yanping Huang、Andrew Dai、Hongkun Yu、Slav Petrov、Ed H. Chi、Jeff Dean、Jacob Devlin、Adam Roberts、Denny Zhou、Quoc V. Le、Jason Wei
罗斯·泰勒、马辛·卡达斯、吉列姆·库库鲁尔、托马斯·夏洛姆、安东尼·哈茨霍恩、埃尔维斯·萨拉维亚、安德鲁·保尔顿、维克托·科尔克兹、罗伯特·斯托伊尼奇
于平、王天禄、Olga Golovneva、Badr Alkhamissy、Gargi Ghosh、Mona Diab、Asli Celikylmaz
Eric Zelikman、吴玉怀、Jesse Mu、Noah D. Goodman
帕特里克·哈鲁普佐克、马修·鲍尔斯、亚当·陶曼·卡莱
黄嘉欣、顾世祥、侯乐、吴跃欣、王学智、于洪坤、韩家伟
阿基尔·帕特尔、萨特维克·巴塔米什拉、纳文·戈亚尔
亚萨曼·拉泽吉、罗伯特·洛根四世、马特·加德纳、萨梅尔·辛格
黄杰、邵汉印、张震川
Karthik Valmeekam、阿尔贝托·奥尔莫、Sarath Sreedharan、Subbarao Kambhampati
Cem Anil、吴玉怀、Anders Andreassen、Aitor Lewkowycz、Vedant Misra、Vinay Ramasesh、Ambrose Slone、Guy Gur-Ari、Ethan Dyer、Behnam Neyshabur
Ishita Dasgupta、Andrew K. Lampinen、Stephanie CY Chan、Antonia Creswell、Dharshan Kumaran、James L. McClelland、Felix Hill
韩思萌、海莉·修尔科普夫、赵一伦、齐震霆、马丁·里德尔、卢克·本森、孙露西、叶卡捷琳娜·祖波娃、乔玉杰、马修·伯特尔、彭大卫、乔纳森·范、刘亦欣、布莱恩·王、马尔科姆·赛勒、倪安松、南林勇, Jungo Kasai, 于涛, 张锐, Shafiq Joty, Alexander R. Fabbri, Wojciech Kryscinski、Xi Victoria Lin、蔡明熊、Dragomir Radev
阿布海尔·萨帕罗夫 呵呵
Mirac Suzgun、Nathan Scales、Nathanael Schärli、Sebastian Gehrmann、Yi Tay、Hyung Won Chung、Aakanksha Chowdhery、Quoc V. Le、Ed H. Chi、Denny Zhou、Jason Wei
劳拉·路易斯 / 阿克比尔·汗 / 斯特拉·比德曼 / 萨拉·胡克 / 蒂姆·罗克塔舍尔 / 爱德华·格雷芬斯泰特
奥尔加·戈洛夫涅娃 / 陈莫雅 / 斯宾塞·波夫 / 马丁·科雷多 / 卢克·泽特尔莫耶 / 玛丽亚姆·法泽尔-扎兰迪 / 阿斯利·塞利基尔马兹
王博士、Sewon Min、邓翔、沈家明、吴尤、Luke Zettlemoyer、孙欢
如果您发现此存储库有用,请引用我们的调查:
@article{huang2022towards,
title={Towards Reasoning in Large Language Models: A Survey},
author={Huang, Jie and Chang, Kevin Chen-Chuan},
journal={arXiv preprint arXiv:2212.10403},
year={2022}
}