該存儲庫包含有關大型語言模型推理的論文和資源的集合。
欲了解更多詳細信息,請參閱大型語言模型中的推理:調查
請隨時讓我知道遺失的文件(問題或請求請求)。
貢獻者:黃傑@UIUC
感謝 Kevin Chen-Chuan Chang @UIUC、Jason Wei @Google Brain、Denny Zhou @Google Brain 富有洞察力的討論和建議。
黃傑、張震川
傑森·魏、Yi Tay、Rishi Bommasani、Colin Raffel、Barret Zoph、Sebastian Borgeaud、Dani Yogatama、Maarten Bosma、Denny Zhou、Donald Metzler、Ed H. Chi、Tatsunori Hashimoto、Oriol Vinyals、Percy Liang、Jeff Dean、Williamcy Liang、Jeff Dean、Williamcy Liang、Jeff Dean、Williamcy Liang、Jeff Dean、Williamcy Liang、Jeff Dean、Williamcy Liang、Jeff Dean、 Fedus
大衛多漢、徐文妮、艾托盧科維奇、雅各奧斯汀、大衛比伯、拉斐爾貢蒂霍洛佩斯、吳玉懷、亨利克米查勒夫斯基、Rif A. Saurous、Jascha Sohl-dickstein、凱文墨菲、查爾斯薩頓
姚付、郝鵬、圖沙爾·射擊
喬碩飛、歐一欣、張寧宇、陳翔、姚雲智、鄧淑敏、譚傳奇、黃飛、陳華軍
潘璐、邱亮、於文浩、Sean Welleck、張凱偉
董慶秀、李雷、戴大麥、鄭策、吳志勇、常寶寶、孫旭、徐晶晶、李雷、隋志芳
楊宗林、杜新亞、毛銳、倪金傑、Erik Cambria
於飛、張宏波、王本友
我們主要關注適用於在 GPT-3 (175B) 等大型語言模型中改進或引發「推理」的技術
這種範式的論文差異很大,通常基於在特定資料集上訓練的小型模型。我們在這裡列出幾篇論文供參考(即列表並不完整)。請參閱我們的調查以進行一些討論。
納茲寧·法特瑪·拉加尼、布萊恩·麥凱恩、蔡明·熊、理查德·索徹
阿隆·塔爾莫、奧伊溫德·塔菲尤德、彼得·克拉克、約夫·戈德堡、喬納森·貝蘭特
丹·亨德里克斯、科林·伯恩斯、索拉夫·卡達瓦斯、阿庫爾·阿羅拉、史蒂文·巴沙特、艾瑞克·唐、道恩·宋、雅各·史丹哈特
麥克斯韋·奈伊、安德斯·約翰·安德烈森、蓋伊·古爾-阿里、亨里克·米查勒夫斯基、雅各布·奧斯汀、大衛·比伯、大衛·多漢、艾托·盧科維奇、馬丁·博斯馬、大衛·欒、查爾斯·薩頓、奧古斯都·奧德納
蘇米亞·桑亞爾、哈曼·辛格、向仁
衛傑森、王學智、Dale Schuurmans、Maarten Bosma、Brian Ichter、Fei Xia、Ed Chi、Quoc Le、Denny Zhou
王博士、鄧翔、孫煥
小島武、顧世翔、馬歇爾·里德、松尾裕、岩澤佑介
本·普萊斯托斯基、保羅·錫伯杜、諾亞·古德曼
Freda Shi、Mirac Suzgun、Markus Freitag、Xuezhi Wang、Suraj Srivats、Soroush Vosoughi、Hyung Won Chung、Yi Tay、Sebastian Ruder、Denny Zhou、Dipanjan Das、Jason Wei
陳文虎
Aman Madaan、週書彥、Uri Alon、楊一鳴、Graham Neubig
Luyu Gau*、Aman Madaan*、Shuyan Zhou*、Uri Alon、Pengfei Liu、Yiming Yang、Jamie Callan、Graham Neubig
陳文虎、馬學光、王欣怡、William W. Cohen
何航峰、張宏明、丹·羅斯
卡爾·科布、維尼特·科薩拉朱、穆罕默德·巴伐利亞、馬克·陳、全希宇、盧卡斯·凱撒、馬蒂亞斯·普拉珀特、傑裡·特沃雷克、雅各布希爾頓、中野禮一郎、克里斯多福黑塞、約翰舒爾曼
王學智、Jason Wei、Dale Schuurmans、Quoc Le、Ed Chi、Sharan Narang、Aakanksha Chowdhery、Denny Zhou
李逸飛、林澤琪、張世卓、付強、陳蓓、建築光、陳偉柱
付耀、彭浩、Ashish Sabharwal、Peter Clark、Tushar Khot
張卓勝、張阿斯頓、穆里、亞歷克斯·斯莫拉
海蒂週、阿扎德諾瓦、雨果拉羅謝爾、亞倫考維爾、Behnam Neyshabur、哈妮塞吉
翁宜軒、朱敏君、何世柱、劉康、趙軍
週丹尼、納撒內爾·沙利、侯樂、賈森·魏、內森·斯凱爾斯、王學智、戴爾·舒曼斯、克萊爾·崔、奧利維爾·布斯克特、Quoc Le 、Ed Chi
Andrew Drozdov、Nathanael Schärli、Ekin Akyürek、Nathan Scales、Xinying Song、Xinyun Chen、Olivier Bousquet、Denny Zhou
圖沙爾·科特、哈什·特里維迪、馬修·芬利森、姚夫、凱爾·理查森、彼得·克拉克、阿什什·薩巴瓦爾
Ofir Press、Muru 張、Sewon Min、Ludwig Schmidt、Noah A. Smith、Mike Lewis
Dheeru Dua、Shivanshu Gupta、薩米爾辛格、馬特加德納
葉雲虎、惠斌源、楊敏、李斌華、黃飛、李永斌
黃文龍、彼得·阿貝爾、迪帕克·帕塔克、伊戈爾·莫達奇
安東妮亞·克雷斯韋爾、穆雷·沙納漢、伊琳娜·希金斯
Jaehun Jung、秦連輝、Sean Welleck、Faeze Brahman、Chandra Bhagavatula、Ronan Le Bras、Yejin Choi
安東妮亞·克雷斯韋爾,穆雷·沙納漢
潘璐、Swaroop Mishra、東尼夏、梁秋、張凱偉、朱松春、Oyvind Tafjord、Peter Clark、Ashwin Kalyan
李世陽、陳建樹、沈業龍、陳志宇、張新錄、李澤坤、王宏、錢靜、彭寶林、毛毅、陳文虎、嚴西峰
庫馬爾·施裡達爾、亞歷山德羅·斯托爾福、Mrinmaya Sachan
露西·夏洛特·瑪格斯特、喬納森·馬林森、雅庫布·阿達梅克、艾瑞克·馬爾米、阿利亞克塞·塞維林
Seyed Mehran Kazemi、Najoung Kim、Deepti Bhatia、徐鑫、Deepak Ramachandran
郝世博、谷一、馬浩迪、洪佳華、王震、王喆、胡志婷
皮新宇、劉謙、陳蓓、Morteza Ziyadi、林澤琪、付強、高岩、建築光、陳偉柱
艾托·萊科維奇、安德斯·安德烈森、大衛·多漢、伊森·戴爾、亨利克·米查勒夫斯基、維奈·拉馬塞什、安布羅斯·斯隆、傑姆·阿尼爾、伊曼諾爾·施拉格、西奧·古特曼-索羅、吳玉懷、Behnam Neyshabur、Guy Gur-Ari、Vedant Misra
Cem Anil、吳玉懷、Anders Andreassen、Aitor Lewkowycz、Vedant Misra、Vinay Ramasesh、Ambrose Slone、Guy Gur-Ari、Ethan Dyer、Behnam Neyshabur
Hyung Won Chung、Le Hou、Shayne Longpre、Barret Zoph、Yi Tay、William Fedus、Yunxuan Li、Xuezhi Wang、Mostafa Dehghani、Siddhartha Brahma、Albert Webson、Shishan Shane Gu、Zhuyun Dai、Mirac Suzgun、Xininc Chady、Aakk亞歷克斯·卡斯特羅-羅斯、瑪麗·佩拉特、凱文·羅賓遜、達莎·瓦爾特、夏蘭·納朗、高拉夫·米甚拉、亞當斯·於、文森特·趙、黃彥平、安德魯·戴、於洪坤、斯拉夫·彼得羅夫、Ed H. Chi、傑夫·迪恩、雅各布·德夫林、亞當羅伯茨、Denny Zhou、Quoc V. Le、Jason Wei
羅斯泰勒、馬辛卡達斯、吉列姆庫庫魯爾、湯瑪斯夏洛姆、安東尼哈茲霍恩、艾維斯薩拉維亞、安德魯保爾頓、維克托·科爾克茲、羅伯特·斯托伊尼奇
於平、王天祿、Olga Golovneva、Badr Alkhamissy、Gargi Ghosh、Mona Diab、Asli Celikylmaz
Eric Zelikman、吳玉懷、Jesse Mu、Noah D. Goodman
哈魯普佐克、馬修鮑爾斯、亞當陶曼卡萊
黃嘉欣、顧世祥、侯樂、吳躍欣、王學智、於洪坤、韓家偉
阿基爾·帕特爾、薩特維克·巴塔米甚拉、納文·戈亞爾
亞薩曼·拉澤吉、羅伯特·洛根四世、馬特·加德納、薩梅爾·辛格
黃傑、邵漢印、張震川
Karthik Valmeekam、阿爾貝托·奧爾莫、Sarath Sreedharan、Subbarao Kambhampati
Cem Anil、吳玉懷、Anders Andreassen、Aitor Lewkowycz、Vedant Misra、Vinay Ramasesh、Ambrose Slone、Guy Gur-Ari、Ethan Dyer、Behnam Neyshabur
Ishita Dasgupta、Andrew K. Lampinen、Stephanie CY Chan、Antonia Creswell、Dharshan Kumaran、James L. McClelland、Felix Hill
韓思萌、海莉·修爾科普夫、趙一倫、齊震霆、馬丁·里德爾、盧克·本森、孫露西、葉卡捷琳娜·祖波娃、喬玉傑、馬修·伯特爾、彭大衛、喬納森·範、劉亦欣、布萊恩·王、馬爾科姆·賽勒、倪安松、南林勇, Jungo Kasai, 於濤, 張銳, Shafiq Joty, Alexander R. Fabbri, Wojciech Kryscinski, Xi Victoria Lin, Caiming Xiong , Dragomir Radev
阿布海爾‧薩帕羅夫 呵呵
Mirac Suzgun、Nathan Scales、Nathanael Schärli、Sebastian Gehrmann、Yi Tay、Hyung Won Chung、Aakanksha Chowdhery、Quoc V. Le、Ed H. Chi、Denny Zhou、Jason Wei
勞拉路易斯 / 阿克比爾汗 / 史黛拉比德曼 / 莎拉胡克 / 提姆羅克塔舍爾 / 愛德華格雷芬斯泰特
奧爾加·戈洛夫涅娃/ 陳莫雅/ 斯賓塞·波夫/ 馬丁·科雷多/ 盧克·澤特爾莫耶/ 瑪麗亞姆·法澤爾-扎蘭迪/ 阿斯利·塞利克爾馬茲
王博士、Sewon Min、鄧翔、沈家明、吳尤、Luke Zettlemoyer、孫歡
如果您發現此儲存庫有用,請引用我們的調查:
@article{huang2022towards,
title={Towards Reasoning in Large Language Models: A Survey},
author={Huang, Jie and Chang, Kevin Chen-Chuan},
journal={arXiv preprint arXiv:2212.10403},
year={2022}
}