이 저장소에는 대규모 언어 모델의 추론 에 관한 논문 및 리소스 모음이 포함되어 있습니다.
자세한 내용은 대규모 언어 모델의 추론을 향하여: 설문조사를 참조하세요.
누락된 서류(발행 또는 풀 요청)를 알려 주시기 바랍니다.
기여자: Jie Huang @UIUC
통찰력 있는 토론과 제안을 주신 Kevin Chen-Chuan Chang @UIUC, Jason Wei @Google Brain, Denny Zhou @Google Brain에게 감사드립니다.
지에 황, 케빈 첸추안 장
Jason Wei, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama, Maarten Bosma, Denny Zhou, Donald Metzler, Ed H. Chi, Tatsunori Hashimoto, Oriol Vinyals, Percy Liang, Jeff Dean, William Fedus
David Dohan, Winnie Xu, Aitor Lewkowycz, Jacob Austin, David Bieber, Raphael Gontijo Lopes, Yuhuai Wu, Henryk Michalewski, Rif A. Saurous, Jascha Sohl-dickstein, Kevin Murphy, Charles Sutton
야오푸, 하오펭, 투샤르 샷
Shuofei Qiao, Yixin Ou, Ningyu Zhang, Xiang Chen, Yunzhi Yao, Shumin Deng, Chuanqi Tan, Fei Huang, Huajun Chen
Pan Lu, Liang Qiu, Wenhao Yu, Sean Welleck, 카이웨이 창
Qingxiu Dong, Lei Li, Damai Dai, Ce Zheng, Zhiyong Wu, Baobao Chang, Xu Sun, Jingjing Xu, Lei Li, Zhifang Sui
양 종린(Zonglin Yang), 신야 두(Xinya Du), 루이 마오(Rui Mao), 진지에 니(Jinjie Ni), 에릭 캠브리아(Erik Cambria)
페이 유, 홍보 장, 벤유 왕
우리는 주로 GPT-3(175B)와 같은 대규모 언어 모델에서 "추론"을 개선하거나 도출하는 데 적용할 수 있는 기술에 중점을 둡니다.
이 패러다임의 논문은 매우 다양하며 일반적으로 특정 데이터 세트에 대해 훈련된 소규모 모델을 기반으로 합니다. 여기에는 참고용으로 여러 논문이 나열되어 있습니다(즉, 목록이 완전하지 않습니다). 일부 논의는 설문 조사를 참조하십시오.
나즈닌 파테마 라자니, 브라이언 맥캔, 카이밍 시옹, 리처드 소커
알론 탈모르, 오이빈드 타피요르드, 피터 클라크, 요아브 골드버그, 조나단 베란트
댄 헨드릭스, 콜린 번스, 사우라브 카다바스, 아쿨 아로라, 스티븐 바사르트, 에릭 탕, 던 송, 제이콥 스타인하트
맥스웰 나이, 안데르스 요한 안드레아센, 가이 구르아리, 헨리크 미할레프스키, 제이콥 오스틴, 데이비드 비버, 데이비드 도한, 아이토르 루코비치, 마르텐 보스마, 데이비드 루안, 찰스 서튼, 아우구스투스 오데나
수미야 산얄, 하만 싱, 샹 렌
Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed Chi, Quoc Le, Denny Zhou
왕보시(Boshi Wang), 샹덩(Xiang Deng), 환순(Huan Sun)
코지마 타케시, 구 시샹 셰인, 마첼 레이드, 마츠오 유타카, 이와사와 유스케
벤 프리스타스키, 폴 티보도, 노아 굿맨
Freda Shi, Mirac Suzgun, Markus Freitag, Xuezhi Wang, Suraj Srivats, Soroush Vosoughi, 정형원, Yi Tay, Sebastian Ruder, Denny Zhou, Dipanjan Das, Jason Wei
첸 원후
아만 마단, 슈얀 저우, 유리 알론, 양이밍, 그레이엄 뉴빅
Luyu Gao*, Aman Madaan*, Shuyan Zhou*, Uri Alon, Pengfei Liu, Yiming Yang, Jamie Callan, Graham Neubig
Wenhu Chen, Xueguang Ma, Xinyi Wang, 윌리엄 W. 코헨
허항펑, 장홍밍, 댄 로스
칼 코베, 비닛 코사라주, 모하마드 바바리안, 마크 첸, 전희우, 루카스 카이저, 마티아스 플라퍼트, 제리 투렉, 제이콥 힐튼, 나카노 레이이치로, 크리스토퍼 헤세, 존 슐만
Xuezhi Wang, Jason Wei, Dale Schuurmans, Quoc Le, Ed Chi, Sharan Narang, Aakanksha Chowdhery, Denny Zhou
Yifei Li, Zeqi Lin, Shizhuo Zhang, Qiang Fu, Bei Chen, Jian-Guang Lou, Weizhu Chen
야오 푸, 하오 펭, 아시쉬 사바왈, 피터 클라크, 투샤르 코트
Zhuosheng Zhang, Aston Zhang, Mu Li, 알렉스 스몰라
해티 저우, 아자데 노바, 휴고 라로셸, 아론 쿠르빌, 베남 네이샤부르, 하니 세드기
Yixuan Weng, Minjun Zhu, Shizhu He, Kang Liu, Jun Zhao
Denny Zhou, Nathanael Schärli, Le Hou, Jason Wei, Nathan Scales, Xuezhi Wang, Dale Schuurmans, Claire Cui, Olivier Bousquet, Quoc Le, Ed Chi
Andrew Drozdov, Nathanael Schärli, Ekin Akyürek, Nathan Scales, Xinying Song, Xinyun Chen, Olivier Bousquet, Denny Zhou
투샤르 코트, 하쉬 트리베디, 매튜 핀레이슨, 야오 푸, 카일 리차드슨, 피터 클라크, 아시쉬 사바왈
Ofir Press, Muru Zhang, Sewon Min, Ludwig Schmidt, Noah A. Smith, Mike Lewis
데히루 두아, 시반슈 굽타, 사미어 싱, 맷 가드너
Yunhu Ye, Binyuan Hui, Min Yang, Binhua Li, Fei Huang, Yongbin Li
황원롱, 피터 아빌, 디팍 파탁, 이고르 모르다치
안토니아 크레스웰, 머레이 샤나한, 이리나 히긴스
정재훈, 진리안휘, 션 웰렉, 페이즈 브라만, 찬드라 바가바툴라, 로난 르 브라스, 최예진
안토니아 크레스웰, 머레이 샤나한
Pan Lu, Swaroop Mishra, Tony Xia, Liang Qiu, Kai-Wei Chang, Song-Chun Zhu, Oyvind Tafjord, Peter Clark, Ashwin Kalyan
Shiyang Li, Jianshu Chen, Yelong Shen, Zhiyu Chen, Xinlu Zhang, Zekun Li, Hong Wang, Jing Qian, Baolin Peng, Yi Mao, Wenhu Chen, Xifeng Yan
쿠마르 슈리다르, 알레산드로 스톨포, 므린마야 사찬
루시 샬롯 마지스터, 조나단 말린슨, 야쿠브 아다멕, 에릭 말미, 알리악세이 세베린
Seyed Mehran Kazemi, 김나정, Deepti Bhatia, Xin Xu, Deepak Ramachandran
Shibo Hao, Yi Gu, Haodi Ma, Joshua Jiahua Hong, Zhen Wang, Daisy Zhe Wang, Zhiting Hu
Xinyu Pi, Qian Liu, Bei Chen, Morteza Ziyadi, Zeqi Lin, Qiang Fu, Yan Gao, Jian-Guang Lou, Weizhu Chen
아이토르 루코비치, 안데르스 안드레아센, 데이비드 도한, 에단 다이어, 헨리크 미할레프스키, 비나이 라마세시, 앰브로스 슬론, 셈 아닐, 이마놀 슐라그, 테오 구트만-솔로, 유화이 우, 베남 네이샤부르, 가이 구르아리, 베단트 미스라
셈 아닐, 유화이 우, 안데르스 안드레아센, 아이토르 루코비치, 베단트 미스라, 비나이 라마세시, 암브로스 슬론, 가이 구르아리, 에단 다이어, 베남 네이샤부르
정형원, Le Hou, Shayne Longpre, Barret Zoph, Yi Tay, William Fedus, Yunxuan Li, Xuezhi Wang, Mostafa Dehghani, Siddhartha Brahma, Albert Webson, Shixiang Shane Gu, Zhuyun Dai, Mirac Suzgun, Xinyun Chen, Aakanksha Chowdhery, 알렉스 카스트로 로스, 마리 펠라, 케빈 로빈슨, 다샤 발터, 샤란 나랑, Gaurav Mishra, Adams Yu, Vincent Zhao, Yanping Huang, Andrew Dai, Hongkun Yu, Slav Petrov, Ed H. Chi, Jeff Dean, Jacob Devlin, Adam Roberts, Denny Zhou, Quoc V. Le, Jason Wei
로스 테일러, 마르신 카다스, 길렘 쿠쿠룰, 토마스 시알롬, 앤서니 하트쇼른, 엘비스 사라비아, 앤드류 풀턴, 빅토르 케르케즈, 로버트 스토닉
핑 유, 티안루 왕, 올가 골로브네바, 바드르 알카미시, 가르기 고쉬, 모나 디아브, 아슬리 셀리킬마즈
에릭 젤리크만, 우 위화이, 제시 무, 노아 D. 굿맨
패트릭 할럽조크, 매튜 바워스, 아담 타우만 칼라이
Jiaxin Huang, Shixiang Shane Gu, Le Hou, Yuexin Wu, Xuezhi Wang, Hongkun Yu, Jiawei Han
아킬 파텔, 사트윅 바타미쉬라, 나빈 고얄
야사만 라제기, 로버트 L. 로건 4세, 매트 가드너, 사미어 싱
Jie Huang, Hanyin Shao, Kevin Chen-Chuan Chang
카르틱 발미캄, 알베르토 올모, 사라스 스리드하란, 수바라오 캄밤파티
셈 아닐, 유화이 우, 안데르스 안드레아센, 아이토르 루코비치, 베단트 미스라, 비나이 라마세시, 암브로스 슬론, 가이 구르아리, 에단 다이어, 베남 네이샤부르
Ishita Dasgupta, Andrew K. Lampinen, Stephanie CY Chan, Antonia Creswell, Dharshan Kumaran, James L. McClelland, 펠릭스 힐
Simeng Han, Hailey Schoelkopf, Yilun Zhao, Zhenting Qi, Martin Riddell, Luke Benson, Lucy Sun, Ekaterina Zubova, Yujie Qiao, Matthew Burtell, David Peng, Jonathan Fan, Yixin Liu, Brian Wong, Malcolm Sailor, Ansong Ni, Linyong Nan , 카사이 준고(Jungo Kasai), 타오 유(Tao Yu), 루이 장(Rui Zhang), 샤피크 조티(Shafiq Joty), 알렉산더 R. 파브리(Alexander R. Fabbri), Wojciech Kryscinski, Xi Victoria Lin, Caiming Xiong, Dragomir Radev
아불헤어 사파로프, 헤헤
Mirac Suzgun, Nathan Scales, Nathanael Schärli, Sebastian Gehrmann, Yi Tay, 정형원, Aakanksha Chowdhery, Quoc V. Le, Ed H. Chi, Denny Zhou, Jason Wei
로라 루이스, 악비르 칸, 스텔라 비더만, 사라 후커, 팀 록태셸, 에드워드 그레펜스테트
올가 골로브네바, 모야 첸, 스펜서 포프, 마틴 코레도르, 루크 제틀모이어, 마리암 파젤-자란디, 아슬리 셀리킬마즈
Boshi Wang, 민세원, Xiang Deng, Jiaming Shen, You Wu, Luke Zettlemoyer, Huan Sun
이 저장소가 유용하다고 생각되면 설문조사를 친절하게 인용해 주세요.
@article{huang2022towards,
title={Towards Reasoning in Large Language Models: A Survey},
author={Huang, Jie and Chang, Kevin Chen-Chuan},
journal={arXiv preprint arXiv:2212.10403},
year={2022}
}