พื้นที่เก็บข้อมูลนี้เรียกว่า UR2-LLM ประกอบด้วยชุดทรัพยากรและเอกสารเกี่ยวกับ ความไม่แน่นอน ความน่าเชื่อถือ และ ความคงทน ใน โมเดลภาษาขนาดใหญ่
" โมเดลภาษาขนาดใหญ่มีความน่าเชื่อถือที่จำกัด ความเข้าใจที่จำกัด ช่วงที่จำกัด และด้วยเหตุนี้จึงต้องมีการควบคุมดูแลโดยมนุษย์ " - Michael Osborne ศาสตราจารย์ด้าน Machine Learning ในภาควิชาวิศวกรรมศาสตร์ มหาวิทยาลัยออกซ์ฟอร์ด 25 มกราคม 2023
ยินดีต้อนรับสู่การแบ่งปันเอกสาร ความคิด และแนวคิดของคุณในพื้นที่นี้!
GPT เป็นแหล่งเก็บข้อมูลที่ไม่น่าเชื่อถือ
โนเบิล แอคเคอร์สัน
[ลิงค์]
20 กุมภาพันธ์ 2023
โมเดลภาษาขนาดใหญ่ “การใช้ในทางที่ผิด” และอนาคตของ MT
อาร์ล ลอมเมล
[ลิงค์]
20 ธันวาคม 2022
โมเดลภาษาขนาดใหญ่: พื้นฐานและการประยุกต์
มาร์โก ปอดะ
[ลิงค์]
9 กุมภาพันธ์ 2566
วิศวกรรมพร้อมท์: การปรับปรุงการตอบสนองและความน่าเชื่อถือ
ปีเตอร์ ฟอย
[ลิงค์]
19 มี.ค. 2566
ตำราอาหารของ OpenAI เกี่ยวกับเทคนิคในการปรับปรุงความน่าเชื่อถือ
OpenAI
[Github]
18 มี.ค. 2566
GPT/แท็กการสอบเทียบ
เกวน บรานเวน
[ลิงค์]
วิศวกรรมพร้อมท์
ลิเลียน เวง
[ลิงค์]
ตัวแทนอิสระที่ขับเคลื่อนด้วย LLM
ลิเลียน เวง
[ลิงค์]
ความน่าเชื่อถือในการเรียนรู้พร้อมท์
[ลิงค์]
การสร้างแอปพลิเคชัน LLM สำหรับการผลิต
ชิป ฮวน
[ลิงค์]
11 เมษายน 2023
รายงานทางเทคนิค GPT-4
OpenAI
arXiv 2023. [กระดาษ][ตำราอาหาร]
16 มี.ค. 2566
การ์ดระบบ GPT-4
OpenAI
arXiv 2023 [กระดาษ] [Github]
15 มี.ค. 2566
การประมาณค่าความไม่แน่นอนสำหรับการประมวลผลภาษาธรรมชาติ
อดัม ฟิช, โรบิน เจีย, ทัล ชูสเตอร์
การรวบรวม 2022 [เว็บไซต์]
เครือข่าย LLM ที่กว้างและลึกยิ่งขึ้นเป็นผู้ประเมิน LLM ที่ยุติธรรมยิ่งขึ้น
ซิงหัว จาง, โบเหวิน หยู, ไห่หยาง หยู, หยางหยู่ เลเวล, ติงเหวิน หลิว, เฟย ฮวง, หงป๋อ ซู, หลี่ยงปิน
arXiv 2023 [กระดาษ] [Github]
3 ส.ค. 2566
แบบสำรวจการประเมินแบบจำลองภาษาขนาดใหญ่
หยูเผิง ชาง, ซู หวาง, หวัง จินตง, หยวน วู, ไคจี้ จู, ห่าว เฉิน, ลินยี่ หยาง, เสี่ยวหยวน ยี่, คุนเซียง หวัง, ยี่ตง หวัง, เหว่ย เย่, เยว่ จาง, ยี่ ชาง, ฟิลิป เอส. หยู, เฉียง หยาง, ซิง เสีย
Arxiv 2023 [กระดาษ] [Github]
6 ก.ค. 2566
DecodingTrust: การประเมินความน่าเชื่อถือที่ครอบคลุมในโมเดล GPT
Boxin Wang, Weixin Chen, Hengzhi Pei, Chulin Xie, Mintong Kang, Chenhui Zhang, Chejian Xu, Zidi Xiong, Ritik Dutta, Rylan Schaeffer, Sang T. Truong, Simran Arora, Mantas Mazeika, Dan Hendrycks, Zinan Lin, Yu Cheng, ซานมิ โคเยโจ, Dawn Song, โบ ลี่
Arxiv, 2023. [กระดาษ] [Github] [เว็บไซต์]
20 มิ.ย. 2566
ใน ChatGPT เราเชื่อถือไหม? การวัดและการกำหนดลักษณะความน่าเชื่อถือของ ChatGPT
ซินเยว่ เซิน, เจ๋อหยวน เฉิน, ไมเคิล แบ็คส์, หยาง จาง
arXiv, 2023. [กระดาษ]
18 เมษายน 2566
การควบคุมพลังของ LLM ในทางปฏิบัติ: แบบสำรวจเกี่ยวกับ ChatGPT และอื่นๆ
จิงเฟิง หยาง, หงเย่ จิน, รุ่ยเซียง ถัง, เสี่ยวเทียน ฮั่น, ชี่จาง เฟิง, ห่าหมิง เจียง, ปิงหยิน, เซี่ยหู
arXiv 2023 [กระดาษ] [Github]
27 เมษายน 2023
GPT-3.5 มีความทนทานต่อรุ่นก่อนแค่ไหน การศึกษาที่ครอบคลุมเกี่ยวกับงานการทำความเข้าใจภาษา
ซวนถิง เฉิน, จุนเจี๋ย เย่, คาน ซู, นัว ซู, รุย เจิ้ง, มินหลง เผิง, เจียโจว, เถากุย, ชี่ จาง, ซวนจิง ฮวง
arXiv 2023 [กระดาษ] [Github]
1 มี.ค. 2566
การประเมินแบบองค์รวมของแบบจำลองภาษา
เพอร์ซี เหลียง, ริชิ บอมมาซานี, โทนี่ ลี, ดิมิทริส ซีปราส, ดิลารา ซอยลู, มิชิฮิโระ ยาสุนากะ, เอียน จาง, ดีพัค นารายานัน, ยู่หวย วู, อนันยา คูมาร์, เบนจามิน นิวแมน, บินหาง หยวน, บ็อบบี้ ยาน, ซี จาง, คริสเตียน คอสโกรฟ, คริสโตเฟอร์ ดี. แมนนิ่ง, คริสโตเฟอร์ เร, ไดอาน่า อาคอสต้า-นาวาส, ดรูว์ เอ. ฮัดสัน, เอริก เซลิกแมน, เอซิน เดอร์มุส, ไฟซาล ลัดฮัก, ฟรีดา รง, หงหยู เรน, ฮวาซิ่ว เหยา, จือ หวาง, เคชาฟ ซันทานัม, ลอเรล ออร์, ลูเซีย เจิ้ง, เมิร์ต ยุกเซกโกนุล, มิรัค ซุซกัน, นาธาน คิม, นีล กูฮา, นิลาดรี แชตเตอร์จี, โอมาร์ คัทตับ, ปีเตอร์ เฮนเดอร์สัน, เฉียน ฮวง, ไรอัน ชี , ซัง มิเชล ซี, ชิบานี ซันตูร์การ์, สุริยะ กังกูลี, ทัตสึโนริ ฮาชิโมโตะ, โธมัส ไอการ์ด, จางเทียนยี่, วิศราฟ เชาธารี, วิลเลียม หวัง, ซู่เฉิน หลี่, ยี่ฟาน ไม, หยูหุย จาง, ยูตะ โครีดา
arXiv 2022 [กระดาษ] [เว็บไซต์] [Github] [บล็อก]
16 พ.ย. 2565
แจ้งให้ GPT-3 มีความน่าเชื่อถือ
เฉิงเล่ย ซี, เจ้อ คาน, เจิ้งหยวน หยาง, ซั่วหัง หวาง, เจียนเฟิง หวาง, จอร์แดน บอยด์-กราเบอร์, ลี่จวน หวัง
ICLR 2023 [กระดาษ] [Github]
17 ต.ค. 2565
Plex: สู่ความน่าเชื่อถือโดยใช้ส่วนขยายโมเดลขนาดใหญ่ที่ผ่านการฝึกอบรมมาแล้ว
ดัสติน ทราน, เจเรเมียห์ หลิว, ไมเคิล ดับบลิว. ดูเซนเบอร์รี่, ดู ฟาน, มาร์ค คอลลิเออร์, จี้ เหริน, เคฮัง ฮัน, ซี หวาง, เซลด้า มารีเอต, ฮุ่ยยี่ หู, นีล แบนด์, ทิม จีเจ รัดเนอร์, คาราน ซิงฮาล, แซคารี นาโด, จูสต์ ฟาน อาเมอร์สฟูร์ต, อันเดรียส เคิร์สช์, โรโดลฟี่ เจแนทตัน, นิธัม ไทน์, หงลิน หยวน, เคลลี่ บูคานัน, เควิน เมอร์ฟี่, ดี. สกัลลีย์, ยาริน กัล, ซูบิน กาห์รามานี, แจสเปอร์ สน็อค, บาลาจี ลักษมีนารายานันท์
arXiv 2022. [กระดาษ]
15 ก.ค. 2565
โมเดลภาษา (ส่วนใหญ่) รู้ว่าพวกเขารู้อะไร
เซาราฟ คาดาวาธ, ทอม คอนเนอร์ลี, อแมนดา แอสเคลล์, ทอม เฮนิแกน, ดอว์น เดรน, อีธาน เปเรซ, นิโคลัส ชิฟเฟอร์, แซค แฮตฟิลด์-ดอดส์, โนวา ดาสซาร์มา, อีไล ทราน-จอห์นสัน, สก็อตต์ จอห์นสตัน, เชียร์ เอล-โชว์ค, แอนดี้ โจนส์, เนลสัน เอลฮาจ, ทริสตัน ฮูม , แอนนา เฉิน, หยุนเทา ไป๋, แซม โบว์แมน, ป้อมสตานิสลาฟ, กังกูลีลึก, แดนนี่ เฮอร์นันเดซ, จอช จาค็อบสัน, แจ็คสัน เคอร์เนียน, ชัวน่า คราเวค, ลีอาน โลวิตต์, คามัล เอ็นดูสส์, แคทเธอรีน โอลส์สัน, แซม ริงเกอร์, ดาริโอ อโมเด, ทอม บราวน์, แจ็ค คลาร์ก, นิโคลัส โจเซฟ, เบน แมนน์, แซม แมคแคนดิช, คริส โอลาห์, จาเร็ด แคปแลน
arXiv 2022. [กระดาษ]
11 ก.ค. 2565
โมเดลภาษาเสริม: แบบสำรวจ
เกรกัวร์ มิอาลอน, โรแบร์โต้ เดสซี่, มาเรีย โลเมลี, คริสโตโฟรอส นัลมปานติส, แรม ปาซูนูรู, โรเบอร์ตา ไรเลอานู, บัปติสต์ โรซิแยร์, ติโม ชิค, เจน ดวิเวดี-ยู, อัสลี เซลิคิลมาซ, เอดูอาร์ เกรฟ, ยานน์ เลอคุน, โธมัส สเชียลอม
arXiv 2023. [กระดาษ]
15 กุมภาพันธ์ 2566
แบบสำรวจตัวชี้วัดการประเมินผลที่ใช้สำหรับระบบ NLG
อนันยา บี. ไซ, อกาช กุมาร์ โมฮันคูมาร์, มิเตช เอ็ม. คาปรา
แบบสำรวจคอมพิวเตอร์ ACM ปี 2022 [กระดาษ]
18 ม.ค. 2565
NL-Augmenter: กรอบงานสำหรับการเพิ่มภาษาธรรมชาติที่ละเอียดอ่อนต่องาน
Kaustubh D. Dhole และคณะ
ACL 2021. [กระดาษ] [Github]
6 ธ.ค. 2564
TextFlint: ชุดเครื่องมือประเมินความแข็งแกร่งหลายภาษาแบบรวมศูนย์สำหรับการประมวลผลภาษาธรรมชาติ
เถากุย และคณะ
arXiv 2021. [กระดาษ][Github]
21 มี.ค. 2564
โรงยิมที่แข็งแกร่ง: การรวมภูมิทัศน์การประเมิน NLP เข้าด้วยกัน
คารัน โกเอล, นัซนีน ราจานี, เจสซี วิก, แซมซั่น ตัน, เจสัน วู, สเตฟาน เจิ้ง, ไคหมิง ซิออง, โมฮิท บันซาล, คริสโตเฟอร์ เร
ACL 2021 [กระดาษ] [Github]
13 ม.ค. 2564
เหนือกว่าความแม่นยำ: การทดสอบพฤติกรรมของโมเดล NLP ด้วย CheckList
มาร์โก ตูลิโอ ริเบโร, ตงซวง วู, คาร์ลอส เกสต์ริน, ซาเมียร์ ซิงห์
ACL 2020 [กระดาษ] [Github]
8 พฤษภาคม 2563
BLoB: การปรับอันดับต่ำแบบเบย์โดยการกระจายกลับสำหรับโมเดลภาษาขนาดใหญ่
อี้ปิน หวัง, ไห่โจว ชิ, ลี่กง ฮั่น, ดิมิทริส เมตาซาส, ห่าว หวาง
arXiv 2024. [กระดาษ]
18 มิ.ย. 2567
การประมาณค่าความไม่แน่นอนและการหาปริมาณสำหรับ LLM: แนวทางกำกับดูแลอย่างง่าย
หลินยู่ หลิว, หยูปัน, เสี่ยวเฉิง หลี่, กวนถิง เฉิน
arXiv 2024. [กระดาษ]
24 เมษายน 2567
การเปลี่ยนความสนใจไปสู่ความเกี่ยวข้อง: ไปสู่การประมาณค่าความไม่แน่นอนของแบบจำลองภาษาขนาดใหญ่
จินห่าว ต้วน, ห่าว เฉิง, ชิชี หวาง, อเล็กซ์ ซาวาลนี, เฉินหนาน หวาง, เหรินจิง ซู, ภาวนา ไคลคูรา, ไคดิ ซู
arXiv 2023. [กระดาษ]
9 ต.ค. 2566
มองก่อนที่คุณจะกระโดด: การศึกษาเชิงสำรวจเกี่ยวกับการวัดความไม่แน่นอนสำหรับโมเดลที่ใช้ภาษาขนาดใหญ่
หยูเหิง หวง, เจียหยาง ซ่ง, จือเจี๋ย หวาง, เซิงหมิง จ้าว, หัวหมิง เฉิน, เฟลิกซ์ เจวี๋ยเฟย-ซู, เล่ยหม่า
arXiv 2023. [กระดาษ]
16 ก.ค. 2566
การหาปริมาณความไม่แน่นอนในการอธิบายภาษาธรรมชาติของแบบจำลองภาษาขนาดใหญ่
ศรี ฮาร์ชา แทนเนรู, ชีรัก อาการ์วาล, ฮิมาบินดุ ลักการาจู
arXiv 2023. [กระดาษ]
6 พ.ย. 2566
การสร้างการถดถอยอัตโนมัติตามแบบแผน: การค้นหาบีมพร้อมการรับประกันความครอบคลุม
นิโคลัส ดอยช์มันน์, มาร์วิน อัลเบิร์ตส์, มาเรีย โรดริเกซ มาร์ติเนซ
arXiv 2023. [กระดาษ]
7 ก.ย. 2566
การหาปริมาณความไม่แน่นอนในคำตอบจากโมเดลภาษาใดๆ และเพิ่มความน่าเชื่อถือ
จิ่วไห่ เฉิน, โจนาส มุลเลอร์
arXiv 2023. [กระดาษ]
30 ส.ค. 2566
ความไม่แน่นอนในการสร้างภาษาธรรมชาติ: จากทฤษฎีสู่การประยุกต์ใช้
ยอริส บาน, นิโค ดาไฮม์, ยูเกเนีย อิเลีย, เดนนิส อุลเมอร์, ฮาอู-ซิง ลี, ราเควล เฟอร์นันเดซ, บาร์บาร่า แพลงค์, ริโก เซนริช, ไครซูลา แซร์วา, วิลเกอร์ อาซิซ
arXiv 2023. [กระดาษ]
28 กรกฎาคม 2023
การสร้างด้วยความมั่นใจ: ปริมาณความไม่แน่นอนสำหรับโมเดลภาษาขนาดใหญ่กล่องดำ
เจิ้น หลิน, ชุบเฮนตู ตรีเวดี, จิเมิง ซุน
arXiv 2023 [กระดาษ] [Github]
30 พฤษภาคม 2566
ความไม่แน่นอนของมนุษย์ในระบบ AI ตามแนวคิด
แคเธอรีน เอ็ม. คอลลินส์, แมทธิว บาร์เกอร์, มาเทโอ เอสปิโนซา ซาร์เลงกา, นาวีน รามาน, อูมัง บัตต์, มาเตจา จัมนิค, อิเลีย ซูโชลุตสกี, เอเดรียน เวลเลอร์, กฤษณมูรธี ดวิโจธรรม
arXiv 2023. [กระดาษ]
22 มี.ค. 2566
การนำทางในพื้นที่สีเทา: การแสดงออกของความมั่นใจมากเกินไปและความไม่แน่นอนในแบบจำลองภาษา
เคทลิน โจว, แดน จูราฟสกี้, ทัตสึโนริ ฮาชิโมโตะ
arXiv 2023. [กระดาษ]
25 กุมภาพันธ์ 2566
DEUP: การทำนายความไม่แน่นอนของ Epistemic โดยตรง
ซาเลม ลาห์ลู, ม็อกช์ เจน, ฮาดี เนคอย, วิคเตอร์ อิออน บูโตอิ, พอล แบร์ติน, จาร์ริด เรคเตอร์-บรูคส์, มักซิม โคราบบอฟ, โยชัว เบนจิโอ
TMLR 2023. [กระดาษ]
3 กุมภาพันธ์ 2566
เรื่องปริมาณความไม่แน่นอนขององค์ประกอบสำหรับการแยกวิเคราะห์กราฟ Seq2seq
Zi Lin, Du Phan, ภาณุพงศ์ พสุพัฒน์, เจเรมีย์ เจ้อ หลิว, จิงโป ชาง
ICLR 2023. [กระดาษ]
1 กุมภาพันธ์ 2566
การอนุมานเชิงประสาทและสัญลักษณ์สำหรับการแยกวิเคราะห์กราฟอัตโนมัติที่แข็งแกร่งผ่านการหาปริมาณความไม่แน่นอนขององค์ประกอบ
จือหลิน, เจเรไมห์หลิว, จิงโปซ่าง
EMNLP 2022. [กระดาษ]
16 มกราคม 2023
การสอนแบบจำลองเพื่อแสดงความไม่แน่นอนในคำพูด
สเตฟานี ลิน, เจค็อบ ฮิลตัน, โอเวน อีแวนส์
TMLR 2022 [กระดาษ] [Github] [TMLR] [สไลด์]
28 พฤษภาคม 2565
ความไม่แน่นอนทางความหมาย: ความแปรปรวนทางภาษาสำหรับการประมาณค่าความไม่แน่นอนในการสร้างภาษาธรรมชาติ
ลอเรนซ์ คูห์น, ยาริน กัล, เซบาสเตียน ฟาร์คูฮาร์
ICLR 2023. [กระดาษ]
19 กุมภาพันธ์ 2565
การเลือกข้อมูลเริ่มเย็นสำหรับการปรับโมเดลภาษาแบบไม่กี่ช็อต: แนวทางการแพร่กระจายความไม่แน่นอนตามพรอมต์
เยว่ หยู, จางหรงซี, หราน ซู, จางเจียหยู่, เจียหมิงเซิน, เฉาจาง
arXiv 2022 [กระดาษ] [Github]
15 ก.ย. 2565
การปรับแต่งโมเดลภาษาอย่างละเอียดผ่านโครงข่ายประสาทเทียมแบบ Epistemic
เอียน ออสแบนด์, เซเยด โมฮัมหมัด อัสการี, เบนจามิน แวน รอย, แนท แม็คอาลีส, จอห์น แอสลานิเดส, เจฟฟรีย์ เออร์วิ่ง
arXiv 2022 [กระดาษ] [Github]
3 พ.ย. 2565
การหาปริมาณความไม่แน่นอนด้วยแบบจำลองภาษาที่ผ่านการฝึกอบรมมาแล้ว: การวิเคราะห์เชิงประจักษ์ขนาดใหญ่
หยูซิน เซียว, พอล ปูเหลียง, อูมัง บัตต์, วิลลี่ ไนส์วังเกอร์, รุสลัน ซาลาคุตดินอฟ, หลุยส์-ฟิลิปป์ มอเรนซี
EMNLP 2022 (ผลการวิจัย) [กระดาษ] [Github]
10 ต.ค. 2565
การประมาณค่าความไม่แน่นอนสำหรับโมเดลรางวัลภาษา
อดัม กลีฟ, เจฟฟรีย์ เออร์วิ่ง
arXiv 2022. [กระดาษ]
14 มี.ค. 2565
การประมาณค่าความไม่แน่นอนและการลดแบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าสำหรับการถดถอยข้อความ
ยูเซีย หวัง, แดเนียล เบ็ค, ทิโมธี บอลด์วิน, คาริน เวอร์สปัวร์
TACL 2022. [กระดาษ]
มิ.ย. 2022
การประมาณค่าความไม่แน่นอนในการทำนายโครงสร้างแบบถดถอยอัตโนมัติ
อันเดรย์ มาลิน, มาร์ก เกลส์
ICLR 2021. [กระดาษ]
18 ก.พ. 2563
การประมาณคุณภาพโดยไม่ได้รับการดูแลสำหรับการแปลด้วยเครื่องประสาท
มารีนา โฟมิเชวา, ชูโอ ซุน, ลิซา ยานคอฟสกายา, เฟรเดริก เบลน, ฟรานซิสโก กุซมาน, มาร์ค ฟิชเชล, นิโคลอส อเลตราส, วิษราฟ เชาธารี, ลูเซีย สเปเซีย
TACL 2020 [กระดาษ] [ชุดข้อมูล]
21 พฤษภาคม 2020
การวิเคราะห์ความไม่แน่นอนในการแปลเครื่องประสาท
ไมล์ ออตต์, ไมเคิล ออลี, เดวิด แกรนเจียร์, มาร์กออเรลิโอ รันซาโต
ICML 2018. [กระดาษ]
2018
การสอบเทียบแบบแบตช์: คิดใหม่เกี่ยวกับการสอบเทียบเพื่อการเรียนรู้ในบริบทและวิศวกรรมที่รวดเร็ว
ฮั่นโจว, ซิงเฉิน ว่าน, เลฟ โปรลีฟ, ไดอาน่า มินคู, จี๋หลิน เฉิน, แคเธอรีน เฮลเลอร์, ซูบราจิต รอย
ICLR 2024. [กระดาษ] 24 ม.ค. 2024
โมเดลภาษาขนาดใหญ่รู้สิ่งที่พวกเขาไม่รู้หรือไม่?
จางเยว่หยิน, ซิ่วชี่ ซุน, ชีเผิง กัว, เจียเหวิน อู๋, ซีเผิง ชิว, ซวนจิง หวง
arXiv 2023 [กระดาษ] 29 พฤษภาคม 2023
เพียงแค่ขอการปรับเทียบ: กลยุทธ์ในการดึงคะแนนความเชื่อมั่นที่ปรับเทียบแล้วจากแบบจำลองภาษาที่ปรับแต่งอย่างละเอียดตามความคิดเห็นของมนุษย์
แคเธอรีน เทียน, เอริค มิทเชลล์, อัลลัน โจว, อาร์คิท ชาร์มา, ราฟาเอล ราไฟลอฟ, ฮวาซิ่ว เหยา, เชลซี ฟินน์, คริสโตเฟอร์ ดี. แมนนิ่ง
arXiv 2023. [กระดาษ]
24 พฤษภาคม 2566
สู่การบรรเทาข้อมูลที่ไม่ถูกต้องที่เชื่อถือได้: ลักษณะทั่วไป ความไม่แน่นอน และ GPT-4
เคลลิน เพลรีน, เมลินา เร็คโซโพรดโจ, คาเลบ กุปต้า, โจเอล คริสตอฟ, เรฮาเนห์ แรบบานี
arXiv 2023. [กระดาษ]
24 พฤษภาคม 2566
การตีความที่ปรับเทียบแล้ว: การประมาณความเชื่อมั่นในการแยกวิเคราะห์ความหมาย
เอเลียส สเตนเกล-เอสสกิน, เบนจามิน แวน เดอร์ม
arXiv 2022 [กระดาษ] [Github]
14 พ.ย. 2565
การปรับเทียบความเป็นไปได้ของลำดับจะช่วยเพิ่มการสร้างภาษาแบบมีเงื่อนไข
เหยา จ้าว, มิชา คาลมาน, ริชาบห์ โจชิ, ชาชิ นารายัน, โมฮัมหมัด ซาเลห์, ปีเตอร์ เจ. หลิว
ICLR 2023. [กระดาษ]
30 ก.ย. 2565
การจำแนกประเภทการคัดเลือกที่ปรับเทียบแล้ว
อดัม ฟิช, ทอมมี จาคโคลา, เรจิน่า บาร์ซิเลย์
TMLR 2022. [กระดาษ]
25 ส.ค. 2565
ลดความมั่นใจมากเกินไปของเจ้าหน้าที่สนทนาด้วยการสอบเทียบทางภาษา
ซาบรินา เจ. เมียลเก้, อาเธอร์ สซแลม, เอมิลี่ ไดแนน, วาย-ลาน บูโร
NAACL 2022. [กระดาษ]
22 มิ.ย. 2565
การตรวจสอบการสอบเทียบซ้ำ: กรณีการตอบคำถาม
เฉิงเล่ยซี, เฉิน จ้าว, เซวอน มิน, จอร์แดน บอยด์-กราเบอร์
ผลการวิจัยของ EMNLP 2022 [กระดาษ]
25 พฤษภาคม 2565
สู่การแยกวิเคราะห์ความหมายของกราฟประสาทและสัญลักษณ์ร่วมกันผ่านความไม่แน่นอน
จือหลิน, เจเรไมห์หลิว, จิงโปซ่าง
ACL Fingings 2022. [กระดาษ]
22 พฤษภาคม 2565
การประเมินการแปลด้วยเครื่องโดยคำนึงถึงความไม่แน่นอน
ทาซิย่า กลุชโควา, คริสซูล่า แซร์วา, ริคาร์โด้ เรย์, อังเดร เอฟที มาร์ตินส์
EMNLP 2021. [กระดาษ]
13 ก.ย. 2564
ปรับเทียบก่อนใช้งาน: ปรับปรุงประสิทธิภาพของโมเดลภาษาเพียงไม่กี่ช็อต
โทนี่ ซี. จ้าว, เอริค วอลเลซ, ฉือเฟิง, แดน ไคลน์, ซาเมียร์ ซิงห์
ICML 2021. [กระดาษ][Github
19 กุมภาพันธ์ 2564
เราจะรู้ได้อย่างไรเมื่อโมเดลภาษารู้? เรื่อง การสอบเทียบแบบจำลองภาษาสำหรับการตอบคำถาม
เจิ้งเปา เจียง, จุน อารากิ, ไฮโป ติง, เกรแฮม นอยบิก
TACL 2021. [กระดาษ][Github]
2 ธ.ค. 2563
การสอบเทียบหม้อแปลงที่ผ่านการฝึกอบรมมาแล้ว
เชรย์ เดไซ, เกร็ก เดอร์เรตต์
EMNLP 2020. [กระดาษ][Github]
17 พฤษภาคม 2563
ต้นไม้แห่งการชี้แจง: ตอบคำถามที่ไม่ชัดเจนด้วยแบบจำลองภาษาขนาดใหญ่ที่ดึงข้อมูลมาเสริม
คังอู คิม, คิม ซองดง, บยองกุก จอน, จุนซุก ปาร์ค, แจวู คัง
EMNLP 2023. [กระดาษ][Github]
23 ต.ค. 2566
การคัดเลือกตอบคำถามที่ไม่ชัดเจน
Jeremy R. Cole, Michael JQ Zhang, Daniel Gillick, Julian Martin Eisenschlos, Bhuwan Dhingra, Jacob Eisenstein arXiv 2023 [กระดาษ]
24 พฤษภาคม 2566
เรากลัวว่าโมเดลภาษาไม่ใช่การสร้างแบบจำลองความคลุมเครือ Alisa Liu, Zhaofeng Wu, Julian Michael, Alane Suhr, Peter West, Alexander Koller, Swabha Swayamdipta, Noah A. Smith, Yejin Choi
arXiv 2023 [กระดาษ] [Github]
24 เมษายน 2566
ความคลุมเครือของงานในแบบจำลองมนุษย์และภาษา
อเล็กซ์ แทมกิน, คูนาล ฮันดา, อาวัช เชรธา, โนอาห์ กู๊ดแมน
ICLR 2023 [กระดาษ] [Github]
20 ธันวาคม 2022
หอย: การชี้แจงแบบเลือกสรรสำหรับคำถามที่ไม่ชัดเจนด้วยแบบจำลองภาษาเชิงสร้างสรรค์
ลอเรนซ์ คูห์น, ยาริน กัล, เซบาสเตียน ฟาร์คูฮาร์
arXiv 2022. [กระดาษ]
15 ธันวาคม 2565
วิธีเข้าถึงคำถามที่ไม่ชัดเจนในการค้นหาการสนทนา: การสำรวจเทคนิค แนวทาง เครื่องมือ และความท้าทาย
คิมิยะ คีย์วาน, จิมมี เซียงจี ฮวง
แบบสำรวจคอมพิวเตอร์ ACM ปี 2022 [กระดาษ]
7 ธ.ค. 2565
ความช่วยเหลือเกี่ยวกับโมเดลภาษาขนาดใหญ่
ดมิทรี คราเชนินนิคอฟ, เอกอร์ คราเชนินนิคอฟ, เดวิด ครูเกอร์
เวิร์กช็อป NeurIPS MLSW 2022 [กระดาษ]
5 ธันวาคม 2565
ทำไมไก่ถึงข้ามถนน? การใช้ถ้อยคำใหม่และการวิเคราะห์คำถามที่ไม่ชัดเจนใน VQA
เอเลียส สเตนเกล-เอสสกิน, จิเมน่า กัลลาร์-บลาสโก, ยี่ โจว, เบนจามิน แวน เดอร์ม
arXiv 2022 [กระดาษ] [Github]
14 พ.ย. 2565
Abg-CoQA: ชี้แจงความคลุมเครือในการตอบคำถามเชิงสนทนา
เหม่ยฉี กัว, หมิงต้า จาง, ศิวะ เรดดี้, มาลิเหอ อาลิคานี
AKBC 2021. [กระดาษ]
22 มิ.ย. 2564
ช่องว่างระหว่างความมั่นใจและความสามารถในแบบจำลองภาษาขนาดใหญ่: การศึกษาเกี่ยวกับความรู้ความเข้าใจ
อนิเกต์ กุมาร์ ซิงห์, ซูมาน เดฟโกตา, บิชาล ลามิชฮาน, อุตตัม ดาคาล, จันดรา ดาคาล
arXiv 2023. [กระดาษ]
28 กันยายน 2023
จุดแข็งในตัวเลข: การประมาณความเชื่อมั่นของแบบจำลองภาษาขนาดใหญ่ตามข้อตกลงที่รวดเร็ว
เกวนนิธ ปอร์ติลโล ไวท์แมน, อเล็กซานดรา เดลูเซีย, มาร์ค เดรดซ์
ACL TrustNLP Workshop 2023 [กระดาษ]
1 กรกฎาคม 2023
อะไรคือแนวทางที่แตกต่างกันในการตรวจจับเนื้อหาที่สร้างโดย LLM เช่น ChatGPT และพวกเขาทำงานและแตกต่างอย่างไร?
เซบาสเตียน ราชก้า
[ลิงค์] [GPTZero]
1 กุมภาพันธ์ 2566
DetectGPT: การตรวจจับข้อความที่สร้างโดยเครื่อง Zero-Shot โดยใช้ความโค้งของความน่าจะเป็น
เอริก มิทเชลล์, ยุนโฮ ลี, อเล็กซานเดอร์ คาซัตสกี, คริสโตเฟอร์ ดี. แมนนิ่ง, เชลซี ฟินน์
arXiv 2023 [กระดาษ] [เว็บไซต์]
26 มกราคม 2023
การสร้างแบบจำลองภาษาที่ปรับเปลี่ยนได้อย่างมั่นใจ
ทาล ชูสเตอร์, อดัม ฟิช, ไจ กุปต้า, มอสตาฟา เดห์กานี, ดารา บาห์รี, วินห์ คิว. ทราน, ยี่ ไต, โดนัลด์ เมตซ์เลอร์
NeurIPS 2022. [กระดาษ] 25 ต.ค. 2022
การควบคุมความเสี่ยงที่เป็นไปตามข้อกำหนด
อนาสตาซิออส เอ็น แองเจโลปูลอส, สตีเฟน เบตส์, อดัม ฟิช, ลิฮัว เล่ย, ทาล ชูสเตอร์
arXiv 2022 [กระดาษ] [Github]
4 ส.ค. 2565
แบบสำรวจการเรียนรู้เชิงรุกเพื่อการประมวลผลภาษาธรรมชาติ
จื้อซ่ง จาง, เอ็มมา สตรูเบลล์, เอดูอาร์ด โฮวี่
EMNLP 2022. [กระดาษ][Github]
18 ต.ค. 2565
การแจ้งอย่างกระตือรือร้นด้วยห่วงโซ่แห่งความคิดสำหรับโมเดลภาษาขนาดใหญ่
Shizhe Diao, Pengcheng Wang, หยง หลิน, ตง จาง
arXiv 2023 [กระดาษ] [Github]
23 กุมภาพันธ์ 2566
การติดฉลากเชิงโต้ตอบที่ใช้ทรัพยากรต่ำสำหรับการปรับแต่งโมเดลภาษาอย่างละเอียด
เซอิจิ มาเอคาวะ, แดน จาง, ฮันนาห์ คิม, สัจจาดูร์ ราห์มาน, เอสเตวัม ฮรุชกา
ผลการวิจัยของ EMNLP ปี 2022 [กระดาษ]
7 ธ.ค. 2565
คุณสามารถติดป้ายกำกับน้อยลงโดยใช้ข้อมูลนอกโดเมนได้หรือไม่ การเรียนรู้แบบกระตือรือร้นและถ่ายทอดด้วยคำแนะนำสั้นๆ
Rafal Kocielnik, Sara Kangaslahti, Shrimai Prabhumoye, Meena Hari, R. Michael Alvarez, Anima Anandkumar
การประชุมเชิงปฏิบัติการ NeurIPS 2022 [กระดาษ]
21 พ.ย. 2565
AfroLM: โมเดลภาษาที่ผ่านการฝึกอบรมหลายภาษาโดยเน้นการเรียนรู้ด้วยตนเองสำหรับภาษาแอฟริกัน 23 ภาษา
โบนาเวนตูร์ เอฟพี ดอสซู, อัทนาฟู แลมเบโบ ทอนย่า, โอรีน ยูซุฟ, ซาโลเมย์ โอเซ, อบิเกล ออปปง, อิยานูโอลูว่า โชเด, โอลูวาบูซาโย โอลูฟังเก้ อโวโยมิ, คริส ชิเนนเย เอเมซูเอ
EMNLP 2022. [กระดาษ][Github]
7 พ.ย. 2565
การเรียนรู้เชิงรุกช่วยให้โมเดลที่ได้รับการฝึกล่วงหน้าเรียนรู้งานที่ตั้งใจไว้
อเล็กซ์ แทมคิน, ดาด ฟาม เหงียน, ซาลิล เดชปันเด, เจสซี่ มู, โนอาห์ กู๊ดแมน
NeurIPS 2022 [กระดาษ] [Github]
31 ต.ค. 2565
คำอธิบายประกอบแบบเลือกทำให้โมเดลภาษาดีขึ้นสำหรับผู้เรียนเพียงไม่กี่คน
ฮองจิน ซู, จุงโก คาไซ, เฉิน เฮนรี วู, เว่ยเจีย ชิ, เทียนลู่ หวาง, เจียอี้ ซิน, รุย จาง, มารี ออสเทนดอร์ฟ, ลุค เซตเทิลมอยเออร์, โนอาห์ เอ. สมิธ, เถา หยู
ICLR 2023 [กระดาษ] [Github]
5 ก.ย. 2565
การเรียนรู้เชิงรุกแบบหลายงานสำหรับโมเดลที่ใช้ Transformer ที่ได้รับการฝึกอบรมล่วงหน้า
กาย ร็อตแมน, รอย ไรชาร์ท
TACL 2022. [กระดาษ] [Github]
10 ส.ค. 2565
AcTune: การฝึกอบรมตนเองเชิงรุกโดยอิงความไม่แน่นอนสำหรับการปรับแต่งแบบจำลองภาษาที่ผ่านการฝึกอบรมอย่างละเอียดเชิงรุก
เยว่หยู, หลิงไคคง, จางเจียหยู, จางหรงซี, เฉาจาง
NAACL-HLT2022. [กระดาษ] [Github]
10 ก.ค. 2565
สู่การเรียนรู้เชิงลึกเชิงลึกที่เป็นไปได้เชิงคำนวณ
อาคิม ทสวีกุน, อาร์เต็ม เชลมานอฟ, เกลบ คุซมิน, เลโอนิด ซานอชกิน, ดานีล ลาริโอนอฟ, เกลบ กูเซฟ, มานเวล อเวติเซียน, เลโอนิด จูคอฟ
NAACL 2022 [กระดาษ] [Github]
7 พฤษภาคม 2565
FAMIE: กรอบการเรียนรู้ที่รวดเร็วสำหรับการดึงข้อมูลหลายภาษา
มินห์ วัน เหงียน, เหงีย จุง โง, โบนัน มิน, เทียน ฮู เหงียน
NAACL 2022 [กระดาษ] [Github]
16 กุมภาพันธ์ 2565
เรื่อง ความสำคัญของการปรับโมเดลภาษาที่ได้รับการฝึกล่วงหน้าอย่างมีประสิทธิผลเพื่อการเรียนรู้เชิงรุก
คาเทรินา มาร์กาติน่า, โลอิก บาร์โรต์, นิโคลอส อเลตราส
ACL 2022. [กระดาษ]
2 มี.ค. 2565
ข้อจำกัดของการเรียนรู้เชิงรุกด้วยโมเดลภาษา Deep Transformer
ไมค์ ดาร์ซี, ดั๊ก ดาวนีย์
อาร์ซิฟ 2022. [กระดาษ]
28 ม.ค. 2565
การเรียนรู้เชิงรุกโดยการได้รับตัวอย่างที่ตรงกันข้าม
คาเทรินา มาร์กาติน่า, จอร์จอส เวอร์นิโกส, โลอิก บาร์โรต์, นิโคลอส อเลตราส
EMNLP 2021. [กระดาษ][Github]
8 ก.ย. 2564
ทบทวนกลยุทธ์การสืบค้นตามความไม่แน่นอนสำหรับการเรียนรู้เชิงรุกด้วย Transformers
คริสโตเฟอร์ ชโรเดอร์, แอนเดรียส นีเคลอร์, มาร์ติน พอตธาสต์
ผลการวิจัยของ ACL 2022 [กระดาษ] [Github]
12 ก.ค. 2564
การเรียนรู้เชิงรุกสำหรับการแท็กลำดับด้วยโมเดลที่ผ่านการฝึกอบรมเชิงลึกและการประมาณค่าความไม่แน่นอนแบบเบย์
อาร์เต็ม เชลมานอฟ, ดมิทรี ปูซีเรฟ, ลิยูบอฟ คูปรียาโนวา, เดนิส เบลยาคอฟ, ดานีล ลาริโอนอฟ, นิกิตา โครมอฟ, โอลก้า โคซโลวา, เอคาเทรินา อาร์เตโมวา, มิทรี วี. ไดลอฟ, อเล็กซานเดอร์ ปันเชนโก
EACL 2021. [กระดาษ]
18 กุมภาพันธ์ 2564
การปรับแต่ง BERT อย่างละเอียดเพื่อการทำความเข้าใจภาษาธรรมชาติที่ใช้ทรัพยากรต่ำผ่านการเรียนรู้แบบแอคทีฟ
แดเนียล กรีสฮาเบอร์, โยฮันเนส เมาเชอร์, หง็อก ทัง วู
COLING 2020. [กระดาษ]
4 ธ.ค. 2563
การตรวจจับภาพหลอนที่ยอดเยี่ยม
HallusionBench: ชุดการวินิจฉัยขั้นสูงสำหรับอาการประสาทหลอนทางภาษาที่พันกันและภาพลวงตาในโมเดลภาษาการมองเห็นขนาดใหญ่
เทียนรุ่ย กวน*, ฟูเซียว หลิว*, ซีหยาง อู๋, รุ่ยชี่ ซีอาน, จงเซีย ลี, เซียวหยู หลิว, ซีจุน หวาง, ลี่ชาง เฉิน, ฟู่หรง หวง, ยาเซอร์ ยาคูบ, ดิเนซ มาโนชา, เทียนยี่ โจว
CVPR 2024. [กระดาษ] [Github]
18 มี.ค. 2567
ตร
เจียซิน จาง, โจวหัง ลี, คามาลิกา ดาส, แบรดลีย์ เอ. มาลิน, ศรีจารัน คูมาร์
EMNLP 2023. [กระดาษ][Github]
3 พ.ย. 2566
ลีดเดอร์บอร์ดภาพหลอน
เวคทารา
[ลิงค์]
2 พ.ย. 2566
เหนือความเป็นจริง: การประเมินที่ครอบคลุมของแบบจำลองภาษาขนาดใหญ่ในฐานะเครื่องกำเนิดความรู้
เหลียง เฉิน, หยาง เติ้ง, หยาเทา เปียน, เจ๋อหยู ฉิน, ปิงเจ๋อ วู, ทัตเส็งชัว, คัมไฟ หว่อง
EMNLP 2023. [กระดาษ][Github]
12 ต.ค. 2566
การตรวจสอบแบบลูกโซ่ช่วยลดอาการประสาทหลอนในโมเดลภาษาขนาดใหญ่
เชห์ซาด ดูเลียวาลา, มอยตาบา โคเมลี่, จิง ซู, โรเบอร์ตา ไรเลียนู, เซียน หลี่, อัสลี เซลิคิลมาซ, เจสัน เวสตัน
arXiv 2023. [กระดาษ]
20 กันยายน 2023
โมเดลภาษารู้หรือไม่ว่าพวกเขากำลังอ้างอิงภาพหลอนหรือไม่?
อายุช อากราวัล, เลสเตอร์ แม็กกี้, อดัม เทามาน คาไล
arXiv 2023. [กระดาษ]
29 พฤษภาคม 2566.
ภาพหลอนที่ขัดแย้งในตัวเองของแบบจำลองภาษาขนาดใหญ่: การประเมิน การตรวจจับ และการบรรเทาผลกระทบ
นีลส์ มึนด์เลอร์, จิงซวน เหอ, สโลโบดัน เจนโก้, มาร์ติน เวเชฟ
arXiv 2023. [กระดาษ]
25 พฤษภาคม 2566
เหตุใด ChatGPT จึงขาดการให้คำตอบที่เป็นจริง
เซิน เจิ้ง, เจี๋ย ฮวง, เควิน เฉิน-ฉวน ชาง
arXiv 2023. [กระดาษ]
24 พฤษภาคม 2566
ภาพหลอนแบบจำลองภาษาสามารถสโนว์บอลได้อย่างไร
มูรู จาง, Ofir Press, วิลเลียม เมอร์ริล, อลิสา หลิว, โนอาห์ เอ. สมิธ
arXiv 2023. [กระดาษ]
22 พฤษภาคม 2023
LM กับ LM: การตรวจจับข้อผิดพลาดทางข้อเท็จจริงผ่านการตรวจสอบแบบไขว้
รอย โคเฮน, เมย์ ฮามรี, มอร์ เกวา, อาเมียร์ โกลเบอร์สัน
arXiv 2023. [กระดาษ]
22 พฤษภาคม 2023
HaluEval: เกณฑ์การประเมินอาการประสาทหลอนขนาดใหญ่สำหรับโมเดลภาษาขนาดใหญ่
จุนอี้ ลี, เสี่ยวเสวี่ย เฉิง, เวย์น ซิน จ้าว, เจียนหยุนเนีย, จีหรงเหวิน
arXiv 2023 [กระดาษ] 19 พฤษภาคม 2023
SelfCheckGPT: การตรวจจับภาพหลอนกล่องดำแบบไม่มีทรัพยากรสำหรับโมเดลภาษาขนาดใหญ่ทั่วไป
พศวีร์ มานะกุล, เอเดียน ลิวซี่, มาร์ค เจเอฟ เกลส์
arXiv 2023 [กระดาษ] [Github]
8 มี.ค. 2566
ตรวจสอบข้อเท็จจริงของคุณแล้วลองอีกครั้ง: ปรับปรุงโมเดลภาษาขนาดใหญ่ที่มีความรู้จากภายนอกและคำติชมอัตโนมัติ
เป่าหลิน เผิง, มิเชล แกลลีย์, เผิงเฉิง เหอ, ห่าวเฉิง, หยูเจีย ซี, หยู หู, ชิวหยวน หวง, ลาร์ส ลิเดน, โจว หยู, เว่ยจู เฉิน, เจียนเฟิง เกา
arXiv 2023. [กระดาษ]
23 กุมภาพันธ์ 2023
RHO (ρ): การลดอาการประสาทหลอนในบทสนทนาแบบเปิดโดเมนด้วยพื้นฐานความรู้
ซีเว่ย จี, ซีฮัน หลิว, นายอน ลี, เถี่ยเจิ้ง หยู, ไบรอัน วิลี่, มิน เจิง, ปาสเกล ฟุง
arXiv 2022. [กระดาษ]
3 ธันวาคม 2565
FaithDial: เกณฑ์มาตรฐานที่ซื่อสัตย์สำหรับการเจรจาการแสวงหาข้อมูล
นูฮา ดซิริ, เอห์ซาน คามัลลู, ซีวาน มิลตัน, ออสมาร์ ไซยาน, โม ยู, เอโดอาร์โด เอ็ม. ปอนติ, ซิว่า เรดดี้
TACL 2022. [กระดาษ]
22 เม.ย. 2565
การสำรวจอาการประสาทหลอนในการสร้างภาษาธรรมชาติ
ซีเว่ย จี, นายอน ลี, ริต้า ฟรีสเก้, เถี่ยเจิง หยู, ตัน ซู, หยาน ซู, เอตสึโกะ อิชิ, เยจิน ปัง, เหวินเหลียง ไต, อันเดรีย มาดอตโต, ปาสเกล ฟุง
arXiv 2022. [กระดาษ]
8 กุมภาพันธ์ 2565
TruthX: บรรเทาอาการประสาทหลอนโดยการแก้ไขแบบจำลองภาษาขนาดใหญ่ในพื้นที่แห่งความจริง Shaolei Zhang, Tian Yu, Yang Feng
arXiv 2024 [กระดาษ] [Github]
27 กุมภาพันธ์ 2567
การแทรกแซงตามเวลา: การหาคำตอบที่เป็นความจริงจากโมเดลภาษา Kenneth Li, Oam Patel, Fernanda Viégas, Hanspeter Pfister, Martin Wattenberg
arXiv 2023 [กระดาษ] [Github]
6 มิถุนายน 2566
สถานะภายในของ LLM รู้ว่าเมื่อใดที่โกหก
อามอส อาซาเรีย, ทอม มิทเชลล์
arXiv 2023. [กระดาษ]
26 เมษายน 2023
TruthfulQA: การวัดว่าแบบจำลองเลียนแบบความเท็จของมนุษย์อย่างไร
สเตฟานี ลิน, เจค็อบ ฮิลตัน, โอเวน อีแวนส์
ACL 2022 [กระดาษ] [Github] [บล็อก]
8 ก.ย. 2564
Truthful AI: การพัฒนาและควบคุม AI ที่ไม่โกหก
โอเวน อีแวนส์, โอเว่น คอตตอน-บาร์รัตต์, ลูคัส ฟินน์เวเดน, อดัม เบลส์, อาวิทัล บัลวิท, ปีเตอร์ วิลส์, ลูก้า ริเก็ตติ, วิลเลียม ซอนเดอร์ส
arXiv 2021. [กระดาษ] [บล็อก]
13 ต.ค. 2564
การวัดความน่าเชื่อถือของโมเดลภาษาขนาดใหญ่ด้วยความสอดคล้องของความหมาย
ฮาร์ช ราจ, โดมินิก โรซาตี, ซูภาบราตา มาจุมดาร์
เวิร์กช็อปความปลอดภัยของ NeurIPS 2022 ML [กระดาษ]
10 พ.ย. 2565
ผู้อ้างอิง: คำติชมการให้เหตุผลเกี่ยวกับการเป็นตัวแทนระดับกลาง
เด๊บจิต พอล, เมเต้ อิสมาอิลซาดา, มักซิม เปย์ราร์ด, บีทริซ บอร์เกส, อองตวน บอสเซลุต, โรเบิร์ต เวสต์, บอย ฟัลติงส์
arXiv 2023. [กระดาษ]
4 เมษายน 2566
OpenICL: กรอบงานโอเพ่นซอร์สสำหรับการเรียนรู้ในบริบท
เจิ้นหยู่ หวู่, เหยาเซียง หวาง, เจียเฉิง เย่, เจียงเทา เฟิง, จิงจิง ซู, หยูเฉียว, จือหยง หวู่
arXiv 2023 [กระดาษ] [Github]
6 มี.ค. 2566
ความเข้าใจภาษาธรรมชาติที่เชื่อถือได้ด้วยโมเดลภาษาขนาดใหญ่และการเขียนโปรแกรมชุดคำตอบ
อภิรมน ราชเศคารัน, ยานไค เซง, พาร์ธ ปาดัลการ์, โกปาล คุปตะ
arXiv 2023. [กระดาษ]
7 กุมภาพันธ์ 2566
ความสม่ำเสมอในตนเองปรับปรุงการใช้เหตุผลแบบห่วงโซ่ความคิดในแบบจำลองภาษา
ซือจือ หวาง, เจสัน เหว่ย, เดล ชูร์มานส์, ก๊วก เลอ, เอ็ด ชี, ชารัน นารัง, อาคังชา เชาเดรี, เดนนี่ โจว
ICLR 2023. [กระดาษ]
21 มี.ค. 2565
ห่วงโซ่แห่งความคิดกระตุ้นให้เกิดการใช้เหตุผลในแบบจำลองภาษาขนาดใหญ่
เจสัน เหว่ย, ซือจือ หวาง, เดล ชูร์มานส์, มาร์เท่น บอสมา, เอ็ด ชี, ก๊วก เลอ, เดนนี่ โจว
arXiv 2022. [กระดาษ]
28 ม.ค. 2565
STAR: ผู้ให้เหตุผลแบบสอนด้วยตนเอง ระดมเหตุผลด้วยการใช้เหตุผล
เอริก เซลิคแมน, หยู่ห่วย วู, โนอาห์ ดี. กู๊ดแมน
NeurIPS 2022 [กระดาษ] [Github]
28 มี.ค. 2565
ความไม่น่าเชื่อถือของคำอธิบายในการให้เหตุผลเชิงข้อความเพียงไม่กี่ช็อต
ซี เย่, เกร็ก เดอร์เรตต์
NeurIPS 2022 [กระดาษ] [Github]
6 พฤษภาคม 2565
วงดนตรีเสริมเหตุผลในแบบจำลองภาษา
ซือจือ หวาง, เจสัน เหว่ย, เดล ชูร์มานส์, ก๊วก เลอ, เอ็ด ชี, เดนนี่ โจว
arXiv 2022. [กระดาษ]
2 ก.ค. 2565
ReAct: การประสานการใช้เหตุผลและการแสดงในรูปแบบภาษา
ซุ่นหยู่ เหยา, เจฟฟรีย์ จ้าว, เตียน หยู, หนาน ตู้, อิซัค ชาฟราน, คาร์ทิค นาราซิมฮาน, หยวน เฉา
ICLR 2023. [กระดาษ][Github] [โครงการ]
6 ต.ค. 2565
ในความคิดที่สอง อย่าคิดทีละขั้นตอน! อคติและความเป็นพิษในการให้เหตุผลแบบ Zero-Shot
โอมาร์ เชค, หงซิน จาง, วิลเลียม เฮลด์, ไมเคิล เบิร์นสไตน์, ดีอี หยาง
arXiv 2022. [กระดาษ]
15 ธันวาคม 2565
ความก้าวหน้าของการสร้างโมเดลภาษาให้มีเหตุผลที่ดีขึ้น
ยี่เฟย ลี, เจ๋อฉี หลิน, จางฉือจู๋, เฉียงฟู่, เป่ย เฉิน, เจี้ยนกวงโหลว, เว่ยจู้ เฉิน
arXiv 2022 [กระดาษ] [Github]
6 มิ.ย. 2565
ถามฉันอะไรก็ได้: กลยุทธ์ง่ายๆ สำหรับการกระตุ้นโมเดลภาษา
ซิมราน อโรรา, อวานิกา นารายัน, มายี เอฟ. เฉิน, ลอเรล ออร์, นีล กูฮา, คุช บาเทีย, อิเนส ชามี, เฟรเดริก ซาลา, คริสโตเฟอร์ เร
arXiv 2022 [กระดาษ] [Github]
5 ต.ค. 2565
MathPrompter: การใช้เหตุผลทางคณิตศาสตร์โดยใช้แบบจำลองภาษาขนาดใหญ่
ชิมา อิมานิ, เหลียง ตู่, ฮาร์ช ศรีวาสตาวา
arXiv 2023. [กระดาษ]
4 มี.ค. 2566
การแจ้งตามความซับซ้อนสำหรับการให้เหตุผลแบบหลายขั้นตอน
เหยาฟู่, ห่าวเผิง, อาชิช ซาบาวาล, ปีเตอร์ คลาร์ก, ทูชาร์ ค็อต
arXiv 2022 [กระดาษ] [Github]
3 ต.ค. 2565
การวัดและการลดช่องว่างการจัดองค์ประกอบในแบบจำลองภาษา
Ofir Press, มูรู จาง, เซวอน มิน, ลุดวิก ชมิดต์, โนอาห์ เอ. สมิธ, ไมค์ ลูอิส
arXiv 2022 [กระดาษ][Github] 7 ต.ค. 2022
การสืบค้นแบบสลับกับการใช้เหตุผลแบบลูกโซ่ของความคิดสำหรับคำถามหลายขั้นตอนที่เน้นความรู้
ฮาร์ช ตรีเวดี, นิรันจัน บาลาสุบรามาเนียน, ทูชาร์ ค็อต, อาชิช ซับฮาร์วาล
arXiv 2023 [กระดาษ] [Github]
20 ธันวาคม 2022
โมเดลภาษาขนาดใหญ่เป็นเครื่องมือเพิ่มประสิทธิภาพ
เฉิงรุน หยาง, เสวี่ยจื้อ หวาง, อี้เฟิง หลู, ฮั่นเซียว หลิว, ก๊วก วี. เลอ, เดนนี่ โจว, ซินหยุน เฉิน
arXiv 2023. [กระดาษ]
7 ก.ย. 2566
InstructZero: การเพิ่มประสิทธิภาพคำสั่งอย่างมีประสิทธิภาพสำหรับโมเดลภาษาขนาดใหญ่ Black-Box
หลี่ชาง เฉิน, จิ่วไห่ เฉิน, ทอม โกลด์สตีน, เฮง ฮวง, เทียนยี่ โจว
arXiv 2023 [กระดาษ] [Github]
5 มิ.ย. 2566
Promptboosting: การจำแนกข้อความแบบกล่องดำที่มีการส่งต่อสิบครั้ง
Bairu Hou, Joe O'Connor, Jacob Andreas, Shiyu Chang, Yang Zhang
ICML 2023 [กระดาษ] [Github]
23 มกราคม 2023
Grips: การค้นหาคำสั่งแบบไม่มีไล่ระดับสีและอิงตามการแก้ไขสำหรับการแสดงโมเดลภาษาขนาดใหญ่
อาร์คิกิ ปราสาด, ปีเตอร์ ฮาส, เซียง โจว, โมหิต บันซัล
EACL 2023 [กระดาษ] [Github]
14 มี.ค. 2022
RLPrompt: การเพิ่มประสิทธิภาพข้อความแจ้งแบบไม่ต่อเนื่องด้วยการเรียนรู้แบบเสริมแรง
Mingkai Deng, Jianyu Wang, Cheng-Ping Hsieh, Yihan Wang, Han Guo, เทียนหมิน ชู, Meng Song, Eric P. Xing, Zhiting Hu
EMNLP 2022. [กระดาษ][Github]
25 พฤษภาคม 2565
การเรียนรู้พร้อมท์กล่องดำสำหรับโมเดลภาษาที่ผ่านการฝึกอบรมมาแล้ว
ชิเจ๋อ เตียว, จี้เฉา ฮวง, รุ่ยเจีย ซู, ซู่ชุน ลี, หยง ลิน, เซียวโจว, ตง จาง
TMLR 2023 [กระดาษ] [Github]
22 ม.ค. 2565
การปรับแต่งกล่องดำสำหรับภาษา-รุ่น-as-a-Service
เทียนเซียง ซุน, หยุนฟาน เชา, หง เฉียน, ซวนจิง หวง, ซีเผิง ชิว
ICML 2022 [กระดาษ] [Github]
10 มกราคม 2022
BBTv2: สู่อนาคตที่ปราศจากการไล่ระดับสีด้วยโมเดลภาษาขนาดใหญ่
Tianxiang Sun, Zhengfu He, Hong Qian, Yunhua Zhou, Xuanjing Huang, Xipeng Qiu EMNLP 2022 [กระดาษ] [Github]
7 ธ.ค. 2565
การกระตุ้นความคิดแบบอัตโนมัติในโมเดลภาษาขนาดใหญ่
โจวเฉิง จาง, แอสตัน จาง, มู่ลี่, อเล็กซ์ สโมลา
ICLR 2023 [กระดาษ] [Github]
7 ต.ค. 2565
การเพิ่มและการเลือกอัตโนมัติพร้อมท์ด้วยห่วงโซ่แห่งความคิดจากข้อมูลที่ติดป้ายกำกับ
คาซุ่น ชุม, ซือเจ๋อ เตียว, ตง จาง
arXiv 2023 [กระดาษ] [Github]
24 กุมภาพันธ์ 2566
โมเดลภาษาขนาดใหญ่คือวิศวกรที่พร้อมท์ในระดับมนุษย์
หย่งเชา โจว, อังเดร เอียน มูเรซานู, ซีเหวิน ฮัน, เคียรัน ปาสเตอร์, ซิลวิว ปิติส, แฮร์ริส ชาน, จิมมี่ บา
ICLR 2023 [กระดาษ] [Github]
3 พ.ย. 2565
พร้อมท์ที่ได้รับคำสั่งอย่างน่าอัศจรรย์และจะหาได้ที่ไหน: เอาชนะความไวของคำสั่งพร้อมท์เพียงไม่กี่ช็อต
เหยา ลู่, แม็กซ์ บาร์โตโล, อลาสแตร์ มัวร์, เซบาสเตียน รีเดล, พอนทัส สเตเนทอร์ป
ACL 2022. [กระดาษ]
การเลือกตัวอย่างที่ใช้งานสำหรับการเรียนรู้ในบริบท
อี้หมิง จาง, ฉีเฟิง, เฉินห่าว ตัน
EMNLP 2022. [กระดาษ][Github]
8 พ.ย. 2565
คำอธิบายประกอบแบบเลือกทำให้โมเดลภาษาดีขึ้นสำหรับผู้เรียนเพียงไม่กี่คน
ฮองจิน ซู, จุงโก คาไซ, เฉิน เฮนรี วู, เว่ยเจีย ชิ, เทียนลู่ หวาง, เจียอี้ ซิน, รุย จาง, มารี ออสเทนดอร์ฟ, ลุค เซตเทิลมอยเออร์, โนอาห์ เอ. สมิธ, เถา หยู
ICLR 2023 [กระดาษ] [Github]
5 ก.ย. 2565
การเรียนรู้เพื่อดึงคำแนะนำสำหรับการเรียนรู้ในบริบท
โอฮัด รูบิน, โจนาธาน เฮอร์ซิก, โจนาธาน เบแรนท์
NAACL-HLT 2022 [กระดาษ] [Github]
16 ธ.ค. 2564
LaMini-LM: ฝูงโมเดลกลั่นที่หลากหลายจากคำสั่งขนาดใหญ่
หมิงเฮา วู, อับดุล วาฮีด, จางฉียู่, มูฮัมหมัด อับดุล-มาเกด, อัลฮัม ฟิกรี อาจี
arXiv 2023 [กระดาษ] [Github]
27 เมษายน 2023
การปรับแต่งตนเอง: การปรับแต่งซ้ำพร้อมการตอบรับด้วยตนเอง
อามาน มาดาน, นิเค็ต แทนดอน, พราการ์ กุปต้า, สกายเลอร์ ฮัลลิแนน, ลูยู เกา, ซาราห์ วีเกรฟเฟ, อูริ อลอน, นูฮา ดซีรี, ชริไม ปราภูมอย, ยี่หมิง หยาง, ฌอน เวลเลค, พระโพธิสัตว์ ปราสาด มาจุมเดอร์, ชาแชงค์ กุปต้า, อามีร์ ยาซดันบัคช์, ปีเตอร์ คลาร์ก
arXiv 2023 [กระดาษ] [Github] [เว็บไซต์]
30 มี.ค. 2566
พร้อมท์ทุกสิ่งที่คุณต้องการใช่ไหม? ไม่ มุมมองการเรียนรู้ตามคำสั่งที่ครอบคลุมและกว้างขึ้น
Renze Lou, Kai Zhang, เหวินเผิงหยิน
arXiv 2023 [กระดาษ] [Github]
18 มี.ค. 2566
การสอนด้วยตนเอง: การจัดรูปแบบภาษาให้สอดคล้องกับคำแนะนำที่สร้างขึ้นเอง
Yizhong Wang, Yeganeh Kordi, Swaroop Mishra, Alisa Liu, Noah A. Smith, Daniel Khashabi, Hannaneh Hajishirzi
arXiv 2022 [กระดาษ] [Github]
20 ธันวาคม 2022
AI รัฐธรรมนูญ: การไม่มีอันตรายจากคำติชมของ AI
Yuntao Bai และคณะ (มานุษยวิทยา)
arXiv 2022. [กระดาษ]
15 ธันวาคม 2565
การค้นพบพฤติกรรมของโมเดลภาษาด้วยการประเมินที่เขียนโดยโมเดล
อีธาน เปเรซ และคณะ
arXiv 2022. [กระดาษ]
19 ธ.ค. 2565
การเรียนรู้คำสั่งในบริบท
ซองฮยอน เย, ฮยอนบิน ฮวัง, โซฮี ยัง, ฮยอนกู ยุน, ยีรึน คิม, มินจุน ซอ
arXiv 2023 [กระดาษ] [Github]
28 กุมภาพันธ์ 2566
โมเดลภาษาที่เสริมด้วยอินเทอร์เน็ตผ่านการแจ้งเพียงไม่กี่ช็อตสำหรับการตอบคำถามแบบโอเพ่นโดเมน
แองเจลิกี ลาซาริดู, เอเลนา กริโบฟสกายา, วอยเซียค สโตโควีค, นิโคไล กริโกเรฟ
arXiv 2023. [กระดาษ]
10 มี.ค. 2566
โปรแกรมกระตุ้นความคิด: การแยกการคำนวณออกจากการใช้เหตุผลสำหรับงานการใช้เหตุผลเชิงตัวเลข
เหวินหู เฉิน, เสวี่ยกวง หม่า, ซินยี่ หวาง, วิลเลียม ดับเบิลยู. โคเฮน
arXiv 2022 [กระดาษ] [Github]
22 พ.ย. 2565
PAL: โมเดลภาษาที่ใช้โปรแกรมช่วย
หลู่ยู่ เกา, อามาน มาดาน, ชูหยาน โจว, อูริ อาลอน, เผิงเฟย หลิว, ยี่หมิง หยาง, เจมี คัลลัน, เกรแฮม นอยบิก
arXiv 2022 [กระดาษ] [Github] [โครงการ]
18 พ.ย. 2565
TALM: เครื่องมือจำลองภาษาเสริม
อารอน ปาริซี, เหยา จ้าว, โนอาห์ ฟีเดล
arXiv 2022. [กระดาษ]
24 พฤษภาคม 2565
Toolformer: โมเดลภาษาสามารถสอนตัวเองให้ใช้เครื่องมือได้
ติโม ชิค, เจน ดวิเวดี้-ยู, โรแบร์โต้ เดสซี่, โรเบอร์ต้า ไรเลนู, มาเรีย โลเมลี, ลุค เซตเทิลมอยเออร์, นิโคลา คันเซดด้า, โธมัส สเคียลอม
arXiv 2023. [กระดาษ]
9 กุมภาพันธ์ 2566
กลั่นทีละขั้นตอน! มีประสิทธิภาพเหนือกว่าโมเดลภาษาที่ใหญ่กว่าด้วยข้อมูลการฝึกอบรมที่น้อยลงและขนาดโมเดลที่เล็กลง
Cheng-Yu Hsieh, Chun-Liang Li, Chih-Kuan Yeh, Hootan Nakhost, Yasuhisa Fujii, Alexander Ratner, แรนเจย์ กฤษณะ, Chen-Yu Lee, โทมัส ไฟสเตอร์
arXiv 2023. [กระดาษ]
3 พฤษภาคม 2566
FreeLM: โมเดลภาษาที่ปรับแต่งได้ฟรี
เซียง ลี่ 1, ซิน เจียง, ซูหยิง เหมิง, อ้ายซิน ซุน, เย่ฉวน หวาง
arXiv 2023. [กระดาษ]
2 พฤษภาคม 2566
การดูแลข้อมูลอัตโนมัติสำหรับการปรับแต่งโมเดลภาษาที่แข็งแกร่ง
Jiuhai Chen, Jonas Mueller
Arxiv 2024. [กระดาษ]
19 มี.ค. 2024
การสร้างแบบจำลองภาษาที่ไม่เปลี่ยนแปลง Maxime Peyrard, Sarvjeet Singh Ghotra, Martin Josifoski, Vidhan Agarwal, Barun Patra, Dean Carignan, Emre Kiciman, Robert West
EMNLP 2022. [กระดาษ] [GitHub]
16 ต.ค. 2021
ไปสู่การสร้างบทสนทนาส่วนบุคคลที่แข็งแกร่งผ่านการเป็นตัวแทนการเป็นตัวแทนแบบไม่ไวต่อคำสั่งซื้อ
เหลียงเฉิน, ฮงรูวัง, หยางเติ้ง, ไว-จุงควาน, คัม-ไฟว่อง
ผลการวิจัยของ ACL 2023 [กระดาษ] [GitHub]
22 พฤษภาคม 2566
การสำรวจการเปลี่ยนแปลงแบบกระจายในรูปแบบภาษาขนาดใหญ่สำหรับการวิเคราะห์รหัส
Shushan Arakelyan, Rocktim Jyoti Das, Yi Mao, Xiang Ren
Arxiv 2023. [กระดาษ]
16 มี.ค. 2023
การตรวจจับการแจกจ่ายและการสร้างแบบเลือกสำหรับแบบจำลองภาษาแบบมีเงื่อนไข
Jie Ren, Jiaming Luo, Yao Zhao, Kundan Krishna, Mohammad Saleh, Balaji Lakshminarayanan, Peter J. Liu
ICLR 2023. [กระดาษ]
30 ก.ย. 2022
เกี่ยวกับการปรับโดเมนและการวางนัยทั่วไปของแบบจำลองภาษาที่ผ่านการฝึกอบรม: การสำรวจ
Xu Guo, Han Yu
Arxiv 2022. [กระดาษ]
6 พ.ย. 2022
การโจมตีของ LLMS
Lilian Weng [บล็อก]
25 ต.ค. 2023
Prottbench: ไปสู่การประเมินความทนทานของแบบจำลองภาษาขนาดใหญ่บนพรอมต์ของฝ่ายตรงข้าม
Kaijie Zhu, Jindong Wang, Jiaheng Zhou, Zichen Wang, Hao Chen, Yidong Wang, Linyi Yang, Wei Ye, Neil Zhenqiang Gong, Yue Zhang, Xing Xie Xie
Arxiv 2023. [กระดาษ] [GitHub]
7 มิ.ย. 20223
เกี่ยวกับความทนทานของ CHATGPT: มุมมองที่เป็นปฏิปักษ์และนอกการแจกจ่าย
Jindong Wang, Xixu Hu, Wenxin Hou, Hao Chen, Runkai Zheng, Yidong Wang, Linyi Yang, Haojun Huang, Wei Ye, Xiubo Geng, Binxin Jiao, Yue Zhang, Xing Xie Xie
Arxiv 2023. [กระดาษ] [GitHub]
22 ก.พ. 2023
การทดสอบความน่าเชื่อถือสำหรับระบบการประมวลผลภาษาธรรมชาติ
Samson Tan, Shafiq Joty, Kathy Baxter, Araz Taeihagh, Gregory A. Bennett, Min-Yen Kan
acl-ijcnlp 2021. [กระดาษ]
06 พฤษภาคม 2021
การตอบคำถามที่ระบุ: การประเมินผลและการสร้างแบบจำลองสำหรับแบบจำลองภาษาขนาดใหญ่ที่นำมาประกอบ
Bernd Bohnet, Vinh Q. Tran, Pat Verga, Roee Aharoni, Daniel Andor, Livio Baldini Soares, Massimiliano Ciaramita, Jacob Eisenstein, Kuzman Ganchev, Jonathan Herzig, Kai Hui Schuster, William W. Cohen, Michael Collins, Dipanjan Das, Donald Metzler, Slav Petrov, Kellie Webster
Arxiv 2022. [กระดาษ]
15 ธ.ค. 2022
แบบจำลองภาษาขนาดใหญ่สามารถอนุมานสาเหตุจากความสัมพันธ์ได้หรือไม่?
Zhijing Jin, Jiarui Liu, Zhiheng Lyu, Spencer Poff, Mrinmaya Sachan, Rada Mihalcea, Mona Diab, Bernhard Schölkopf
Arxiv 2023. [กระดาษ] [GitHub]
9 มิ.ย. 2023
การเลือกการเลือก: ใช้ประโยชน์จากแบบจำลองภาษาขนาดใหญ่สำหรับการใช้เหตุผลเชิงตรรกะที่ตีความได้
Antonia Creswell, Murray Shanahan, Irina Higgins
ICLR 2023. [กระดาษ]
19 พฤษภาคม 2565
การตรวจสอบความเข้าใจเชิงสาเหตุใน LLMS
Marius Hobbhahn, Tom Lieberum, David Seiler
Neurips 2022 เวิร์กช็อป [กระดาษ] [บล็อก]
3 ต.ค. 2022