ที่เก็บข้อมูลอย่างเป็นทางการของกระดาษ "การสกัดข้อมูล zero-shot ผ่านการแชทกับ chatgpt" โปรดแสดงดูดูและส้อมซื้อ repo ของเราสำหรับการอัปเดตที่ใช้งานอยู่!
การสกัดข้อมูล Zero-shot (เช่น) มีจุดมุ่งหมายเพื่อสร้างระบบ IE จากข้อความที่ไม่ได้ปรับ มันเป็นเรื่องที่ท้าทายเนื่องจากเกี่ยวข้องกับการแทรกแซงของมนุษย์เล็กน้อย ความท้าทาย แต่คุ้มค่า IE zero-shot ช่วยลดเวลาและความพยายามที่การติดฉลากข้อมูลต้องใช้ ความพยายามล่าสุดเกี่ยวกับโมเดลภาษาขนาดใหญ่ (LLMS, เช่น GPT3, ChatGPT) แสดงประสิทธิภาพที่มีแนวโน้มในการตั้งค่าศูนย์-ช็อตดังนั้นจึงเป็นแรงบันดาลใจให้เราสำรวจวิธีการที่รวดเร็ว ในงานนี้เราถามว่าโมเดล IE ที่แข็งแกร่งสามารถสร้างได้โดยการแจ้งให้ LLMS โดยตรงหรือไม่ โดยเฉพาะเราเปลี่ยนงาน zero-shot IE เป็นปัญหาการตอบคำถามหลายครั้งด้วยกรอบสองขั้นตอน (Chatie) ด้วยพลังของ CHATGPT เราประเมินกรอบการทำงานของเราอย่างกว้างขวางในงาน IE สามงาน: EntityRelation Triple Extract, ชื่อการจดจำเอนทิตีและการสกัดเหตุการณ์ ผลลัพธ์เชิงประจักษ์ในชุดข้อมูลหกชุดในสองภาษาแสดงให้เห็นว่า Chatie บรรลุประสิทธิภาพที่น่าประทับใจและเกินกว่ารุ่นเต็มรูปแบบในชุดข้อมูลหลายชุด (เช่น NYT11-HRL) เราเชื่อว่างานของเราสามารถให้ความกระจ่างเกี่ยวกับการสร้างแบบจำลองที่มีทรัพยากร จำกัด
零样本信息抽取( การสกัดข้อมูล, IE) 旨在从无标注文本中建立旨在从无标注文本中建立系统, 因为很少涉及人为干预,, 该问题非常具有挑战性。但零样本该问题非常具有挑战性。但零样本该问题非常具有挑战性。但零样本该问题非常具有挑战性。但零样本该问题非常具有挑战性。但零样本不再需要标注数据时耗费的时间和人力该问题非常具有挑战性。但零样本该问题非常具有挑战性。但零样本,,,,,,,,,,,,,, , 因此十分重要。近来的大规模语言模型(例如 GPT-3, แชท GPT) 在零样本设置下取得了很好的表现, 这启发我们探索基于提示的方法来解决零样本这启发我们探索基于提示的方法来解决零样本这启发我们探索基于提示的方法来解决零样本这启发我们探索基于提示的方法来解决零样本这启发我们探索基于提示的方法来解决零样本任务。我们提出一个任务。我们提出一个问题: 不经过训练来实现零样本信息抽取是否可行?我们将零样本 IE 任务转变为一个两阶段框架的多轮问答问题( แชทเช่น), 并在三个并在三个任务中广泛评估了该框架: 实体实体关系三元组抽取、命名实体识别和事件抽取。在两个语言的 6 个数据集上的实验结果表明, แชทเช่น取得了非常好的效果, 甚至在几个数据集上(例如 nyt11-hrl)上超过了全监督模型的表现。我们的工作能够为有限资源下คือ系统的建立奠定基础。
อัปเดต: เราใช้ API อย่างเป็นทางการเครื่องมือจะเร็วขึ้น !!! หากคีย์เกินขีด จำกัด โปรดบอกเรา
ประกาศ: ความเร็วในการตอบสนองขึ้นอยู่กับ Openai Chatgpt API อย่างเป็นทางการ (บางครั้งเจ้าหน้าที่ก็แออัดเกินไปและความเร็วจะช้าหรือ chatgpt จะมากเกินไป) นอกจากนี้คุณควรใช้คีย์ OpenAI ของคุณเองเพราะหากบัญชีเริ่มต้นของเราถูกใช้โดยหลายคนในเวลาเดียวกันบัญชีอาจเป็น โอเวอร์โหลด
ข้อสังเกต: เนื่องจาก API อย่างเป็นทางการไม่สามารถใช้งานได้ในประเทศดังนั้นเราจึงใช้ API จาก RevChatGPT และ V1 เวอร์ชัน แต่มัน ช้าเกินไป ดังนั้นเราจึงแนะนำให้คุณใช้เครื่องมือออฟไลน์เพื่อการศึกษา เราจะอัปเดต API เพิ่มเติมในอนาคต ( สิ่งที่ต้องทำ )
นอกจากนี้เรายังมีเครื่องมือ IE ตาม GPT3.5 คุณสามารถดูได้ใน GPT4ie
Chatie (การสกัดข้อมูลแบบไม่มีการถ่ายภาพผ่านการแชทกับ Chatgpt) เป็นตัวอย่างการสาธิตเครื่องมือโอเพนซอร์ซและมีประสิทธิภาพ ได้รับการปรับปรุงโดย chatgpt และการแจ้งเตือนมันมีจุดมุ่งหมายเพื่อดึง ข้อมูลที่มีโครงสร้าง ออกจาก ประโยคดิบ โดยอัตโนมัติและทำการวิเคราะห์เชิงลึกที่มีค่าของประโยคอินพุต การควบคุมข้อมูลที่มีโครงสร้างที่มีค่าช่วยให้ บริษัท ต่างๆทำการตัดสินใจที่มีความคมชัดและปรับปรุงธุรกิจ
เราสนับสนุนฟังก์ชั่นต่อไปนี้:
งาน | ชื่อ | คนขี้เกียจ |
---|---|---|
อีกครั้ง | การสกัดร่วมกับเอนทิตี | จีนอังกฤษ |
คนโง่ | ชื่อ recoginzation recoginzation | จีนอังกฤษ |
ee | การสกัดเหตุการณ์ | จีนอังกฤษ |
งานนี้มีจุดมุ่งหมายเพื่อแยกสามจากตำราธรรมดาเช่น (จีน, ทุน, ปักกิ่ง) , (《如懿传》, 主演, 周迅)
PS: * หมายถึงตัวเลือกเราตั้งค่าเริ่มต้นสำหรับพวกเขา แต่สำหรับการสกัดที่ดีขึ้นคุณควรระบุรายการสามรายการตามสถานการณ์แอปพลิเคชัน
ประโยค: ผู้บริหารของ Google อีกสี่คนประธานเจ้าหน้าที่ฝ่ายการเงินจอร์จเรเยส; รองประธานอาวุโสด้านการดำเนินธุรกิจโชนาบราวน์; หัวหน้าเจ้าหน้าที่กฎหมาย David Drummond; และรองประธานอาวุโสฝ่ายบริหารผลิตภัณฑ์โจนาธานโรเซนเบิร์กได้รับเงินเดือน 250,000 ดอลลาร์ต่อคน
RTL: ค่าเริ่มต้นดูไฟล์ "ประเภทเริ่มต้น"
ouptut:
ประโยค:第五部: 《如懿传》《如懿传》是一部古装宫廷情感电视剧, 由汪俊执导, 周迅、霍建华、张钧甯、董洁、辛芷蕾、童瑶、李纯、邬君梅等主演。 周迅、霍建华、张钧甯、董洁、辛芷蕾、童瑶、李纯、邬君梅等主演。
RTL: ค่าเริ่มต้นดูไฟล์ "ประเภทเริ่มต้น"
ouptut:
งานนี้มีวัตถุประสงค์เพื่อแยกเอนทิตีจากข้อความธรรมดาเช่น (loc, ปักกิ่ง) , (人物, 周恩来)
ประโยค: เจมส์ทำงานให้กับ Google ในปักกิ่งเมืองหลวงของจีน ETL: ['loc', 'misc', 'org', 'per']
ouptut:
ประโยค:中国产党创立于中华民国大陆时期产党创立于中华民国大陆时期, 由陈独秀和李大钊领导组织。
ETL: ['组织机构', '地点', '人物']
ouptut:
งานนี้มีวัตถุประสงค์เพื่อแยกเหตุการณ์ออกจากข้อความธรรมดาเช่น {Life-Divorce: {Person: Bob, Time: วันนี้, สถานที่: America}} , {竞赛行为-晋级: {时间: 无, 晋级方: 西北狼, 晋级赛事: 中甲榜首之争}}
ประโยค: เมื่อวานนี้บ๊อบและภรรยาของเขาหย่าร้างในกวางโจว
ETL: ค่าเริ่มต้นดูไฟล์ "ประเภทเริ่มต้น"
ouptut:
ประโยค:在 2022 年卡塔尔世界杯决赛中, 阿根廷以点球大战险胜法国。
ETL: ค่าเริ่มต้นดูไฟล์ "ประเภทเริ่มต้น"
ouptut:
ตอบสนอง+ขวด
front-end
และเรียกใช้ npm install
เพื่อดาวน์โหลดการพึ่งพาที่ต้องการnpm run start
Chatie ควรเปิดในแท็บเบราว์เซอร์ใหม่back-end
และ Run python run.py
เรามุ่งมั่นที่จะปรับปรุงโครงการของเราและมอบประสบการณ์ที่ดีที่สุดให้คุณ เพื่อให้บรรลุเป้าหมายนี้เราจะรวบรวมข้อมูลของคุณเพื่อช่วยให้เราเข้าใจว่าคุณโต้ตอบกับโครงการของเราอย่างไรและระบุพื้นที่สำหรับการปรับปรุง เราให้ความสำคัญกับความเป็นส่วนตัวและความปลอดภัยของข้อมูลของคุณและตรวจสอบข้อมูลเพื่อวัตถุประสงค์ในการปรับปรุงโครงการของเราเท่านั้น
ชำระเงินกระดาษนี้ arxiv: 2302.10205
@article{wei2023zero,
title={Zero-Shot Information Extraction via Chatting with ChatGPT},
author={Wei, Xiang and Cui, Xingyu and Cheng, Ning and Wang, Xiaobin and Zhang, Xin and Huang, Shen and Xie, Pengjun and Xu, Jinan and Chen, Yufeng and Zhang, Meishan and others},
journal={arXiv preprint arXiv:2302.10205},
year={2023}
}