المستودع الرسمي للورق "استخراج معلومات الصفر من خلال الدردشة مع ChatGPT". يرجى النجوم ، ومشاهدة ، وشوكة ريبو لدينا للتحديثات النشطة!
يهدف استخراج معلومات الصفر (IE) إلى إنشاء أنظمة IE من النص غير المُمثل. إنه أمر صعب بسبب إشراك القليل من التدخل البشري. التحدي ولكن جديرة بالاهتمام ، لا يقلل أي طلقة أي وقت وجهد يقلل من علامات وصفات البيانات. تُظهر الجهود الحديثة على نماذج اللغة الكبيرة (LLMS ، EG ، GPT3 ، ChatGPT) أداءً واعدة على إعدادات الصفر ، وبالتالي إلهامنا لاستكشاف الأساليب المستندة إلى الموجهين. في هذا العمل ، نسأل ما إذا كان يمكن بناء نماذج IE قوية عن طريق المطالبة مباشرة بـ LLMs. على وجه التحديد ، نقوم بتحويل مهمة IE الصفرية إلى مشكلة في الإجابة على أسئلة متعددة من خلال إطار على مرحلتين (Chatie). مع قوة chatgpt ، نقوم بتقييم إطار عملنا على نطاق واسع على ثلاث مهام IE: EntityRelation Triple Extract ، والتعرف على الكيان المسمى ، واستخراج الأحداث. تظهر النتائج التجريبية على ست مجموعات بيانات عبر لغتين أن Chatie يحقق أداءً مثيرًا للإعجاب وحتى يتجاوز بعض الطرز الكاملة على عدة مجموعات بيانات (على سبيل المثال ، NYT11-HRL). نعتقد أن عملنا يمكن أن يلقي الضوء على بناء نماذج مع موارد محدودة.
零样本信息抽取 (استخراج المعلومات , أي) 旨在从无标注文本中建立 أي 系统 , 因为很少涉及人为干预 , 该问题非常具有挑战性。但零样本 该问题非常具有挑战性。但零样本 不再需要标注数据时耗费的时间和人力 不再需要标注数据时耗费的时间和人力, 因此十分重要。近来的大规模语言模型 (例如 gpt-3 , الدردشة gpt) 在零样本设置下取得了很好的表现 , 这启发我们探索基于提示的方法来解决零样本 这启发我们探索基于提示的方法来解决零样本 任务。我们提出一个 任务。我们提出一个: : 不经过训练来实现零样本信息抽取是否可行?我们将零样本 أي 任务转变为一个两阶段框架的多轮问答问题 (الدردشة IE) ، 并在三个 أي 任务中广泛评估了该框架 : 实体关系三元组抽取、命名实体识别和事件抽取。在两个语言的 6 个数据集上的实验结果表明 , الدردشة أي 取得了非常好的效果 , ((例如 nyt11-hrl) 上超过了全监督模型的表现。我们的工作能够为有限资源下 أي 系统的建立奠定基础。 系统的建立奠定基础。
تحديث : نستخدم واجهة برمجة التطبيقات الرسمية ، تصبح الأداة أسرع !!! إذا تجاوز المفتاح الحدود ، فيرجى إخبارنا.
إشعار : تعتمد سرعة الاستجابة على واجهة برمجة تطبيقات Openai ChatGpt الرسمية. (في بعض الأحيان ، يكون المسؤول مزدحمًا جدًا وستكون السرعة بطيئة أو أن يتم تحميل ChatGPT مثقلة.
إشعار: نظرًا لأن واجهة برمجة التطبيقات الرسمية غير متوفرة في المحلية ، لذلك نستخدم API من إصدار Revchatgpt و V1. لكنها بطيئة للغاية ، لذلك ننصحك باستخدام الأداة دون اتصال للدراسة. سنقوم بتحديث واجهة برمجة التطبيقات (API) في المستقبل ( TODO ).
نقدم أيضًا أداة IE تعتمد على GPT3.5 ، يمكنك أن ترى في GPT4ie
Chatie (استخلاص معلومات Zero-Shot من خلال الدردشة مع ChatGPT) هو عرض IE Open Source و قوي. تم تعزيزه بواسطة chatgpt و prompting ، ويهدف إلى استخراج المعلومات المنظمة تلقائيًا من جملة أولية وإجراء تحليل معمق قيمة للجملة الإدخال. تسخير المعلومات المهيكلة القيمة يساعد الشركات على اتخاذ قرارات حدوث وتكوين الأعمال.
نحن ندعم الوظائف التالية:
مهمة | اسم | lauguages |
---|---|---|
يكرر | استخراج مفصل علاقة الكيان | الصينية ، الإنجليزية |
نير | اسم الكيان المسمى | الصينية ، الإنجليزية |
ee | استخراج الحدث | الصينية ، الإنجليزية |
تهدف هذه المهمة إلى استخراج ثلاث مرات من النصوص العادية ، مثل (الصين ، العاصمة ، بكين) ، (《如懿传》 ، 主演 ، 周迅) .
ملاحظة: * تشير إلى اختياري ، قمنا بتعيين القيمة الافتراضية لهم. ولكن للحصول على استخراج أفضل ، يجب عليك تحديد القائمة الثلاثة وفقًا لسيناريوهات التطبيق.
الجملة: أربعة من المديرين التنفيذيين الآخرين Google ، المدير المالي ، جورج رييس ؛ نائب الرئيس الأول للعمليات التجارية ، شونا براون ؛ كبير المسؤولين القانونيين ، ديفيد دراموند ؛ ونائب الرئيس الأول لإدارة المنتجات ، حصل جوناثان روزنبرغ على رواتب قدرها 250،000 دولار لكل منها.
RTL: الافتراضي ، راجع الملف "الأنواع الافتراضية"
ouptut:
الجملة: : : 《如懿传》《如懿传》是一部古装宫廷情感电视剧 , 由汪俊执导 , 周迅、霍建华、张钧甯、董洁、辛芷蕾、童瑶、李纯、邬君梅等主演。
RTL: الافتراضي ، راجع الملف "الأنواع الافتراضية"
ouptut:
تهدف هذه المهمة إلى استخراج الكيانات من النصوص العادية ، مثل (LOC ، Beijing) ، (人物 ، 周恩来) .
الجملة: عمل جيمس مع Google في بكين ، عاصمة الصين. ETL: ['loc' ، 'misc' ، 'org' ، 'per']
ouptut:
الجملة:中国 产党创立于中华民国大陆时期 , 由陈独秀和李大钊领导组织。
ETL: ['组织机构' ، '地点' ، '人物']
ouptut:
تهدف هذه المهمة إلى استخراج الحدث من نصوص عادي ، مثل {life-divorce: {person: bob ، الوقت: اليوم ، المكان: أمريكا}} ، {竞赛行为-晋级: {时间: 无 ، 晋级方: 西北狼 ، 晋级赛事: 中甲榜首之争}} .
الجملة: أمس تم الطلاق بوب وزوجته في قوانغتشو.
ETL: افتراضي ، راجع الملف "الأنواع الافتراضية"
ouptut:
الجملة:在 2022 年卡塔尔世界杯决赛中 , 阿根廷以点球大战险胜法国。
ETL: افتراضي ، راجع الملف "الأنواع الافتراضية"
ouptut:
رد فعل+قارورة
front-end
وتركيب npm install
لتنزيل التبعيات المطلوبة.npm run start
. يجب أن تفتح Chatie في علامة تبويب متصفح جديدة.back-end
وتشغيل python run.py
نحن ملتزمون بتحسين مشروعنا وتزويدك بأفضل تجربة ممكنة. لتحقيق ذلك ، سنقوم بجمع بياناتك لمساعدتنا على فهم كيفية تفاعلك مع مشروعنا وتحديد مجالات التحسين. نحن نقدر خصوصية وأمان بياناتك وضمان البيانات فقط لأغراض تحسين مشروعنا.
الخروج من هذه الورقة arxiv: 2302.10205
@article{wei2023zero,
title={Zero-Shot Information Extraction via Chatting with ChatGPT},
author={Wei, Xiang and Cui, Xingyu and Cheng, Ning and Wang, Xiaobin and Zhang, Xin and Huang, Shen and Xie, Pengjun and Xu, Jinan and Chen, Yufeng and Zhang, Meishan and others},
journal={arXiv preprint arXiv:2302.10205},
year={2023}
}