استنادًا إلى الخصائص الست للصحة النشطة: المبادرة، والوقاية، والدقة، والتخصيص، والبناء المشترك والمشاركة، والانضباط الذاتي، قامت كلية تكنولوجيا المستقبل بجامعة جنوب الصين للتكنولوجيا - المختبر الرئيسي لمقاطعة قوانغدونغ للتوائم الرقمية بإنشاء مصادر مفتوحة. النظام الصحي النشط لمساحة المعيشة في المجال الصيني قاعدة النموذج ProactiveHealthGPT، بما في ذلك:
BianQue، وهو نموذج صحي لمساحة معيشة كبيرة تم ضبطه بواسطة عشرات الملايين من تعليمات بيانات الحوار الصحي الصينية
تم تحسين نموذج الصحة العقلية واسع النطاق SoulChat من خلال تعليمات مشتركة مع تعليمات نصية صينية طويلة وجولات متعددة من بيانات الحوار التعاطفي في مجال ملايين الاستشارات النفسية.
نأمل أن تساعد قاعدة النماذج الكبيرة ProactiveHealthGPT لمساحة المعيشة الصحية النشطة المجتمع الأكاديمي في تسريع البحث وتطبيق النماذج الكبيرة في مجالات الصحة النشطة مثل الأمراض المزمنة والاستشارة النفسية. هذا المشروع هو SoulChat، وهو نموذج كبير للصحة العقلية .
2024.06.06: تم إصدار النسخة مفتوحة المصدر من مجموعة بيانات SoulChatCorpus للحصول على التفاصيل، يرجى الاطلاع على https://www.modelscope.cn/datasets/YIRONGCHEN/SoulChatCorpus، خاصة. ، لقد قمنا بتصفية حوالي 90000 عينة محادثة (بسبب مخاطر الخصوصية، وقضايا الأمان، والمخاطر السياسية، والعينات منخفضة الجودة، وما إلى ذلك، لا تزال هذه العينات في مرحلة التحسين اليدوي، وسيتم تحديثها إلى الإصدار مفتوح المصدر من مجموعة البيانات بعد اكتمال المراجعة اليدوية)، مع الاحتفاظ في النهاية بـ 258,354 محادثة متعددة الجولات، بإجمالي 1,517,344 جولة. سيتم إصدار نسخة جديدة من النموذج في المستقبل القريب، ومن المتوقع أن يتم تكييفها مع نماذج متعددة مفتوحة المصدر ومستويات معلمات متعددة لتسهيل استخدام المستخدم أو إجراء أبحاث تجريبية مقارنة.
2023.12.07: ورقتنا، المضمنة في نتائج EMNLP 2023، راجع SoulChat: تحسين قدرات التعاطف والاستماع والراحة لدى LLMs من خلال الضبط الدقيق مع محادثات التعاطف متعددة المنعطفات
2023.07.07: تم إطلاق النسخة التجريبية المغلقة عبر الإنترنت من نموذج الصحة العقلية الكبير SoulChat. مرحبًا بك للنقر على الرابط للاستخدام: النسخة التجريبية المغلقة من SoulChat.
2023.06.24: تم إدراج هذا المشروع في قائمة النماذج الصينية الكبيرة وهو أول نموذج كبير محلي مفتوح المصدر في المجال النفسي يتمتع بقدرات التعاطف والاستماع.
2023.06.06: نموذج BianQue-2.0 مفتوح المصدر لمزيد من التفاصيل، راجع BianQue-2.0.
2023.06.06: تم إصدار SoulChat، وهو نموذج كبير للصحة الروحية يتمتع بالقدرة على التعاطف والاستماع. للحصول على التفاصيل، راجع: SoulChat، نموذج كبير للصحة الروحية: من خلال الضبط الدقيق المختلط لتعليمات الاستشارة النصية الطويلة وجولات متعددة من مجموعات بيانات الحوار التعاطفي، تم تحسين أداء النموذج لقدرة "التعاطف".
2023.04.22: عرض توضيحي لنظام الأسئلة والأجوبة الطبية بناءً على نموذج Bianque-1.0 لمزيد من التفاصيل، تفضل بزيارة: https://huggingface.co/spaces/scutcyr/BianQue
2023.04.22: تم إصدار نموذج الإصدار BianQue-1.0 للحصول على التفاصيل، راجع: BianQue-1.0: تحسين قدرة "الطلب" لنموذج الدردشة الطبية من خلال التعليمات المختلطة والضبط الدقيق لجولات متعددة من مجموعات بيانات استفسار الطبيب (BianQue- 1.0: تحسين قدرة "السؤال" لنموذج الدردشة الطبية من خلال الضبط باستخدام التعليمات المختلطة ومجموعات بيانات ضمان الجودة للطبيب متعددة المنعطفات)
لقد بحثنا في منصات الاستشارة النفسية الشائعة الحالية ووجدنا أنه عندما يطلب المستخدمون المساعدة النفسية عبر الإنترنت، فإنهم عادةً ما يحتاجون إلى وصف أنفسهم بطريقة طويلة، ومن ثم يقدم المستشارون النفسيون الذين يقدمون المساعدة أيضًا ردًا طويلًا (انظر الشكل/single_turn.png) ، في عداد المفقودين عملية الثقة التقدمية. ومع ذلك، في عملية الاستشارة النفسية الفعلية، ستكون هناك جولات متعددة من عمليات التواصل بين المستخدم والمرشد النفسي، وخلال هذه العملية، سيقوم المستشار النفسي بتوجيه المستخدم للتحدث وتقديم التعاطف، مثل: "إنه أمر رائع". ، "أنا أفهم ما تشعر به"، "بالطبع يمكنك ذلك"، وما إلى ذلك (انظر الصورة أدناه).
بالنظر إلى النقص الحالي في مجموعات بيانات الحوار التعاطفي متعدد المنعطفات، من ناحية، قمنا ببناء نص طويل من جولة واحدة لتعليمات وإجابات الاستشارة النفسية (SoulChatCorpus-single_turn) بمقياس يزيد عن 150.000، وتجاوز عدد الإجابات 500000 (عدد التعليمات هو 6.7 مرة حاليًا مجموعة بيانات الاستشارة النفسية الشائعة PsyQA)، واستخدمت ChatGPT وGPT4 لإنشاء إجمالي حوالي مليون جولة من بيانات الإجابات متعددة الجولات (SoulChatCorpus-multi_turn) . على وجه الخصوص، وجدنا في التجربة المسبقة أن نموذج الاستشارة النفسية البحتة ذات الجولة الواحدة والمعتمد على مقالات طويلة سينتج نصًا طويلًا مملًا للمستخدمين، وليس لديه القدرة على توجيه المستخدمين إلى التحدث بشكل متعدد بحت نموذج الإرشاد النفسي القائم على الحوار القائم على البيانات يضعف النموذج قدرة التوصية للنموذج، لذلك، قمنا بخلط SoulChatCorpus-single_turn وSoulChatCorpus-multi_turn لإنشاء مجموعة بيانات حوار تعاطفي مختلطة ذات جولة واحدة ومتعددة الجولات SoulChatCorpus مع المزيد. أكثر من 1.2 مليون عينة . يتم توحيد جميع البيانات في تنسيق أمر واحد في شكل "المستخدم: المستشار النفسي xxxn: المستخدم xxxn: المستشار النفسي xxxn:".
لقد اخترنا ChatGLM-6B كنموذج للتهيئة وأجرينا ضبطًا دقيقًا لجميع المعلمات لتحسين قدرة النموذج على التعاطف وتوجيه المستخدمين للتحدث وتقديم اقتراحات معقولة. لمزيد من تفاصيل التدريب، يرجى الانتباه إلى أوراقنا اللاحقة.
استنساخ هذا المشروع
cd ~ git clone https://github.com/scutcyr/SoulChat.git
عند تثبيت التبعيات، يرجى ملاحظة أنه يجب تحديد إصدار torch بناءً على إصدار cuda الفعلي لخادمك للحصول على التفاصيل، راجع دليل تثبيت pytorch.
قرص مضغوط SoulChat conda env create -n proactivehealthgpt_py38 --file proactivehealthgpt_py38.yml كوندا تفعيل proactivehealthgpt_py38 تثبيت النقطة cpm_kernels شعلة تثبيت النقطة ==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116
[ملحق] يُنصح مستخدمو Windows بالرجوع إلى العملية التالية لتكوين البيئة.
cdBianQue conda create -n proactivehealthgpt_py38 python=3.8 كوندا تفعيل proactivehealthgpt_py38 شعلة تثبيت النقطة ==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116 تثبيت النقطة -r متطلبات.txt pip install rouge_chinese nltk jieba datasets# التثبيت التالي هو تشغيل demoopip installstreamlit تثبيت النقطةstreamlit_chat
[ملحق] تكوين CUDA-11.6 ضمن Windows: قم بتنزيل CUDA-11.6 وتثبيته، وتنزيل cudnn-8.4.0، وفك ضغط الملفات ونسخها إلى المسار المطابق لـ CUDA-11.6، راجع: استخدام conda لتثبيت pytorch ضمن win11-cuda11 6- أفكار تركيبية عامة
استدعاء نموذج SoulChat في بايثون
استيراد الشعلة من المحولات import AutoModel, AutoTokenizer# إعدادات GPU الجهاز = torch.device("cuda" if torch.cuda.is_available() else "cpu")# تحميل النموذج باستخدام الرمز المميز model_name_or_path = 'scutcyr/SoulChat' model = AutoModel.from_pretrained( model_name_or_path , Trust_remote_code=True).half()model.to(device)tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, Trust_remote_code=True)# يستدعي الحوار أحادي الجولة وظيفة الدردشة للنموذج user_input = "أنا متيم، غير مريح للغاية!" = "المستخدم:" + user_input + "المستشار النفسي:"الاستجابة والتاريخ = model.chat(tokenizer, query=input_text, History=None, max_length=2048, num_beams=1, do_sample=True, top_p=0.75, درجة الحرارة=0.95, logits_processor=None)# اتصل بوظيفة الدردشة الخاصة بالنموذج لجولات متعددة من حوار# ملحوظة: يستخدم هذا المشروع "n users:" و"n psychoconsultation:" لتقسيم سجل المحادثات للجولات المختلفة# ملحوظة: user_history أطول من bot_history 1user_history = ['مرحبًا، يا معلم', 'صديقتي انفصلت عني وأشعر بعدم الارتياح']bot_history = ['مرحبًا! أنا مستشارك الرقمي الشخصي، عزيزي المعلم، نرحب بك للتحدث معي وإجراء محادثة من القلب إلى القلب، وأنا أتطلع إلى مساعدتك. ']# ربط سجل المحادثة context = "n".join([f"User: {user_history[i]}n المستشار النفسي: {bot_history[i]}" for i in range(len(bot_history))])input_text = سياق + "nuser:" + user_history[-1] + استجابة "المستشار النفسي:"، التاريخ = model.chat(tokenizer, query=input_text, التاريخ = لا شيء، الحد الأقصى للطول = 2048، num_beams = 1، do_sample = صحيح، top_p = 0.75، درجة الحرارة = 0.95، logits_processor = لا شيء)
ابدأ الخدمة
يقدم هذا المشروع Soulchat_app.py كمثال لاستخدام نموذج SoulChat. يمكنك بدء الخدمة من خلال الأمر التالي، ثم الوصول إليها من خلال http://<your_ip>:9026.
تشغيل Streamlit Soulchat_app.py --server.port 9026
على وجه الخصوص، في Soulchat_app.py، يمكنك تعديل التعليمات البرمجية التالية لاستبدال بطاقة الرسومات المحددة:
os.environ['CUDA_VISIBLE_DEVICES'] = '2'
بالنسبة لمستخدمي بطاقة الرسومات الفردية لنظام التشغيل Windows، يتعين عليك تعديلها إلى: os.environ['CUDA_VISIBLE_DEVICES'] = '0'
، وإلا سيتم الإبلاغ عن خطأ!
يمكنك تحديد مسار النموذج ليكون مسارًا محليًا عن طريق تغيير الكود التالي:
model_name_or_path = 'scutcyr/SoulChat'
مثال 1: ضاع في الحب
مثال 2: علاقة السكن
مثال 3: الامتحان النهائي
مثال 4: ضغط البحث العلمي
يستخدم هذا المشروع أوزان نموذج ChatGLM-6B ويحتاج إلى اتباع MODEL_LICENSE الخاص به، لذلك لا يمكن استخدام هذا المشروع إلا لأغراضك البحثية غير التجارية .
نموذج SoulChat الذي يقدمه هذا المشروع مخصص لتحسين الحوار التعاطفي وقدرات الاستماع للنماذج الكبيرة، ومع ذلك، فإن النص الناتج للنموذج لديه درجة معينة من العشوائية، وهو مناسب عند استخدامه كمستمع، ولكنه كذلك. لا يُنصح باستخدام نموذج SoulChat. يحل النص الناتج محل التشخيص والمشورة التي يقدمها طبيب نفساني، وما إلى ذلك. لا يضمن هذا المشروع أن يكون النص الناتج بواسطة النموذج مناسبًا تمامًا للمستخدمين. يجب على المستخدمين تحمل جميع المخاطر عند استخدام هذا النموذج!
لا يجوز لك استخدام أو نسخ أو تعديل أو دمج أو نشر أو توزيع أو إعادة إنتاج أو إنشاء أعمال مشتقة من نموذج SoulChat، كليًا أو جزئيًا، لأي غرض تجاري أو عسكري أو غير قانوني.
لا يجوز لك استخدام نموذج SoulChat للانخراط في أي سلوك يعرض الأمن القومي والوحدة الوطنية للخطر، أو يعرض المصالح الاجتماعية والعامة للخطر، أو ينتهك الحقوق الشخصية.
عند استخدام نموذج SoulChat، يجب أن تدرك أنه لا يمكن أن يحل محل المهنيين مثل الأطباء وعلماء النفس، ويجب ألا تعتمد بشكل مفرط على مخرجات النموذج أو تطيعها أو تؤمن بها، ويجب ألا تدمن الدردشة مع SoulChat. نموذج لفترة طويلة.
بدأ هذا المشروع مختبر مفتاح مقاطعة قوانغدونغ للتوائم الرقمية، كلية تكنولوجيا المستقبل، جامعة جنوب الصين للتكنولوجيا، ويدعمه مركز أبحاث هندسة شبكات المعلومات، كلية الإلكترونيات والمعلومات وأقسام أخرى بجامعة جنوب الصين للتكنولوجيا كما تشكر مستشفى قوانغدونغ لصحة الأم والطفل، والوحدات المتعاونة التابعة لحكومة بلدية قوانغتشو، بما في ذلك المركز الطبي للنساء والأطفال، والمستشفى الثالث التابع لجامعة صن يات صن، ومعهد أبحاث الذكاء الاصطناعي التابع لمركز العلوم الوطني الشامل في خفي.
في الوقت نفسه، نود أن نشكر وسائل الإعلام أو الحسابات العامة التالية على الإبلاغ عن هذا المشروع (بدون ترتيب معين):
تغطية إعلامية: People's Daily، China.com، Guangming.com، TOM Technology، Future.com، Dazhong.com، شبكة تقارير التنمية الصينية، شبكة تشاينا ديلي، شبكة أخبار شينهوا، China.com، Toutiao، Sohu، Tencent News، NetEase News. ، شبكة المعلومات الصينية، شبكة الاتصالات الصينية، شبكة تقارير مدينة الصين، شبكة مدينة الصين
إنشاء مختبر قوانغدونغ للحساب العام، الصوت الذكي للشباب الجديد، التعلم العميق والبرمجة اللغوية العصبية، AINLP
@inproceedings{chen-etal-2023-soulchat,title = "قبعة {S}oul{C}: تحسين قدرات التعاطف والاستماع والراحة من خلال الضبط الدقيق من خلال محادثات التعاطف متعددة المنعطفات"، المؤلف = "تشن وييرونغ وشينغ وشياوفين ولين وجينغكاي وتشنغ وهويمين ووانغ وتشنيو وليو وتشى وشو، شيانغمين"، محرر = "بوعمر، هدى وبينو، خوان وبالي، كاليكا"، عنوان الكتاب = "نتائج جمعية اللغويات الحاسوبية: EMNLP 2023"، الشهر = ديسمبر، السنة = "2023"، العنوان = "سنغافورة"، Publisher = "جمعية اللغويات الحاسوبية"، URL = "https://aclanthology.org/2023.findings-emnlp.83"،pages = "1170--1183"،abstract = "تم تطبيق نماذج اللغات الكبيرة (LLMs) على نطاق واسع في مجالات مختلفة نظرًا لقدرتها الممتازة على الحفظ المعرفة وسلسلة التفكير (CoT) عندما يتم تطبيق هذه النماذج اللغوية في مجال الاستشارة النفسية، فإنها غالبًا ما تسارع إلى تقديم المشورة العالمية، ومع ذلك، عندما يبحث المستخدمون عن الدعم النفسي، فإنهم يحتاجون إلى اكتساب التعاطف. الثقة والتفاهم والراحة، بدلاً من مجرد نصيحة معقولة. ولتحقيق هذه الغاية، قمنا ببناء مجموعة بيانات محادثة متعاطفة متعددة المنعطفات تضم أكثر من مليوني عينة، حيث يكون المدخل هو سياق المحادثة متعدد المنعطفات، والهدف هو الاستجابات المتعاطفة. التي تغطي تعبيرات مثل التساؤل، والراحة، والاعتراف، والاستماع، والثقة، والدعم العاطفي، وما إلى ذلك. وقد أظهرت التجارب أن قدرة التعاطف لدى LLMs يمكن تعزيزها بشكل كبير عند ضبطها باستخدام تاريخ الحوار متعدد المنعطفات والاستجابات الأقرب إلى التعبير. للاستشاري النفسي." }}