إطار توليدي لجسر النماذج القائمة على البيانات والنظريات العلمية في علم الأعصاب اللغوي (arXiv 2024)
شرح وحدات نص الصندوق الأسود باللغة الطبيعية مع نماذج اللغة (arXiv 2023)
يحتوي هذا الريبو على رمز لإعادة إنتاج التجارب في ورقة GEM-V وورقة SASC. تأخذ SASC وحدة نصية وتنتج شرحًا طبيعيًا لها يصف أنواع المدخلات التي تثير أكبر استجابة من الوحدة (انظر الشكل أدناه). تختبر اختبارات GEM-V ذلك بالتفصيل في إعداد الرنين المغناطيسي الوظيفي.
تشبه SASC الورقة المتزامنة الرائعة التي أعدتها OpenAI، ولكنها تبسط التفسيرات لوصف الوظيفة بدلاً من إنتاج عمليات تنشيط على مستوى الرمز المميز. وهذا يجعلها أبسط/أسرع، ويجعلها أكثر فعالية في وصف الوظائف الدلالية من البيانات المحدودة (مثل وحدات فوكسل التصوير بالرنين المغناطيسي الوظيفي) ولكنها أسوأ في العثور على الأنماط التي تعتمد على التسلسل/الترتيب.
للحصول على واجهة scikit-learn بسيطة لاستخدام SASC، استخدم مكتبة imodelsX. قم بالتثبيت باستخدام pip install imodelsx
ثم يظهر أدناه مثال للبدء السريع.
من imodelsx استيراد شرح_module_sasc# وحدة لعبة تستجيب لطول stringmod = lambda str_list: np.array([len(s) for s in str_list])# مجموعة بيانات لعبة حيث تكون السلاسل الأطول عبارة عن حيواناتtext_str_list = ["red" , "أزرق"، "x"، "1"، "2"، "فرس النهر"، "الفيل"، "وحيد القرن"]explanation_dict = شرح_module_sasc(text_str_list,mod,ngrams=1, )
انظر تجارب الرنين المغناطيسي الوظيفي ذات الصلة
بنيت من هذا القالب
@misc{antonello2024geneativeframeworkbridgedatadriven, title={إطار عمل توليدي لجسر النماذج المعتمدة على البيانات والنظريات العلمية في علم أعصاب اللغة}, المؤلف={ريتشارد أنتونيلو وتشاندان سينغ وشيلي جاين وعلياه هسو وجيانفينج جاو وبين يو وألكسندر هوث}، السنة={2024}، eprint={2410.00812}، archivePrefix={arXiv}، PrimaryClass={cs.CL} ، URL={https://arxiv.org/abs/2410.00812}, }@misc{singh2023explaining, title={شرح وحدات نص الصندوق الأسود باللغة الطبيعية مع نماذج اللغة}, المؤلف={Chandan Singh and Aliyah R. Hsu and Richard Antonello and Shailee Jain and Alexander G. Huth and Bin Yu and Jianfeng Gao}، year={2023}، eprint={2305.09863}، archivePrefix={arXiv}، basicClass={ cs.AI} }