لقد أجرينا دراسة مستخدم طلبنا فيها من المستخدمين تقييم أهمية قراءة النصوص فيما يتعلق بسؤال الزناد. سجلنا إشارة نظر المستخدم وتصنيفات أهميتها. يحتوي هذا المستودع على مجموعة من البرامج النصية والروتين لتحميل مجموعة البيانات المسجلة ومعالجتها وتحليلها. الهدف النهائي هو تقدير أهمية المستخدم المتصورة باستخدام التعلم الآلي مع إشارة النظرة كمدخلات.
طَرد | وصف |
---|---|
data_loading | قم بتحميل مجموعة البيانات المسجلة ، أو أجزاء منه ، في بنية بيانات واحدة. قم بتحميل البيانات لكل فقرة وزيارة في الفقرة ، أي مسار فحص مستمر للفقرة التي تبدأ بنظرة أولية إلى فقرة وتنتهي عندما تترك إشارة النظرة منطقة الفقرة. |
features | استخراج الميزات المستندة إلى النظرة لمسار مسح معين. |
data | Gazere-Dataset |
راجع ملفات ReadMe معينة للحصول على معلومات أكثر تفصيلاً.
تتضمن مجموعة البيانات المسجلة تصنيفات الصلة (الصلة المتصورة) من 24
مشاركًا لـ 12
محفزًا من g-REL
Corpus و 12
محفزًا من Google NQ
Corpus. بيانات المحفزات المستخدمة في دراستنا هي أزواج من أسئلة ووثائق الزناد مع فقرات واحدة أو متعددة. نستخدم مجموعة فرعية من G-Rel Corpus [1] مع مستندات الفقرة الواحدة التي تتناسب مع صفحة واحدة وأزواج محددة من جوجل Google Natural Assopp (NQ) والتي تتضمن مستندات متعددة الفقرات تتطلب التمرير [2]. يتضمن كل من Corpora التعليقات التوضيحية ذات الصلة في الفقرة التي نشير إليها على أنها صلة النظام.
علاوة على ذلك ، خلال مهمتهم ، يتم تسجيل نظرة المشارك على الشاشة وحفظها لكل مستند.
تحتوي مجموعة البيانات المسجلة على مجلد واحد لكل مشارك في الدراسة. يشير الحرف الأول من اسم المجلد إلى مجموعة بدء تشغيل المستخدم ، ويحتوي كل مجموعة g-rel
و GoogleNQ
على مقلبه الفرعي. يتم إنشاء ملف CSV مرحلة القراءة للحافز ، يحتوي على تسجيلات نظر المشاركين على التحفيز. يسمى ملف CSV OrderID_StimulusID.csv
، مع تشير OrderID
(0-11) إلى الترتيب الذي يقرأ فيه المستخدم التحفيز. يشير StimulusID
إلى توثيق طرق عرض المستخدم. علاوة على ذلك ، يقوم ملف User_Rating
بحفظ تقدير صلة المشارك لكل محفز بعد مرحلة التصنيف.
<participant_id>
-GoogleNQ
-<OrderID_StimulusID>.csv
-User_Rating
-g-REL
-<OrderID_StimulusID>.csv
-User_Rating
['timestamp', 'gaze_x', 'gaze_y', 'gaze_y_abs', 'fixation_id', 'scroll_y', 'paragraph_id']
مجال | وصف |
---|---|
timestamp | الطابع الزمني لكل عينة نظرة في [s] |
gaze_x | موقف النظرة الأفقية |
gaze_y | موقف النظرة الرأسية |
gaze_y_abs | موقف النظرة الرأسية المطلقة في الوثيقة. (أعلى اليسار [0.0, doc_max_y] أسفل اليمين [2560.0, 0.0] ) |
fixation_id | معرف التثبيت الحالي [0, num_fixation] أو None إذا لم يكن هناك تثبيت |
scroll_y | موضع التمرير النسبي [1.0, 0.0] (أعلى: 1.0 القاع: 0.0 ) |
paragraph_id | معرف الفقرة التي تصل إليها إشارة النظرة [-2 to 6] مع -1 في إشارة إلى منطقة العنوان و -2 في إشارة إلى المساحة الخالية المتبقية و -3 في إشارة إلى زر التقييم |
الشاشة لديها دقة 2560x1440
. لذلك ، تقع جميع الأورامين X بين [0.0, 2560.0]
و Y- الأورام بين [0.0, 1440.0]
.
عند استخدام مجموعة البيانات الخاصة بنا أو تنفيذ الميزات لدينا ، يرجى الاستشهاد بالمقالة التالية:
@article{barz_implicit_2021,
title = {Implicit {Estimation} of {Paragraph} {Relevance} from {Eye} {Movements}},
issn = {2624-9898},
url = {https://www.frontiersin.org/articles/10.3389/fcomp.2021.808507},
doi = {10.3389/fcomp.2021.808507},
journal = {Frontiers in Computer Science},
author = {Barz, Michael and Bhatti, Omair Shahzad and Sonntag, Daniel},
year = {2021},
}
[1] Jacek Gwizdka. 2014. وصف الأهمية مع تدابير تتبع العين. في وقائع التفاعل بين المعلومات الخامسة في ندوة السياق (IIIX '14). رابطة آلات الحوسبة ، نيويورك ، نيويورك ، الولايات المتحدة الأمريكية ، 58-67. doi: https://doi.org/10.1145/2637002.2637011
[2] توم كوياتكوفسكي ، جينيماريا بالوماكي ، أوليفيا ريدفيلد ، مايكل كولينز ، أنكور باريك ، كريس ألبرتي ، دانييل إبشتاين ، إيليا بولوسوكين ، جاكوب ديفلين ، كينتون لي ، كريستينا توتانوفا ، ليون جونز ، ماثيو كيلسيه ، مينج واي. Dai ، Jakob Uszkoreit ، Quoc LE ، Slav Petrov ؛ الأسئلة الطبيعية: معيار للإجابة على الأسئلة. معاملات جمعية اللغويات الحاسوبية 2019 ؛ 7 453-466. doi: https://doi.org/10.1162/tacl_a_00276