Мы провели исследование пользователя, в котором мы попросили пользователей оценить актуальность чтения текстов в отношении триггерного вопроса. Мы записали сигнал взгляда пользователя и его релевантные рейтинги. Этот репозиторий содержит набор сценариев и процедур для загрузки, обработки и анализа записанного набора данных. Конечная цель состоит в том, чтобы оценить воспринимаемую релевантность пользователя с использованием машинного обучения с помощью сигнала взгляда в качестве ввода.
упаковка | описание |
---|---|
data_loading | Загрузите записанный набор данных или его части, в одну структуру данных. Данные о загрузке в соответствии с параграфом и посещение параграфа, то есть непрерывное сканирование для параграфа, которое начинается с первоначального взгляда в абзац и заканчивается, когда сигнал взгляда покидает область абзаца. |
features | Извлечение функций на основе взгляда для определенного сканирования. |
data | Gazere-Dataset |
Смотрите конкретные файлы Readme для более подробной информации.
Записанный набор данных включает в себя рейтинги релевантности (воспринимаемая актуальность) от 24
участников для 12
стимулов из корпуса g-REL
и 12
стимулов из корпуса Google NQ
. Данные стимулов, используемые в нашем исследовании, представляют собой пары запускных вопросов и документов с одним или несколькими параграфами. Мы используем подмножество из корпуса G-Rel [1] с одноправленными документами, которые подходят на одной странице и выбранные пары из корпуса Google Natural Ofters (NQ), который включает в себя многогранные документы, которые требуют прокрутки [2]. Обе корпуса включают в себя аннотации актуальности на параграф, который мы называем релевантностью системы.
Кроме того, на протяжении всего их задачи взгляд участника на экране записан и сохраняется для каждого документа.
Записанный набор данных содержит одну папку для каждого участника исследования. Первая буква имени папки обозначает начальное корпус пользователя, и каждый корпус g-rel
и GoogleNQ
имеет подпапку. Файл CSV создается фаза чтения стимула, содержащая записи участников на стимул. Файл CSV называется OrderID_StimulusID.csv
, с OrderID
(0-11), указывающим порядок, в котором пользователь читает стимул. StimulusID
обозначает, какие документируют представления пользователя. Кроме того, файл User_Rating
сохраняет оценку актуальности участника для каждого стимула после фазы рейтинга.
<participant_id>
-GoogleNQ
-<OrderID_StimulusID>.csv
-User_Rating
-g-REL
-<OrderID_StimulusID>.csv
-User_Rating
['timestamp', 'gaze_x', 'gaze_y', 'gaze_y_abs', 'fixation_id', 'scroll_y', 'paragraph_id']
поле | описание |
---|---|
timestamp | Неэппаратная метка для каждого образца взгляда в [s] |
gaze_x | Горизонтальное положение взгляда |
gaze_y | Положение вертикального взгляда |
gaze_y_abs | Абсолютное вертикальное положение взгляда в документе. (Вверху слева [0.0, doc_max_y] внизу справа [2560.0, 0.0] ) |
fixation_id | Идентификатор текущей фиксации [0, num_fixation] или None если нет фиксации |
scroll_y | Относительное положение прокрутки [1.0, 0.0] (вверху: 1.0 внизу: 0.0 ) |
paragraph_id | Идентификатор абзаца, который попадает в сигнал взгляда [-2 to 6] с -1 ссылаясь на область заголовка и -2 относящиеся к оставшемуся свободному пространству и -3 ссылаясь на кнопку оценки |
Экран имеет разрешение 2560x1440
. Следовательно, все X-координаты лежат между [0.0, 2560.0]
и Y-координатами между [0.0, 1440.0]
.
При использовании нашего набора данных или реализации нашей функции указать следующую статью:
@article{barz_implicit_2021,
title = {Implicit {Estimation} of {Paragraph} {Relevance} from {Eye} {Movements}},
issn = {2624-9898},
url = {https://www.frontiersin.org/articles/10.3389/fcomp.2021.808507},
doi = {10.3389/fcomp.2021.808507},
journal = {Frontiers in Computer Science},
author = {Barz, Michael and Bhatti, Omair Shahzad and Sonntag, Daniel},
year = {2021},
}
[1] Jacek Gwizdka. 2014. Характеристика актуальности с мерами отслеживания глаз. В материалах 5 -го информационного взаимодействия в контекстном симпозиуме (IIIX '14). Ассоциация компьютерной машины, Нью -Йорк, Нью -Йорк, США, 58–67. Doi: https://doi.org/10.1145/2637002.2637011
[2] Том Квиатковски, Дженнимария Паломаки, Оливия Редфилд, Майкл Коллинз, Анкур Парих, Крис Альберти, Даниэль Эпштейн, Илья Полосухин, Джейкоб Девлин, Кентон Ли, Кристина Тутанова, Ллион Джонс, Маттью-Келс, Минг-Вэй Чанг. Dai, Jakob Uszkoreit, Quoc Le, Slav Petrov; Природные вопросы: эталон для вопросов, отвечающий на исследования. Транзакции Ассоциации вычислительной лингвистики 2019; 7 453–466. doi: https://doi.org/10.1162/tacl_a_00276