Этот репозиторий является официальным сайтом статьи ACL'23: MMDialog : крупномасштабный набор данных многоходового диалога на пути к мультимодальному диалогу в открытом домене.
Диалоговый случай MMDialog :
Статистика:
Если вы используете его в своей работе, пожалуйста, цитируйте нашу статью:
@inproceedings{feng-etal-2023- MMDialog ,
title = "{MMD}ialog: A Large-scale Multi-turn Dialogue Dataset Towards Multi-modal Open-domain Conversation",
author = "Feng, Jiazhan and Sun, Qingfeng and Xu, Can and Zhao, Pu and Yang, Yaming and Tao, Chongyang and Zhao, Dongyan and Lin, Qingwei",
booktitle = "Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = jul,
year = "2023",
address = "Toronto, Canada",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.acl-long.405",
doi = "10.18653/v1/2023.acl-long.405",
pages = "7348--7363"
}
Формат папки набора данных:
Файл: разговоры.json
Примечание:
Если вы не соответствуете всем вышеперечисленным требованиям , мы не предоставим вам набор данных.
Элемент | Описание |
---|---|
Ваше имя | [Ваше имя здесь] |
Ваша роль | [магистрант/докторант/постдок/преподаватель/научно-исследовательский работник/другие] |
Ваша учебная или рабочая организация | например, Microsoft Research, DeepMind, Корнельский университет, ... |
Ваша личная академическая домашняя страница с публикациями | Ваша [Академия Google] или [URL-адрес домашней страницы, работающий на веб-сайте вашей организации (например, yourname.people.xxx.edu / yourname.xxx.people.msr.microsoft.com)] с публикациями. |
Некоммерческое использование | Я [обещаю/не могу обещать], что не буду применять этот набор данных MMDialog к коммерческим сценариям или продуктам. |
Ограничение общего доступа | Я [обещаю/не могу обещать] Я не буду делиться этим набором данных MMDialog без вашей квалификационной проверки и разрешения. |
Ваш план | (Опишите свой план исследования и то, как вы собираетесь использовать и анализировать данные вашего исследования. >= 50 слов ). |
Затем используйте свою учебную или исследовательскую учетную запись электронной почты, чтобы отправить форму на адрес [[email protected]] для проверки. Если вы соответствуете всем требованиям, мы предоставим вам облачную папку, в которой будет храниться предварительно обработанный набор данных в течение недели. .