Regístrese: https://goo.gl/forms/Fxy061gHuSOZGC1i2
Paquete de análisis de evaluación: 19 de enero de 2018
El paquete incluye todas las referencias generadas por 11 humanos, hipótesis de 20 sistemas y resultados de evaluación en la pista de modelado de conversaciones de extremo a extremo DSTC6. https://www.dropbox.com/s/oh1trbos0tjzn7t/dstc6_t2_evaluación.tgz
Descarga los datos oficiales de entrenamiento: 7-18 septiembre 2017
Distribución de datos de prueba: 25 de septiembre de 2017
Envío: 8 de octubre de 2017
Tarea principal (obligatoria): Diálogo de atención al cliente mediante Twitter
(*) Se proporcionan las herramientas para descargar los datos de Twitter y transformarlos al formato de diálogo a partir de los datos.
Tarea A: Se utilizarán todos o parte de los datos de entrenamiento para entrenar modelos de conversación.
Tarea B: Cualquier dato abierto, por ejemplo de la web, está disponible como conocimiento externo para generar oraciones informativas. Pero no deberían superponerse con los datos de capacitación, validación y pruebas proporcionados por los organizadores.
Tarea piloto: diálogo de escenario de película usando OpenSubtitle
Cite el siguiente artículo si publicará los resultados utilizando esta configuración:
https://arxiv.org/pdf/1706.07440.pdf
@article{DSTC6_End-to-End_Conversation_Modeling,
Author = {Chiori Hori and Takaaki Hori},
Title = {End-to-end Conversation Modeling Track in DSTC6},
Journal = {arXiv:1706.07440},
Year = {2017}
}
La mayoría de las herramientas están escritas en Python, que se probaron en python2.7.6+ y python3.4.1+, y algunos scripts bash también se utilizan para ejecutar esas herramientas.
Para la preparación de datos, necesitará módulos de Python adicionales de la siguiente manera:
que puede ser instalado por
pip install
o
pip install -t
donde
directorio> es un directorio que almacena módulos de Python y debe ser accesible desde Python, por ejemplo, incluyéndolo en la variable de entorno PYTHONPATH.
Si prueba el sistema de referencia, necesitará Chainer http://chainer.org, un conjunto de herramientas de aprendizaje profundo, para realizar el entrenamiento y la evaluación de modelos de conversación neuronal. Siga las instrucciones en ChatbotBaseline/README.md
.
Prepare el conjunto de datos utilizando los scripts collect_twitter_dialogs
.
$ cd collect_twitter_dialogs
$ collect.sh
(Se necesitan una cuenta de Twitter y claves de acceso para ejecutar el script. Siga las instrucciones en collect_twitter_dialogs/README.md
).
extraer conjuntos de capacitación, desarrollo y prueba de los datos de diálogo de Twitter almacenados
$ cd ../tasks/twitter
$ make_trial_data.sh
Nota: los datos extraídos son datos de prueba en este momento.
ejecutar el sistema de referencia (opcional)
$ cd ../../ChatbotBaseline/egs/twitter
$ run.sh
(ver ChatbotBaseline/README.md
)
descargar datos de OpenSubtitles2016
$ cd tasks/opensubs
$ wget http://opus.lingfil.uu.se/download.php?f=OpenSubtitles2016/en.tar.gz
$ tar zxvf en.tar.gz
extraer conjuntos de entrenamiento, desarrollo y prueba de los datos de subtítulos almacenados
$ make_trial_data.sh
Nota: los datos extraídos son datos de prueba en este momento.
ejecutar el sistema de referencia (opcional)
$ cd ../../ChatbotBaseline/egs/opensubs
$ run.sh
(ver ChatbotBaseline/README.md
)
Puede obtener las últimas actualizaciones y participar en debates en la lista de correo de DSTC.
Para unirse a la lista de correo, envíe un correo electrónico a: ([email protected]) poniendo "subscribe DSTC" en el cuerpo del mensaje (sin las comillas). Para publicar un mensaje, envíelo a: ([email protected]).