==================================================Actualizar ==================================================== ========= El modelo entrenado se ha subido a Baidu Cloud Network Disk. Si lo necesita, puede descargarlo. En términos de velocidad de entrenamiento del modelo, con CPU y memoria de 16G, el entrenamiento se puede completar en un día ~~~
Enlace: https://pan.baidu.com/s/1hrNxaSk Contraseña: d2sn
================================================== División línea, debajo está el texto ============================================= === ==
Este artículo es una implementación simple de tensorflow de un sistema de diálogo de chatbot basado en el modelo seq2seq.
Para la explicación del código, puede consultar mi columna Zhihu:
Implementación de un sistema de diálogo de aprendizaje profundo desde cero: implementación simple de código de chatbot
El código hace referencia a DeepQA, al que se agregan la función de búsqueda de rayos y el mecanismo de atención.
El efecto final se muestra a continuación:
Pruebe el efecto, basándose en la entrada del usuario de las principales oraciones de tamaño de haz con la mayor probabilidad de respuesta:
#Cómo utilizar
1. Descargue el código localmente (la carpeta de datos ya contiene el conjunto de datos procesados, por lo que no es necesario descargar conjuntos de datos adicionales)
2. Para entrenar el modelo, cambie el parámetro decodificación en la línea 34 del archivo chatbot.py a Falso para entrenar el modelo.
(Más adelante subiré a Internet el modelo que entrené aquí para que todos lo usen)
3. Después del entrenamiento (llevará aproximadamente un día, 30 épocas), cambie el parámetro de decodificación a Verdadero.
Es hora de probar. Ingresa lo que quieras preguntar y mira lo que responde ==
Lo que también debe tenerse en cuenta aquí es recordar modificar las rutas absolutas del conjunto de datos y el archivo del modelo final; de lo contrario, se puede informar un error.
Están en tres lugares: línea 44, línea 57 y línea 82. Bien, ahora puedes divertirte ~~