Este repositorio recopila scripts útiles para ejecutar código en los clústeres informáticos de alto rendimiento de la Universidad Técnica de Dinamarca (DTU). Dado que los módulos disponibles dependen del nodo de inicio de sesión, debo agregar el descargo de responsabilidad de que personalmente solo los usé y probé en el segundo nodo de inicio de sesión: login2.hpc.dtu.dk. En el momento de escribir este artículo, se utilizaba el sistema predeterminado Python (versión 2.7.5).
Primero, conéctese con los servidores DTU HPC mediante ssh. Como se indicó, recomiendo el segundo nodo de inicio de sesión. Después de iniciar sesión, navegue hasta el directorio de su proyecto deseado y ejecute lo siguiente para configurar su entorno Python, incluidos Tensorflow y Keras, según la instalación de CUDA 9.0. Después de salir, puede, por ejemplo, iniciar sesión en un nodo GPU interactivo para ejecutar su código.
linuxsh
wget https://github.com/Algebrazebra/DTU-HPC-Scripts/raw/master/setup.sh
sh setup.sh
rm -f setup.sh
exit
Los trabajos se envían mediante un script de shell de envío a través de
bsub < submit.sh
El script de shell contiene las instrucciones para el controlador de carga, así como los comandos necesarios para ejecutar su código. Se proporciona un script de trabajo de muestra con el archivo submit.sh en este repositorio. Simplemente modifique el archivo según sus necesidades y gustos. Para obtener más información sobre el guión del trabajo, consulte la documentación oficial que se proporciona aquí: Trabajos por lotes.
Tras el envío exitoso, puede verificar el estado de sus envíos actuales con
bstat