Ce référentiel collecte des scripts utiles pour exécuter du code sur les clusters de calcul haute performance de l'Université technique du Danemark (DTU). Étant donné que les modules disponibles dépendent du nœud de connexion, je dois ajouter la clause de non-responsabilité selon laquelle je ne les ai personnellement utilisés et testés que sur le deuxième nœud de connexion : login2.hpc.dtu.dk. Au moment de la rédaction, le système Python par défaut (version 2.7.5) était utilisé.
Tout d’abord, connectez-vous aux serveurs DTU HPC à l’aide de ssh. Comme indiqué, je recommande le deuxième nœud de connexion. Après vous être connecté, accédez au répertoire de projet souhaité et exécutez ce qui suit pour configurer votre environnement Python, y compris Tensorflow et Keras, basé sur l'installation de CUDA 9.0. Après avoir quitté, vous pouvez, par exemple, vous connecter à un nœud GPU interactif pour exécuter votre code.
linuxsh
wget https://github.com/Algebrazebra/DTU-HPC-Scripts/raw/master/setup.sh
sh setup.sh
rm -f setup.sh
exit
Les travaux sont soumis à l'aide d'un script shell de soumission via
bsub < submit.sh
Le script shell contient les instructions destinées au gestionnaire de chargement ainsi que les commandes nécessaires pour exécuter votre code. Un exemple de script de travail est fourni avec le fichier submit.sh dans ce référentiel. Modifiez simplement le fichier selon vos besoins et vos préférences. Pour plus d'informations sur le script de travail, veuillez vous référer à la documentation officielle donnée ici : Batch Jobs.
Une fois la soumission réussie, vous pouvez vérifier l'état de vos soumissions actuelles avec
bstat