DTU HPC Scripts
1.0.0
このリポジトリは、デンマーク工科大学 (DTU) のハイ パフォーマンス コンピューティング クラスターでコードを実行するための便利なスクリプトを収集します。使用可能なモジュールはログイン ノードに依存するため、私が個人的に使用し、2 番目のログイン ノード (login2.hpc.dtu.dk) でのみテストしたという免責事項を追加する必要があります。執筆時点では、デフォルトのシステム Python (バージョン 2.7.5) が使用されました。
まず、ssh を使用して DTU HPC サーバーに接続します。前述したように、2 番目のログイン ノードをお勧めします。ログイン後、目的のプロジェクト ディレクトリに移動し、次のコマンドを実行して、CUDA 9.0 インストールに基づいて Tensorflow と Keras を含む Python 環境をセットアップします。終了後、たとえば、インタラクティブ GPU ノードにログインしてコードを実行できます。
linuxsh
wget https://github.com/Algebrazebra/DTU-HPC-Scripts/raw/master/setup.sh
sh setup.sh
rm -f setup.sh
exit
ジョブは、次の送信シェル スクリプトを使用して送信されます。
bsub < submit.sh
シェル スクリプトには、ロード ハンドラーの命令と、コードを実行するために必要なコマンドが含まれています。サンプル ジョブ スクリプトは、このリポジトリの submit.sh ファイルとともに提供されます。必要に応じてファイルを変更するだけです。ジョブ スクリプトの詳細については、公式ドキュメント「バッチ ジョブ」を参照してください。
送信が成功すると、現在の送信ステータスを確認できます。
bstat