lbann
v0.104
Livermore 大型人工神经网络工具包 (LBANN) 是一个开源、以 HPC 为中心的深度学习训练框架,经过优化可构成多个级别的并行性。
LBANN 通过域分解提供模型并行加速,以优化网络训练的强大扩展。它还允许将模型并行性与数据并行性和集成训练方法组合起来,以使用大量数据训练大型神经网络。 LBANN 能够利用紧耦合加速器、低延迟高带宽网络和高带宽并行文件系统。
除了传统的监督学习之外,LBANN 还支持最先进的训练算法,例如无监督、自监督和对抗性 (GAN) 训练方法。它还通过时间反向传播 (BPTT) 训练、迁移学习以及多模型和集成训练方法来支持循环神经网络。
LBANN 用户安装 LBANN 的首选方法是使用 Spack。经过一些系统配置后,这应该像下面一样简单
spack install lbann
有关构建和安装 LBANN 的更多详细说明,请参阅主要 LBANN 文档。
运行LBANN的基本模板是
< mpi-launcher > < mpi-options >
lbann < lbann-options >
--model=model.prototext
--optimizer=opt.prototext
--reader=data_reader.prototext
使用 GPGPU 加速器时,用户应该意识到 LBANN 针对每个 MPI等级分配一个 GPU 的情况进行了优化。在选择 MPI 启动器的参数时应牢记这一点。
有关运行 LBANN 的更多详细信息记录在此处。
此处显示了出版物、演示文稿和海报的列表。
可以在 Github 问题跟踪器上提出问题、疑问和错误。