O kit de ferramentas Livermore Big Artificial Neural Network (LBANN) é uma estrutura de treinamento de aprendizado profundo de código aberto, centrada em HPC, otimizada para compor vários níveis de paralelismo.
LBANN fornece aceleração paralela de modelo por meio de decomposição de domínio para otimizar o forte dimensionamento do treinamento de rede. Ele também permite a composição do paralelismo de modelos com paralelismo de dados e métodos de treinamento de conjuntos para treinar grandes redes neurais com grandes quantidades de dados. LBANN é capaz de aproveitar aceleradores fortemente acoplados, redes de baixa latência e alta largura de banda e sistemas de arquivos paralelos de alta largura de banda.
LBANN oferece suporte a algoritmos de treinamento de última geração, como métodos de treinamento não supervisionados, autossupervisionados e adversários (GAN), além do aprendizado supervisionado tradicional. Ele também oferece suporte a redes neurais recorrentes por meio de treinamento de retropropagação ao longo do tempo (BPTT), aprendizagem por transferência e métodos de treinamento de múltiplos modelos e conjuntos.
O método preferido para usuários do LBANN instalarem o LBANN é usar o Spack. Depois de alguma configuração do sistema, isso deve ser tão simples quanto
spack install lbann
Instruções mais detalhadas para construir e instalar o LBANN estão disponíveis na documentação principal do LBANN.
O modelo básico para executar o LBANN é
< mpi-launcher > < mpi-options >
lbann < lbann-options >
--model=model.prototext
--optimizer=opt.prototext
--reader=data_reader.prototext
Ao usar aceleradores GPGPU, os usuários devem estar cientes de que o LBANN é otimizado para o caso em que se atribui uma GPU por classificação MPI. Isso deve ser levado em consideração ao escolher os parâmetros do inicializador MPI.
Mais detalhes sobre a execução do LBANN estão documentados aqui.
Uma lista de publicações, apresentações e pôsteres é mostrada aqui.
Problemas, dúvidas e bugs podem ser levantados no rastreador de problemas do Github.