nnl 다운로드 - nnl 소스 코드 다운로드

nnl

AI 소스 코드

gpt2-xl assets

다운로드

신경망 논리

nnl 은 저메모리 GPU 플랫폼의 대규모 모델을 위한 추론 엔진입니다.

내용물

소개
라이브러리 구축
GPT2-XL 예시
로드맵
특허
감사의 말

소개

큰 모델은 너무 커서 GPU 메모리에 맞지 않습니다. nnl PCIE 대역폭과 메모리 간의 균형을 통해 이 문제를 해결합니다.

일반적인 추론 파이프라인은 다음과 같습니다.

모델을 사용하여 계산 그래프를 작성합니다. $n$ 노드
계산 그래프의 각 노드를 토폴로지 정렬하여 계산 테이블을 만듭니다.
[1, 2, 3, ..., n]의 i에 대해:
- 다음 작업을 비동기적으로 실행
  - 노드 i의 출력을 계산합니다.
  - 노드 i+1의 GPU에 가중치를 로드합니다.
  - 노드 i+1에 GPU 메모리(출력 텐서 및 캐시)를 할당합니다.
  - 노드 i-1에 대한 GPU 메모리(출력 텐서, 가중치 및 캐시) 할당 해제

NNIL은 GPU 메모리 풀과 메모리 조각 모음을 통해 저사양 GPU 플랫폼에서 대규모 모델을 추론하는 것을 가능하게 합니다.

라이브러리 구축

이것은 단지 몇 주 만에 작성한 취미 프로젝트이며, 현재는 CUDA 백엔드만 지원됩니다.

테스트됨

gcc 13.2.1
쿠다 12.2
cudnn 8.9.2.26

정적 라이브러리 빌드

nnl _cuda_kernels.a">

make lib nnl _cuda.a && make lib nnl _cuda_kernels.a

이 명령은 lib/lib nnl _cuda.a 및 lib/lib nnl _cuda_kernels.a 라는 두 개의 정적 라이브러리를 빌드합니다. 첫 번째는 C++의 CUDA 백엔드가 있는 핵심 라이브러리이고, 두 번째는 CUDA 커널용입니다.

GPT2-XL 예시

GPT2-XL(1.6B)의 데모 프로그램이 여기에 제공됩니다. 이 프로그램은 다음 명령으로 컴파일할 수 있습니다.

make gpt2_1558m

릴리스에서 모든 가중치를 다운로드한 후 GTX 1050(2GB 메모리)과 같은 저사양 GPU 플랫폼에서 다음 명령을 실행할 수 있습니다.

./bin/gpt2_1558m --max_len 20  " Hi. My name is Feng and I am a machine learning engineer "

그리고 출력은 다음과 같습니다:

면책조항: 이것은 단지 gpt2-xl에 의해 생성된 예일 뿐입니다. 저는 Google에서 일하지 않으며 Randi를 모릅니다.

그리고 GPU 메모리 액세스 패턴을 찾을 수 있습니다

로드맵

int8 지원
더 많은 레이어
더 많은 예제 애플리케이션
작은 모델의 경우 무게 지속성

특허

PeaceOSL

감사의 말

원플로우
nlohmann_json
spdlog

왜 nnl 인가?

확장하다

추가 정보

버전 gpt2-xl assets
유형 AI 소스 코드
업데이트 시간 2024-12-30
크기 50MB
출처 Github

nnl

신경망 논리

내용물

소개

라이브러리 구축

테스트됨

정적 라이브러리 빌드

GPT2-XL 예시

로드맵

특허

감사의 말

왜 nnl 인가?

node telegram bot api

typebot.io

python wechaty getting started

TranscriberBot

genal chat

Facemoji

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions