엔드투엔드 LLM(대형 언어 모델) 부트캠프는 데이터 처리, 개발 및 배포 파이프라인 패러다임을 따르는 실제 관점에서 설계되었습니다. 참석자들은 텍스트 생성 작업을 위해 openassistant-guanaco 데이터세트를 전처리하고 사전 훈련되고 미세 조정된 LLM인 LLAMA 2 7Billion 모델을 사용하여 데이터세트를 훈련하는 워크플로를 안내합니다. 참석자는 또한 고성능 대규모 언어 모델 추론을 위한 SDK인 NVIDIA® TensorRT™ LLM을 사용하여 LLM을 최적화하고, NVIDIA NeMo Guardrails를 사용하여 LLM 모델의 가드레일 프롬프트 및 응답을 이해하고, NVIDIA TensorRT LLM 백엔드를 사용하여 AI 파이프라인을 배포하는 방법을 배우게 됩니다. (Triton™ Inference Server 기반)은 모든 워크로드에서 LLM 배포 및 실행을 표준화하는 오픈 소스 소프트웨어입니다.
이 콘텐츠에는 3개의 실습과 챌린지 노트북이 포함되어 있습니다.
Bootcamp 자료에 사용된 도구와 프레임워크는 다음과 같습니다.
총 Bootcamp 자료에는 약 7시간 30분이 소요됩니다. 자료 교육을 이틀로 나누어 한 세션에서 랩 1~3을 다루고 다음 세션에서 나머지를 다루는 것이 좋습니다.
Lab을 배포하려면 여기에 제시된 배포 가이드를 참조하세요.
이 자료는 OpenHackathons Github 저장소에서 가져왔습니다. 추가 자료는 여기서 확인하세요
추가 Open Hackathons 리소스를 확인하고 OpenACC 및 Hackathons Slack 채널에 가입하여 경험을 공유하고 커뮤니티에서 더 많은 도움을 받는 것을 잊지 마십시오.
저작권 © 2024 OpenACC-Standard.org. 이 자료는 Creative Commons Attribution 4.0 International(CC BY 4.0)에 따라 NVIDIA Corporation과 협력하여 OpenACC-Standard.org에서 공개되었습니다. 이러한 자료에는 다른 기업이 개발한 하드웨어 및 소프트웨어에 대한 참조가 포함될 수 있습니다. 해당하는 모든 라이센스 및 저작권이 적용됩니다.