Bootcamp LLM (Model Bahasa Besar) End-to-End dirancang dari perspektif dunia nyata yang mengikuti paradigma pipa pemrosesan, pengembangan, dan penerapan data. Peserta mempelajari alur kerja pemrosesan awal kumpulan data openassistant-guanaco untuk tugas Pembuatan Teks dan melatih kumpulan data menggunakan Model LLAMA 2 7 Miliar, sebuah LLM yang telah dilatih sebelumnya dan disempurnakan. Peserta juga akan belajar mengoptimalkan LLM menggunakan NVIDIA® TensorRT™ LLM, sebuah SDK untuk inferensi model bahasa besar berperforma tinggi, memahami perintah dan respons pagar pembatas dari model LLM menggunakan NVIDIA NeMo Guardrails, dan menerapkan pipeline AI menggunakan NVIDIA TensorRT LLM Backend (didukung oleh Triton™ Inference Server), perangkat lunak sumber terbuka yang menstandarkan penerapan dan eksekusi LLM di setiap beban kerja.
Konten ini berisi tiga Lab, ditambah buku catatan tantangan:
Adapun tools dan framework yang digunakan pada materi Bootcamp adalah sebagai berikut:
Total materi Bootcamp akan memakan waktu kurang lebih 7 jam 30 menit. Sebaiknya materi pengajaran dibagi menjadi dua hari, meliputi Lab 1-3 dalam satu sesi dan sisanya pada sesi berikutnya.
Untuk menerapkan Lab, lihat panduan penerapan yang disajikan di sini
Materi ini berasal dari repositori OpenHackathons Github. Lihat materi tambahan di sini
Jangan lupa untuk melihat Sumber Daya Open Hackathons tambahan dan bergabunglah dengan OpenACC dan Hackathons Slack Channel kami untuk berbagi pengalaman Anda dan mendapatkan lebih banyak bantuan dari komunitas.
Hak Cipta © 2024 OpenACC-Standard.org. Materi ini dirilis oleh OpenACC-Standard.org, bekerja sama dengan NVIDIA Corporation, di bawah Creative Commons Attribution 4.0 International (CC BY 4.0). Materi ini dapat mencakup referensi terhadap perangkat keras dan perangkat lunak yang dikembangkan oleh entitas lain; semua lisensi dan hak cipta yang berlaku berlaku.