Dengan menggunakan desain 3 pipa, inilah yang akan Anda pelajari dalam kursus ini ↓
Saluran pelatihan yang:
Alur pelatihan disebarkan menggunakan Beam sebagai infrastruktur GPU tanpa server.
-> Ditemukan di bawah direktori modules/training_pipeline
.
Catatan: Jangan khawatir jika Anda tidak memiliki persyaratan perangkat keras minimum. Kami akan menunjukkan kepada Anda cara menerapkan jalur pelatihan ke infrastruktur tanpa server Beam dan melatih LLM di sana.
Saluran fitur real-time yang:
Pipa streaming secara otomatis diterapkan pada mesin AWS EC2 menggunakan pipa CI/CD yang dibangun di tindakan GitHub.
-> Ditemukan di bawah direktori modules/streaming_pipeline
.
Pipa inferensi yang menggunakan LangChain untuk membuat rantai yang:
Pipeline inferensi disebarkan menggunakan Beam sebagai infrastruktur GPU tanpa server, sebagai RESTful API. Selain itu, ini dibungkus dalam UI untuk tujuan demo, diimplementasikan di Gradio.
-> Ditemukan di bawah direktori modules/financial_bot
.
Catatan: Jangan khawatir jika Anda tidak memiliki persyaratan perangkat keras minimum. Kami akan menunjukkan kepada Anda cara menyebarkan saluran inferensi ke infrastruktur tanpa server Beam dan memanggil LLM dari sana.
Kami menggunakan GPT3.5
untuk menghasilkan kumpulan data Tanya Jawab keuangan guna menyempurnakan LLM sumber terbuka kami agar berspesialisasi dalam penggunaan istilah keuangan dan menjawab pertanyaan keuangan. Menggunakan LLM besar, seperti GPT3.5
untuk menghasilkan kumpulan data yang melatih LLM yang lebih kecil (misalnya, Falcon 7B) dikenal sebagai penyempurnaan dengan distilasi .
→ Untuk memahami bagaimana kami menghasilkan kumpulan data Tanya Jawab keuangan, lihat artikel yang ditulis oleh Pau Labarta ini.
→ Untuk melihat analisis lengkap kumpulan data Tanya Jawab keuangan, lihat subbagian analisis_dataset dari kursus yang ditulis oleh Alexandru Razvant.
Sebelum mendalami modul, Anda harus menyiapkan beberapa alat eksternal tambahan untuk kursus.
CATATAN: Anda dapat mengaturnya saat Anda menggunakan setiap modul, karena kami akan menunjukkan apa yang Anda perlukan di setiap modul.
financial news data source
Ikuti dokumen ini untuk menunjukkan kepada Anda cara membuat akun GRATIS dan menghasilkan Kunci API yang Anda perlukan dalam kursus ini.
Catatan: 1x koneksi data Alpaca GRATIS.
serverless vector DB
Buka Qdrant dan buat akun GRATIS.
Setelah itu, ikuti dokumen ini tentang cara membuat Kunci API yang Anda perlukan dalam kursus ini.
Catatan: Kami hanya akan menggunakan paket freemium Qdrant.
serverless ML platform
Buka Comet ML dan buat akun GRATIS.
Setelah itu, ikuti panduan ini untuk menghasilkan API KEY dan proyek baru, yang Anda perlukan dalam kursus.
Catatan: Kami hanya akan menggunakan paket freemium Comet ML.
serverless GPU compute | training & inference pipelines
Buka Beam dan buat akun GRATIS.
Setelah itu, Anda harus mengikuti panduan instalasi mereka untuk menginstal CLI mereka & mengkonfigurasinya dengan kredensial Beam Anda.
Untuk membaca lebih lanjut tentang Beam, berikut adalah panduan pengenalan.
Catatan: Anda memiliki ~10 jam komputasi gratis. Setelah itu, Anda hanya membayar untuk apa yang Anda gunakan. Jika Anda memiliki GPU Nvidia >8 GB VRAM & tidak ingin menerapkan pipeline pelatihan & inferensi, menggunakan Beam adalah opsional.
Saat menggunakan Puisi, kami mengalami masalah dalam menemukan Beam CLI di dalam lingkungan virtual Puisi. Untuk memperbaikinya, setelah menginstal Beam, kami membuat symlink yang menunjuk ke binari Puisi, sebagai berikut:
export COURSE_MODULE_PATH= < your-course-module-path > # e.g., modules/training_pipeline
cd $COURSE_MODULE_PATH
export POETRY_ENV_PATH= $( dirname $( dirname $( poetry run which python ) ) )
ln -s /usr/local/bin/beam ${POETRY_ENV_PATH} /bin/beam
cloud compute | feature pipeline
Buka AWS, buat akun, dan buat sepasang kredensial.
Setelah itu, unduh dan instal AWS CLI v2.11.22 dan konfigurasikan dengan kredensial Anda.
Catatan: Anda hanya akan membayar untuk apa yang Anda gunakan. Anda hanya akan menerapkan VM EC2 t2.small
, yang hanya ~$0.023
/ jam. Jika Anda tidak ingin men-deploy pipeline fitur, penggunaan AWS bersifat opsional.
Setiap modul memiliki dependensi dan skripnya sendiri. Dalam pengaturan produksi, setiap modul akan memiliki repositorinya sendiri, namun dalam kasus penggunaan ini, untuk tujuan pembelajaran, kami meletakkan semuanya di satu tempat:
Jadi, periksa README untuk setiap modul satu per satu untuk mengetahui cara menginstal & menggunakannya:
Kami sangat menganjurkan Anda untuk mengkloning repositori ini dan meniru semua yang telah kami lakukan untuk mendapatkan hasil maksimal dari kursus ini.
Dalam setiap video ceramah, artikel, dan dokumentasi README, Anda akan menemukan petunjuk langkah demi langkah.
Selamat belajar!
Kode GitHub (dirilis di bawah lisensi MIT) dan video ceramah (dirilis di YouTube) sepenuhnya gratis. Akan selalu begitu.
Pelajaran Medium dirilis di bawah dinding berbayar Medium. Jika Anda sudah memilikinya, maka semuanya gratis. Jika tidak, Anda harus membayar biaya bulanan $5 untuk membaca artikel.
Jika Anda memiliki pertanyaan atau masalah selama kursus, kami mendorong Anda untuk membuat masalah di repositori ini di mana Anda dapat menjelaskan semua yang Anda perlukan secara mendalam.
Jika tidak, Anda juga dapat menghubungi guru di LinkedIn:
Klik di sini untuk menonton videonya?
Klik di sini untuk menonton videonya?
Klik di sini untuk menonton videonya?
Klik di sini untuk menonton videonya?
Klik di sini untuk menonton videonya?
To understand the entire code step-by-step, check out our articles
↓
Kursus ini adalah proyek sumber terbuka yang dirilis di bawah lisensi MIT. Jadi, selama Anda mendistribusikan LISENSI kami dan mengakui pekerjaan kami, Anda dapat dengan aman mengkloning atau membagi proyek ini dan menggunakannya sebagai sumber inspirasi untuk apa pun yang Anda inginkan (misalnya, proyek universitas, proyek gelar sarjana, dll.).
Pau Labarta Bajo | Insinyur ML & MLOps Senior Guru utama. Pria dari video pelajaran. Twitter/X Youtube Buletin ML Dunia Nyata Situs ML Dunia Nyata | |
Alexandru Razvant | Insinyur ML Senior Koki kedua. Insinyur di balik layar. Lompatan Neura | |
Paul Iusztin | Insinyur ML & MLOps Senior Koki utama. Orang-orang yang muncul secara acak dalam video pelajaran. Twitter/X Menguraikan Buletin ML Situs Pribadi | Pusat ML & MLOps |