Repositori ini merupakan beberapa sumber yang akan saya gunakan untuk mempelajari Model Bahasa Besar. Saya juga akan mencoba membuat peta jalan saat saya melanjutkan perjalanan belajar mandiri ini, karena peta jalan yang jelas dengan pencapaian akan menjadi salah satu cara terbaik untuk mempelajari LLM dengan cara yang benar.
Untuk ini, saya akan menyertakan campuran sumber daya teoritis dan praktis untuk dipelajari.
PS: Perlu dibuat lebih visual
Sunting: 6 November 2024
Perlu melakukan refaktorisasi besar-besaran pada repositori.
Hapus kursus atau sumber daya yang tidak relevan.
Dalam perlombaan model, kami tidak dapat terus membuat daftar model di repositori karena sulit untuk melacak model dan pembaruan akan membuat model sebelumnya tidak berguna. Perlu memikirkan cara yang lebih baik untuk mengatur kebun binatang model.
Mungkin menambahkan 1-2 kontributor atau membuka repositori untuk memberikan kontribusi guna membantu.
Bagaimana kita bisa menjadikannya pengalaman belajar yang luar biasa, menyimpan catatan dan tutorial, diskusi terbuka, halaman web?
Pemrosesan Bahasa Alami CS224N dengan Pembelajaran Mendalam, Stanford
Spesialisasi Pemrosesan Bahasa Alami, Coursera
Kursus HuggingFace NLP + Transformers
CS25: Transformers United V2, Stanford CS25, Versi Musim Gugur 2021
Activeloop Learn, inisiatif GenAI360 ini menyediakan 3 kursus gratis tentang RAG, LLM penyempurnaan, LangChain, dan VectorDB.
Kursus LLM oleh Maxime Labonne, Kursus untuk mempelajari Model Bahasa Besar (LLM) dengan peta jalan dan buku catatan Colab.
Kursus LLM Langsung, Pelajari tentang LLM, LLMOps, dan DB Vektor secara gratis dengan merancang, melatih, dan menerapkan kode sumber sistem LLM penasihat keuangan real-time + video & bahan bacaan.
Full Stack Deep Learning, dimulai sebagai bootcamp pembelajaran mendalam dan berkembang menjadi bootcamp LLM sekitar bulan April 2023, sekarang dapat diikuti secara gratis.
LLM University oleh Cohere, kursus ini terdiri dari 8 modul yang diajarkan oleh Luis Serrano yang terkenal, yang dikenal mengajarkan konsep dengan cara yang mudah dan menarik secara visual. Kursus ini berisi topik-topik seperti dasar-dasar, penerapan, pencarian semantik, dan RAG.
Kursus Singkat Deeplearning.ai, Kursus singkat oleh DL.AI di berbagai domain LLM dan AI Generatif. Kursus singkat ini sangat berguna karena memiliki perpaduan sempurna antara sesi teori dan praktik. Kursus biasanya dibuat bekerja sama dengan perusahaan seperti Hugging Face, Mistral, OpenAI, Microsoft, Meta, Google dll.
LLM Zoomcamp oleh DataTalksClub, LLM Zoomcamp - kursus online gratis tentang membangun sistem Tanya Jawab.
Kursus Penguasaan LLM Terapan 2024 oleh Aishwarya N Reganti, kursus gratis 10 minggu dengan peta jalan yang pasti mulai dari Dasar-dasar LLM, Alat dan teknik, Penerapan dan evaluasi hingga Tantangan dan tren masa depan.
Kursus Bobot dan Bias, menyediakan kursus berbeda tentang MLOps, Aplikasi yang Didukung LLM, dll.
Kursus Model LLM, DataBricks x ed, sertifikasi profesional oleh DataBricks.
Deeplearning.ai menawarkan berbagai kursus singkat tentang LLM seperti LangChain untuk Pengembangan Aplikasi LLM, LLM Tanpa Server dengan AWS Bedrock, LLM Penyempurnaan, LLM dengan Pencarian Semantik, dll.
Pengantar Jalur Pembelajaran AI Generatif, Google Cloud.
Universitas Arize menyelenggarakan kursus seperti evaluasi llm, alat dan rantai agen llm, kemampuan observasi llm, dll.
Pemrosesan Bahasa Alami dengan Buku Transformers
Blog Langchain
Blog AIMultiple tentang Model Bahasa Besar: Panduan Lengkap pada tahun 2023
Kohesi Dokumen
Blog FutureSmart AI tentang Membangun Chatbots menggunakan LangChain dan ChatGPT
Agen Otonom Berbasis Tugas yang Memanfaatkan GPT-4, Pinecone, dan LangChain untuk Beragam Aplikasi
Survei Model Bahasa Besar Lihat juga Repo ini: https://github.com/RUCAIBox/LLMSurvey
Memahami Model Bahasa Besar -- Daftar Bacaan Transformatif, Sebastian Raschka
Wiki CLSP, NLP Reading Group, daftar kelompok membaca yang berhubungan dengan NLP yang sering diperbarui.
Kisah Dalam Tentang Potensi Luar Biasa ChatGPT | Greg Brockman | TED
Mengapa AI Sangat Cerdas — dan Sangat Bodoh | Yejin Choi | TED
25 April 2023, Arize: Amati
27 April 2023, Menyempurnakan LLM dengan PyTorch 2.0 dan ChatGPT
Organisasi H2O, HuggingFaces
Organisasi OpenAssistant, HuggingFaces
Organisasi DataBricks, HuggingFaces
Organisasi BigScience, HuggingFaces
Organisasi EleutherAI, HuggingFaces
Organisasi NomicAI, HuggingFaces
Organisasi Cerebras, HuggingFaces
LLMStudio, H2O AI
Indeks LLama
NeMo Guardrails, NVIDIA, untuk mencegah halusinasi dan menambahkan pagar pembatas yang dapat diprogram
MLC LLM, Kembangkan optimalkan dan terapkan LLM secara asli di perangkat semua orang)
LaMini LLM
ChatGPT, OpenAI, Dirilis 30 November 2022
Google Bard, Dirilis 21 Maret 2023
Tongyi Qianwen AI, Alibaba, Dirilis 11 April 2023
StableLM, Stability AI, Dirilis 20 April 2023
Titan Amazon
HuggingChat, HuggingFaces, Dirilis 25 April 2023
H2OGPT
Model Bloom, Penggunaan Komersial Diizinkan dengan RAIL
GPT-J, EleutherAI, Apache 2.0
GPT-NeoX, EleutherAI, Apache 2.0
GPT4All, NomicAI, Lisensi MIT
GPT4All-J, NomicAI, Lisensi MIT
Pythia, EleutherAI, Lisensi MIT
GLM-130B
PaLM, Google
PILIH, Meta
FLAN-T5
LLAMA, Meta
Alpaka, Stanford
Vicuna, aku-sys
BagikanGPT
biji pinus
lemah
Milvus
ChromaDB
sayangAGI
GPT Otomatis
Orang yang harus Anda ikuti untuk terus mendapatkan informasi terbaru tentang LLM. Peneliti/Pendiri/Pengembang/Pembuat Konten AI yang terlibat dalam produksi/penelitian/pengembangan LLM
Sebastian Raschka, dia adalah seorang legenda dan akan meledakkan gelembung LLM Anda yang sedang naik daun dengan tweet, blog, dan tutorialnya yang luar biasa. Berlangganan buletinnya, Ahead of AI
Andrej Karpathy, legenda ini bekerja di Tesla, beristirahat, memulai saluran YouTube-nya untuk mengajarkan dasar-dasarnya dan mengejutkan kita semua dengan videonya yang luar biasa tentang penerapan GPT dari awal dan akhirnya bergabung kembali dengan OpenAI. Saya kira Anda tidak bisa kehilangan legenda :D
Jay Alammar, ya, jika Anda belum tahu tentang blog ELI-nya di Transformers, bacalah dulu dan pastikan untuk mengikutinya untuk mendapatkan informasi terbaru.
Tomaz Bratanic, dia adalah penulis buku terkenal Graph Algorithms for Data Science, dan saat ini menulis blog bagus di Medium terkait GPT, Langchain, dan lainnya.