พื้นที่เก็บข้อมูลนี้ประกอบด้วยแหล่งข้อมูลบางส่วนที่ฉันจะใช้เพื่อเรียนรู้เกี่ยวกับโมเดลภาษาขนาดใหญ่ นอกจากนี้ ฉันจะพยายามคิดแผนงานในขณะที่ฉันก้าวไปข้างหน้าในเส้นทางการเรียนรู้ด้วยตนเอง เนื่องจากแผนงานที่ชัดเจนพร้อมเหตุการณ์สำคัญจะเป็นหนึ่งในวิธีที่ดีที่สุดในการเรียนรู้เกี่ยวกับ LLM ในลักษณะที่เหมาะสม
สำหรับสิ่งนี้ ฉันจะรวมแหล่งข้อมูลเชิงปฏิบัติทั้งภาคทฤษฎีและภาคปฏิบัติเข้าด้วยกันเพื่อการเรียนรู้
PS: จำเป็นต้องทำให้ภาพนี้ชัดเจนยิ่งขึ้น
แก้ไข: 6 พฤศจิกายน 2024
จำเป็นต้องปรับโครงสร้างพื้นที่เก็บข้อมูลใหม่ครั้งใหญ่
ลบหลักสูตรหรือทรัพยากรที่ไม่เกี่ยวข้องออก
ในการแข่งขันโมเดล เราไม่สามารถแสดงรายการโมเดลในพื้นที่เก็บข้อมูลได้ เนื่องจากการติดตามโมเดลเป็นเรื่องยาก และการอัพเดตจะทำให้โมเดลก่อนหน้านี้ไร้ประโยชน์ จำเป็นต้องคิดหาวิธีที่ดีกว่าในการจัดสวนสัตว์จำลอง
อาจเพิ่มผู้มีส่วนร่วม 1-2 คนหรือเปิดพื้นที่เก็บข้อมูลเพื่อให้ความช่วยเหลือ
เราจะทำให้ประสบการณ์การเรียนรู้ที่ยอดเยี่ยม การโฮสต์บันทึกและบทช่วยสอน การอภิปรายแบบเปิด หน้าเว็บได้อย่างไร
CS224N การประมวลผลภาษาธรรมชาติด้วยการเรียนรู้เชิงลึก สแตนฟอร์ด
ความเชี่ยวชาญด้านการประมวลผลภาษาธรรมชาติ Coursera
หลักสูตร HuggingFace NLP + ทรานส์ฟอร์มเมอร์ส
CS25: Transformers United V2, Stanford CS25, เวอร์ชันฤดูใบไม้ร่วง 2021
Activeloop Learn ซึ่งเป็นโครงการริเริ่ม GenAI360 นี้มอบหลักสูตรฟรี 3 หลักสูตรเกี่ยวกับ RAG, การปรับแต่ง LLM, LangChain และ VectorDB
หลักสูตร LLM โดย Maxime Labonne หลักสูตรเพื่อเข้าสู่ Large Language Models (LLM) พร้อมโรดแมปและสมุดบันทึก Colab
ลงมือปฏิบัติในหลักสูตร LLM เรียนรู้เกี่ยวกับ LLM, LLMOps และ Vector DB ได้ฟรีโดยการออกแบบ ฝึกอบรม และปรับใช้ซอร์สโค้ดของระบบ LLM ที่ปรึกษาทางการเงินแบบเรียลไทม์ + วิดีโอและสื่อการอ่าน
Full Stack Deep Learning เริ่มต้นจากการเป็น bootcamp การเรียนรู้เชิงลึก และพัฒนาเป็น LLM bootcamp ประมาณเดือนเมษายน 2023 ขณะนี้เปิดให้ใช้งานฟรีแล้ว
LLM University โดย Cohere หลักสูตรนี้ประกอบด้วย 8 โมดูลที่สอนโดย Luis Serrano ผู้มีชื่อเสียงซึ่งเป็นที่รู้จักในด้านแนวคิดการสอนในลักษณะที่ง่ายและดึงดูดสายตา หลักสูตรประกอบด้วยหัวข้อต่างๆ เช่น พื้นฐาน การนำไปใช้งาน การค้นหาความหมาย และ RAG
หลักสูตรระยะสั้น Deeplearning.ai หลักสูตรระยะสั้นโดย DL.AI ในโดเมนต่างๆ ของ LLM และ Generative AI หลักสูตรระยะสั้นเหล่านี้มีประโยชน์มากเนื่องจากมีการผสมผสานอย่างลงตัวระหว่างภาคทฤษฎีและภาคปฏิบัติ หลักสูตรนี้มักจัดทำขึ้นโดยความร่วมมือกับบริษัทต่างๆ เช่น Hugging Face, Mistral, OpenAI, Microsoft, Meta, Google เป็นต้น
LLM Zoomcamp โดย DataTalksClub, LLM Zoomcamp - หลักสูตรออนไลน์ฟรีเกี่ยวกับการสร้างระบบถามตอบ
หลักสูตร Applied LLM Mastery 2024 โดย Aishwarya N Reganti หลักสูตรฟรี 10 สัปดาห์พร้อมแผนงานที่ชัดเจนตั้งแต่ความรู้พื้นฐาน LLM เครื่องมือและเทคนิค การปรับใช้และการประเมินผล ไปจนถึงความท้าทายและแนวโน้มในอนาคต
หลักสูตรน้ำหนักและอคติ มีหลักสูตรต่างๆ เกี่ยวกับ MLOps, แอปที่ขับเคลื่อนด้วย LLM เป็นต้น
หลักสูตร LLM Models, DataBricks x ed, การรับรองระดับมืออาชีพโดย DataBricks
Deeplearning.ai เสนอหลักสูตรระยะสั้นมากมายเกี่ยวกับ LLM เช่น LangChain สำหรับการพัฒนาแอป LLM, LLM แบบไร้เซิร์ฟเวอร์พร้อม AWS Bedrock, LLM การปรับแต่งอย่างละเอียด, LLM พร้อมการค้นหาความหมาย ฯลฯ
ข้อมูลเบื้องต้นเกี่ยวกับเส้นทางการเรียนรู้ Generative AI, Google Cloud
มหาวิทยาลัย Arize เปิดสอนหลักสูตรต่างๆ เช่น การประเมิน llm, เครื่องมือและห่วงโซ่ของตัวแทน llm, ความสามารถในการสังเกต llm เป็นต้น
หนังสือการประมวลผลภาษาธรรมชาติด้วย Transformers
บล็อกของ Langchain
บล็อกของ AIMultiple เกี่ยวกับโมเดลภาษาขนาดใหญ่: คู่มือฉบับสมบูรณ์ในปี 2023
เอกสารเชื่อมโยงกัน
บล็อก FutureSmart AI เกี่ยวกับการสร้าง Chatbots โดยใช้ LangChain และ ChatGPT
เอเจนต์อัตโนมัติที่ขับเคลื่อนด้วยงานโดยใช้ GPT-4, Pinecone และ LangChain สำหรับแอปพลิเคชันที่หลากหลาย
การสำรวจโมเดลภาษาขนาดใหญ่ ตรวจสอบ Repo นี้ด้วย: https://github.com/RUCAIBox/LLMSurvey
การทำความเข้าใจโมเดลภาษาขนาดใหญ่ -- รายการเรื่องรออ่านเชิงเปลี่ยนแปลง โดย Sebastian Raschka
Wiki CLSP, NLP Reading Group รายชื่อกลุ่มการอ่านที่เกี่ยวข้องกับ NLP ซึ่งได้รับการอัปเดตบ่อยครั้ง
เรื่องราวเบื้องหลังศักยภาพอันน่าอัศจรรย์ของ ChatGPT | เกร็ก บร็อคแมน | เท็ด
เหตุใด AI จึงฉลาดอย่างเหลือเชื่อ — และโง่อย่างน่าตกใจ | เยจิน ชอย | เท็ด
25 เมษายน 2023 Arize: สังเกตการณ์
27 เมษายน 2023 การปรับแต่ง LLM อย่างละเอียดด้วย PyTorch 2.0 และ ChatGPT
องค์กร H2O, HuggingFaces
องค์กร OpenAssistant, HuggingFaces
องค์กร DataBricks, HuggingFaces
องค์กร BigScience, HuggingFaces
องค์กร EleutherAI, HuggingFaces
องค์กร NomicAI, HuggingFaces
องค์กร Cerebras, HuggingFaces
LLMStudio, H2O AI
ลามะอินเด็กซ์
NeMo Guardrails, NVIDIA เพื่อป้องกันภาพหลอนและเพิ่มราวกั้นแบบตั้งโปรแกรมได้
MLC LLM พัฒนาการปรับให้เหมาะสมและปรับใช้ LLM บนอุปกรณ์ของทุกคน)
ลามินิ แอลแอลเอ็ม
ChatGPT, OpenAI, เปิดตัววันที่ 30 พฤศจิกายน 2022
Google Bard เปิดตัวเมื่อวันที่ 21 มีนาคม 2023
Tongyi Qianwen AI, Alibaba, เปิดตัวเมื่อวันที่ 11 เมษายน 2023
StableLM, Stability AI เปิดตัวเมื่อวันที่ 20 เมษายน 2023
อเมซอน ไททัน
HuggingChat, HuggingFaces เผยแพร่เมื่อวันที่ 25 เมษายน 2023
H2OGPT
รุ่น Bloom อนุญาตให้ใช้ในเชิงพาณิชย์กับ RAIL
GPT-J, EleutherAI, Apache 2.0
GPT-NeoX, EleutherAI, Apache 2.0
GPT4All, NomicAI, ใบอนุญาต MIT
GPT4All-J, NomicAI, ใบอนุญาต MIT
Pythia, EleutherAI, ใบอนุญาต MIT
GLM-130B
ปาล์ม, กูเกิล
เลือกเมตา
แฟลน-T5
ลามา, เมตา
อัลปาก้า, สแตนฟอร์ด
วิคูนา, lm-sys
แชร์GPT
ไพน์โคน
วีเวียต
มิลวัส
ChromaDB
เบบี้อากิ
GPT อัตโนมัติ
คนที่คุณควรติดตามอย่างแน่นอนเพื่อติดตามข่าวสารล่าสุดเกี่ยวกับ LLM นักวิจัย/ผู้ก่อตั้ง/นักพัฒนา/ผู้สร้างเนื้อหา AI ที่เกี่ยวข้องกับการผลิต/การวิจัย/การพัฒนา LLM
Sebastian Raschka เขาเป็นตำนานและจะทำให้ฟองสบู่ LLM ของคุณระเบิดด้วยทวีต บล็อก และบทช่วยสอนที่น่าทึ่งของเขา สมัครรับจดหมายข่าวของเขา Ahead of AI
Andrej Karpathy ซึ่งเป็นตำนานคนนี้ทำงานใน Tesla หยุดพัก เริ่มต้นช่อง YouTube ของเขาเพื่อสอนพื้นฐานและทำให้พวกเราทุกคนประทับใจด้วยวิดีโอที่น่าทึ่งของเขาเกี่ยวกับการนำ GPT ไปใช้งานตั้งแต่เริ่มต้น และในที่สุดก็กลับมาเข้าร่วม OpenAI อีกครั้ง ฉันเดาว่าคุณไม่สามารถสูญเสียตำนาน :D
Jay Alammar ถ้าคุณไม่รู้เกี่ยวกับบล็อก ELI ของเขาเกี่ยวกับ Transformers ก็ไปอ่านมันก่อน และอย่าลืมติดตามเขาเพื่อรับข้อมูลอัปเดต
Tomaz Bratanic เขาเป็นผู้เขียนหนังสือ Graph Algorithms for Data Science ที่มีชื่อเสียง และปัจจุบันเขียนบล็อกดีๆ บน Medium ที่เกี่ยวข้องกับ GPT, Langchain และสิ่งต่างๆ