? Ranked as one of the top data science repositories on GitHub!
เทคนิค เครื่องมือ แนวทางปฏิบัติที่ดีที่สุด และทุกสิ่งที่จำเป็นในการเรียนรู้แมชชีนเลิร์นนิง!
Complete Machine Learning Package เป็นพื้นที่เก็บข้อมูลที่ครอบคลุมซึ่งประกอบด้วยสมุดบันทึก 35 เล่มเกี่ยวกับการเขียนโปรแกรม Python การจัดการข้อมูล การวิเคราะห์ข้อมูล การสร้างภาพข้อมูล การล้างข้อมูล การเรียนรู้ของเครื่องแบบคลาสสิก คอมพิวเตอร์วิทัศน์ และการประมวลผลภาษาธรรมชาติ (NLP)
สมุดบันทึกทั้งหมดถูกสร้างขึ้นโดยคำนึงถึงผู้อ่านเป็นหลัก สมุดบันทึกทุกเครื่องเริ่มต้นด้วยภาพรวมระดับสูงของอัลกอริทึม/แนวคิดเฉพาะใดๆ ที่ครอบคลุม เมื่อใดก็ตามที่เป็นไปได้ รูปภาพจะถูกใช้เพื่อทำให้สิ่งต่าง ๆ ชัดเจน
10 พฤษภาคม 2023: เพิ่มคำแนะนำที่ครอบคลุมเกี่ยวกับ MLOps เพลิดเพลินไปกับคำแนะนำ!!
23 มิถุนายน 2022: หลายคนถามว่าจะสนับสนุนแพ็คเกจได้อย่างไร ซื้อกาแฟให้เราได้ ☕️
18 พฤษภาคม 2022: แพ็คเกจ Machine Learning แบบสมบูรณ์พร้อมใช้งานบนเว็บแล้ว ตอนนี้คุณสามารถดูสมุดบันทึกทั้งหมดได้อย่างง่ายดาย!
9 เมษายน 2022: อัปเดตการถ่ายโอนการเรียนรู้ด้วยโครงข่ายประสาทเทียมแบบ Convolutional ที่ได้รับการฝึกฝนพร้อมสิ่งเพิ่มเติมและเพิ่มทรัพยากรเพิ่มเติม
25 พฤศจิกายน 2021: อัปเดตความรู้พื้นฐานของการเรียนรู้ของเครื่อง: เพิ่มบันทึกเบื้องต้น ขั้นตอนการออกแบบระบบ ML และความท้าทายของระบบการเรียนรู้
ต่อไปนี้คือเครื่องมือที่รวมอยู่ในแพ็คเกจ Machine Learning แบบสมบูรณ์ เครื่องมือเหล่านี้เป็นเครื่องมือยอดนิยมที่วิศวกรแมชชีนเลิร์นนิงและนักวิทยาศาสตร์ข้อมูลส่วนใหญ่ต้องการไม่ทางใดก็ทางหนึ่งในแต่ละวัน
Python เป็นภาษาการเขียนโปรแกรมระดับสูงที่ได้รับความนิยมอย่างมากในชุมชนข้อมูล และด้วยการเติบโตอย่างรวดเร็วของไลบรารีและเฟรมเวิร์ก นี่เป็นภาษาการเขียนโปรแกรมที่เหมาะสมสำหรับการทำ ML
NumPy เป็นเครื่องมือคำนวณทางวิทยาศาสตร์ที่ใช้สำหรับการดำเนินการอาร์เรย์หรือเมทริกซ์
Pandas เป็นเครื่องมือที่ยอดเยี่ยมและเรียบง่ายสำหรับการวิเคราะห์และจัดการข้อมูลจากแหล่งต่างๆ ที่หลากหลาย
Matplotlib เป็นเครื่องมือสร้างภาพข้อมูลแบบครอบคลุมที่ใช้ในการสร้างการแสดงภาพแบบคงที่ ภาพเคลื่อนไหว และแบบโต้ตอบใน Python
Seaborn เป็นอีกหนึ่งเครื่องมือสร้างภาพข้อมูลที่สร้างขึ้นบน Matplotlib ซึ่งค่อนข้างใช้งานง่าย
Scikit-Learn: แทนที่จะสร้างโมเดลการเรียนรู้ของเครื่องตั้งแต่เริ่มต้น Scikit-Learn ทำให้การใช้โมเดลคลาสสิกเป็นเรื่องง่ายด้วยโค้ดเพียงไม่กี่บรรทัด เครื่องมือนี้ได้รับการดัดแปลงโดยชุมชนและอุตสาหกรรม ML เกือบทั้งหมด ตั้งแต่สตาร์ทอัพไปจนถึงเทคโนโลยีขนาดใหญ่
TensorFlow และ Keras สำหรับการเรียนรู้เชิงลึก: TensorFlow เป็นเฟรมเวิร์กการเรียนรู้เชิงลึกยอดนิยมที่ใช้สำหรับการสร้างแบบจำลองที่เหมาะกับสาขาต่างๆ เช่น คอมพิวเตอร์วิทัศน์ และการประมวลผลภาษาธรรมชาติ Keras เป็น API โครงข่ายประสาทเทียมระดับสูงที่ทำให้การออกแบบโมเดลการเรียนรู้เชิงลึกเป็นเรื่องง่าย TensorFlow และ Keras มีชุมชนและระบบนิเวศที่ยอดเยี่ยมซึ่งมีเครื่องมือต่างๆ เช่น TensorBoard, ชุดข้อมูล TF, TensorFlow Lite, TensorFlow Extended, TensorFlow Hub, TensorFlow.js, TensorFlow GNN และอื่นๆ อีกมากมาย
[ คุณสามารถดูบันทึกโดยละเอียดเกี่ยวกับ NumPy ได้ที่นี่ ]
การวิเคราะห์ข้อมูลเชิงสำรวจ
ความรู้เบื้องต้นเกี่ยวกับการเตรียมข้อมูล
การจัดการคุณสมบัติหมวดหมู่
การปรับขนาดคุณสมบัติ
การจัดการกับค่าที่หายไป
ข้อมูลเบื้องต้นเกี่ยวกับ Scikit-Learn สำหรับการเรียนรู้ของเครื่อง
โมเดลเชิงเส้นสำหรับการถดถอย
ตัวแบบเชิงเส้นสำหรับการจำแนกประเภท
รองรับเครื่องเวกเตอร์: บทนำและการถดถอย
รองรับเครื่องเวกเตอร์สำหรับการจำแนกประเภท
แผนผังการตัดสินใจ: บทนำและการถดถอย
ต้นไม้การตัดสินใจสำหรับการจำแนกประเภท
ป่าสุ่ม: บทนำและการถดถอย
ป่าสุ่มเพื่อการจำแนกประเภท
นอกเหนือจากป่าสุ่ม: โมเดล Ensemble เพิ่มเติม
ข้อมูลเบื้องต้นเกี่ยวกับการเรียนรู้แบบไม่มีผู้ดูแลด้วยการจัดกลุ่ม KMeans
บทนำเชิงปฏิบัติเกี่ยวกับการวิเคราะห์องค์ประกอบหลัก
ข้อมูลเบื้องต้นเกี่ยวกับโครงข่ายประสาทเทียม
ทำไมต้องเรียนรู้เชิงลึก
โครงข่ายประสาทเทียมชั้นเดียว
ฟังก์ชั่นการเปิดใช้งาน
ประเภทของสถาปัตยกรรมการเรียนรู้เชิงลึก
ความท้าทายในการฝึกอบรม Deep Neural Networks
ข้อมูลเบื้องต้นเกี่ยวกับ TensorFlow สำหรับการเรียนรู้เชิงลึก
โครงข่ายประสาทเทียมสำหรับการถดถอยด้วย TensorFlow
โครงข่ายประสาทเทียมสำหรับการจำแนกประเภทด้วย TensorFlow
ข้อมูลเบื้องต้นเกี่ยวกับการมองเห็นคอมพิวเตอร์ด้วยโครงข่ายประสาทเทียมแบบ Convolutional (CNN)
ConvNets สำหรับข้อมูลโลกแห่งความจริงและการเพิ่มรูปภาพ
ถ่ายโอนการเรียนรู้ด้วยโครงข่ายประสาทเทียมแบบ Convolutional ที่ได้รับการฝึกฝนมาล่วงหน้า
[พบสมุดบันทึกที่อัปเดตของ Transfer Learning ที่นี่]
ข้อมูลเบื้องต้นเกี่ยวกับ NLP และการประมวลผลข้อความด้วย TensorFlow
การใช้การฝังคำเพื่อแสดงข้อความ
โครงข่ายประสาทเทียมที่เกิดซ้ำ (RNN)
การใช้โครงข่ายประสาทเทียมแบบ Convolutional สำหรับการจำแนกข้อความ
การใช้ BERT ที่ผ่านการฝึกอบรมมาแล้วสำหรับการจัดประเภทข้อความ
ชุดข้อมูลจำนวนมากที่ใช้สำหรับพื้นที่เก็บข้อมูลนี้มาจากแหล่งที่มาต่อไปนี้:
ชุมชน Machine Learning มีชีวิตชีวามาก แพ็คเกจ Machine Learning ที่สมบูรณ์ช่วยให้คุณเริ่มต้นได้ แต่ยังไม่เพียงพอ โชคดีที่มีแหล่งข้อมูลการเรียนรู้ที่ยอดเยี่ยมมากมาย ซึ่งบางแหล่งต้องชำระเงินหรือหาได้ฟรี นี่คือรายชื่อหลักสูตรที่หลายๆ คนมักแนะนำ โปรดทราบว่ารายการเหล่านั้นไม่อยู่ในลำดับที่ต้องดำเนินการ
Machine Learning โดย Coursera : หลักสูตรนี้สอนโดย Andrew Ng เป็นหนึ่งในหลักสูตรการเรียนรู้ของเครื่องที่ได้รับความนิยมมากที่สุด โดยมีผู้คนมากกว่า 4 ล้านคนเข้าเรียน หลักสูตรนี้เน้นเพิ่มเติมเกี่ยวกับพื้นฐานของเทคนิคและอัลกอริทึมการเรียนรู้ของเครื่อง มันฟรีบน Coursera
ความเชี่ยวชาญด้านการเรียนรู้เชิงลึก : จัดทำโดย Andrew Ng. ความเชี่ยวชาญด้านการเรียนรู้เชิงลึกก็เป็นหลักสูตรพื้นฐานเช่นกัน โดยจะสอนรากฐานที่เหมาะสมของสถาปัตยกรรมการเรียนรู้เชิงลึกที่สำคัญๆ เช่น โครงข่ายประสาทเทียมแบบหมุนวน และโครงข่ายประสาทที่เกิดซ้ำ สามารถตรวจสอบหลักสูตรเต็มได้บน Coursera หรือรับชมได้อย่างอิสระบน Youtube
MIT Intro to Deep Learning : หลักสูตรนี้มอบรากฐานของการเรียนรู้เชิงลึกในระยะเวลาอันสั้นพอสมควร การบรรยายแต่ละครั้งใช้เวลาหนึ่งชั่วโมงหรือน้อยกว่า แต่สื่อการสอนยังคงดีที่สุดในชั้นเรียน ตรวจสอบหน้าหลักสูตรที่นี่ และวิดีโอบรรยายที่นี่
MIT Introduction to Data-Centric AI : หลักสูตรนี้เป็นหลักสูตรแรกใน DCAI ชั้นเรียนนี้ครอบคลุมอัลกอริทึมเพื่อค้นหาและแก้ไขปัญหาทั่วไปในข้อมูล ML และเพื่อสร้างชุดข้อมูลที่ดีขึ้น โดยมุ่งเน้นที่ข้อมูลที่ใช้ในงานการเรียนรู้ภายใต้การดูแล เช่น การจัดหมวดหมู่ เนื้อหาทั้งหมดที่สอนในหลักสูตรนี้เป็นแนวทางปฏิบัติในระดับสูง โดยเน้นไปที่แง่มุมที่มีผลกระทบของแอปพลิเคชัน ML ในโลกแห่งความเป็นจริง มากกว่าที่จะให้รายละเอียดทางคณิตศาสตร์เกี่ยวกับวิธีการทำงานของแบบจำลองนั้นๆ คุณสามารถเรียนหลักสูตรนี้เพื่อเรียนรู้เทคนิคเชิงปฏิบัติที่ไม่ครอบคลุมในคลาส ML ส่วนใหญ่ ซึ่งจะช่วยบรรเทาปัญหา “ขยะเข้า ขยะออก” ที่สร้างความเสียหายให้กับแอปพลิเคชัน ML ในโลกแห่งความเป็นจริงจำนวนมาก ตรวจสอบหน้าหลักสูตรที่นี่ วิดีโอบรรยายที่นี่ และการมอบหมายห้องปฏิบัติการที่นี่
NYU Deep Learning Spring 2021 : สอนที่ NYU โดย Yann LeCun, Alfredo Canziani หลักสูตรนี้เป็นหนึ่งในหลักสูตรที่สร้างสรรค์ที่สุด นำเสนอวัสดุได้อย่างน่าทึ่ง ตรวจสอบวิดีโอการบรรยายที่นี่ และ repo หลักสูตรที่นี่
CS231N: Convolutional Neural Networks for Visual Recognition โดย Stanford : CS231N เป็นหนึ่งในหลักสูตรการเรียนรู้เชิงลึกและการมองเห็นด้วยคอมพิวเตอร์ที่ดีที่สุด เวอร์ชันปี 2017 สอนโดย Fei-Fei Li, Justin Johnson และ Serena Yeung เวอร์ชันปี 2016 สอนโดย Fei-Fei, Johnson และ Andrej Karpathy ชมวิดีโอการบรรยายประจำปี 2017 ที่นี่ และสื่ออื่นๆ ที่นี่
CS224N: Natural Language Processing with Deep Learning โดย Stanford : หากคุณสนใจใน Natural Language Processing หลักสูตรนี้เป็นหลักสูตรที่ดี สอนโดยคริสโตเฟอร์ แมนนิ่ง หนึ่งในนัก NLP ระดับโลก ชมวิดีโอการบรรยายได้ที่นี่
การเรียนรู้เชิงลึกเชิงปฏิบัติสำหรับผู้เขียนโค้ดโดย fast.ai : หลักสูตรนี้เป็นหลักสูตรการเรียนรู้เชิงลึกแบบเข้มข้นซึ่งครอบคลุมสถาปัตยกรรมและเทคนิคการเรียนรู้เชิงลึกทั้งหมด วิดีโอการบรรยายและแหล่งข้อมูลอื่นๆ เช่น สมุดบันทึก เป็นหน้าหลักสูตร
ความเชี่ยวชาญด้านวิศวกรรมการเรียนรู้ของเครื่องเพื่อการผลิต (MLOps) : สอนโดย Andrew Ng., Laurence Moroney และ Robert Crowe นี่เป็นหนึ่งในหลักสูตรวิศวกรรม ML ที่ดีที่สุด โดยจะสอนวิธีการออกแบบระบบการผลิตแมชชีนเลิร์นนิงตั้งแต่ต้นจนจบ การสร้างข้อมูลที่มีประสิทธิภาพและไปป์ไลน์การสร้างแบบจำลอง และการปรับใช้โมเดลในการผลิต คุณสามารถค้นหาหลักสูตรได้ใน Coursera และสื่อการเรียนการสอนอื่นๆ บน Github
การเรียนรู้เชิงลึกแบบ Full Stack : แม้ว่าหลักสูตรการเรียนรู้ของเครื่องส่วนใหญ่จะมุ่งเน้นไปที่การสร้างแบบจำลอง แต่หลักสูตรนี้มุ่งเน้นไปที่ระบบการเรียนรู้ของเครื่องในการขนส่ง โดยจะสอนวิธีการออกแบบโปรเจ็กต์แมชชีนเลิร์นนิง การจัดการข้อมูล (พื้นที่จัดเก็บ การเข้าถึง การประมวลผล การกำหนดเวอร์ชัน และการติดป้ายกำกับ) การฝึกอบรม การดีบัก และการปรับใช้โมเดลการเรียนรู้ของเครื่อง ดูเวอร์ชัน 2021 ที่นี่ และ 2019 ที่นี่ คุณยังสามารถดูการนำเสนอโครงการเพื่อดูผลลัพธ์ของหลักสูตรผ่านโครงการของผู้เรียนได้
ด้านล่างนี้คือหนังสือการเรียนรู้ของเครื่องที่ยอดเยี่ยมบางเล่ม
หนังสือการเรียนรู้ของเครื่องร้อยหน้า : ประพันธ์โดย Andriy Burkov หนังสือเล่มนี้เป็นหนังสือที่สั้นที่สุด แต่กระชับและเขียนได้ดีเล่มหนึ่งที่คุณเคยพบบนอินเทอร์เน็ต คุณสามารถอ่านหนังสือได้ฟรีที่นี่
วิศวกรรมการเรียนรู้ของเครื่อง : ประพันธ์โดย Andriy Burkov หนังสือเล่มนี้เป็นหนังสือการเรียนรู้เกี่ยวกับเครื่องจักรที่ยอดเยี่ยมอีกเล่มหนึ่งที่เปิดเผยแต่ละขั้นตอนของเวิร์กโฟลว์การเรียนรู้ของเครื่อง ตั้งแต่การรวบรวมข้อมูล การเตรียมการ....ไปจนถึงการแสดงโมเดลและการบำรุงรักษา หนังสือเล่มนี้ยังฟรีที่นี่
Machine Learning Yearning : ประพันธ์โดย Andrew Ng. หนังสือเล่มนี้ประกอบด้วยกลยุทธ์ต่างๆ ในการสร้างระบบการเรียนรู้ที่มีประสิทธิภาพ มันถูกแบ่งออกเป็นส่วนเล็กๆ ซึ่งทำให้อ่านได้ง่าย และไม่ลำบากสำหรับวิศวกรการเรียนรู้ของเครื่อง ใครก็ตามที่ทำงานกับทีมวิทยาศาสตร์ข้อมูลและแมชชีนเลิร์นนิงจะพบว่าหนังสือเล่มนี้มีประโยชน์ หนังสืออย่างเป็นทางการมีให้บริการฟรีที่นี่ แต่คุณสามารถอ่านหรือดาวน์โหลดได้ที่นี่โดยไม่ต้องลงทะเบียน
Hands-on Machine Learning ด้วย Scikit-Learn, Keras และ TensorFlow : แต่งโดย Aurelion Geron นี่เป็นหนึ่งในหนังสือ Machine Learning ที่ดีที่สุด มีการเขียนอย่างชัดเจนและเต็มไปด้วยแนวคิดและแนวปฏิบัติที่ดีที่สุด คุณสามารถรับหนังสือได้ที่นี่หรือดูพื้นที่เก็บข้อมูลที่นี่
Deep Learning : ประพันธ์โดยตำนานการเรียนรู้เชิงลึก 3 เล่ม ได้แก่ Ian Goodfellow และ Yoshua Bengio และ Aaron Courville นี่คือหนึ่งในหนังสือการเรียนรู้เชิงลึกที่ยอดเยี่ยมที่มีให้อ่านฟรี คุณสามารถรับได้ที่นี่
การเรียนรู้เชิงลึกด้วย Python : ประพันธ์โดย Francois Chollet นักออกแบบ The Keras หนังสือเล่มนี้เป็นหนังสือการเรียนรู้เชิงลึกที่ครอบคลุมมาก คุณสามารถรับหนังสือได้ที่นี่ และซื้อคืนหนังสือที่นี่
เจาะลึกการเรียนรู้เชิงลึก : นี่เป็นหนังสือการเรียนรู้เชิงลึกที่ยอดเยี่ยมที่มีให้อ่านฟรี หนังสือเล่มนี้ใช้ทั้ง PyTorch และ TensorFlow คุณสามารถอ่านหนังสือทั้งเล่มได้ที่นี่
โครงข่ายประสาทเทียมและการเรียนรู้เชิงลึก : นี่เป็นหนังสือออนไลน์การเรียนรู้เชิงลึกอีกเล่มที่ยอดเยี่ยมโดย Michael Nielsen คุณสามารถอ่านหนังสือทั้งเล่มได้ที่นี่
หากคุณสนใจทรัพยากรการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกเพิ่มเติม คุณสามารถค้นหาได้ที่นี่ ที่นี่ และที่นี่
@article{Nyandwi2021MLPackage,
title = "Complete Machine Learning Package",
author = "Nyandwi, Jean de Dieu",
journal = "GitHub",
year = "2021",
url = "https://nyandwi.com/machine_learning_complete",
}
พื้นที่เก็บข้อมูลนี้สร้างโดย Jean de Dieu Nyandwi คุณสามารถพบเขาได้บน Twitter, LinkedIn, Medium และ Instagram