ดาวน์โหลด Machine Learning with Python - ดาวน์โหลด Machine Learning with Python

Machine Learning with Python

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Python Machine Learning Jupyter Notebooks (เว็บไซต์ ML)

ดร. Tirthajyoti Sarkar, ฟรีมอนต์, แคลิฟอร์เนีย (โปรดเชื่อมต่อกับ LinkedIn ที่นี่)

ตรวจสอบ Repos ที่มีประโยชน์สุด ๆ เหล่านี้ที่ฉันดูแลจัดการด้วย

เอกสารที่มีการอ้างถึงสูงและมีประโยชน์ที่เกี่ยวข้องกับการเรียนรู้ของเครื่อง, การเรียนรู้เชิงลึก, AI, ทฤษฎีเกม, การเรียนรู้แบบเสริมกำลัง
ลิงก์ทรัพยากรที่รวบรวมไว้อย่างรอบคอบสำหรับวิทยาศาสตร์ข้อมูลในที่เดียว

ความต้องการ

ไพธอน 3.6+
NumPy ( pip install numpy )
Pandas ( pip install pandas )
Scikit-learn ( pip install scikit-learn )
SciPy ( pip install scipy )
Statsmodels ( pip install statsmodels )
MatplotLib ( pip install matplotlib )
ซีบอร์น ( pip install seaborn )
Sympy ( pip install sympy )
Flask ( pip install flask )
WTForms ( pip install wtforms )
Tensorflow ( pip install tensorflow>=1.15 )
Keras ( pip install keras )
pdpipe ( pip install pdpipe )

คุณสามารถเริ่มต้นด้วยบทความนี้ที่ฉันเขียนในนิตยสาร Heartbeat (บนแพลตฟอร์มขนาดกลาง):

"เคล็ดลับและเทคนิคสำคัญบางประการสำหรับการเรียนรู้ของเครื่องด้วย Python"

สมุดบันทึกประเภทการสอนที่จำเป็นเกี่ยวกับ Pandas และ Numpy

สมุดบันทึก Jupyter ครอบคลุมฟังก์ชันและการปฏิบัติการที่หลากหลายในหัวข้อ NumPy, Pandans, Seaborn, Matplotlib ฯลฯ

การดำเนินการ Numpy โดยละเอียด
การดำเนินงานของแพนด้าโดยละเอียด
พื้นฐานด่วนของ Numpy และ Pandas
พื้นฐานด่วนของ Matplotlib และ Seaborn
การดำเนินงานของแพนด้าขั้นสูง
วิธีอ่านแหล่งข้อมูลต่างๆ
การสาธิตการอ่าน PDF และการประมวลผลตาราง
การดำเนินการของ Numpy นั้นเร็วแค่ไหนเมื่อเปรียบเทียบกับโค้ด Python ล้วนๆ (อ่านบทความของฉันเกี่ยวกับสื่อที่เกี่ยวข้องกับหัวข้อนี้)
อ่านอย่างรวดเร็วจาก Numpy โดยใช้รูปแบบไฟล์ .npy (อ่านบทความของฉันเกี่ยวกับสื่อในหัวข้อนี้)

สมุดบันทึกประเภทการสอนที่ครอบคลุมการถดถอย การจำแนกประเภท การจัดกลุ่ม การลดขนาด และอัลกอริธึมโครงข่ายประสาทเทียมพื้นฐานบางอย่าง

การถดถอย

การถดถอยเชิงเส้นอย่างง่ายด้วยการสร้างสถิติแบบที

หลายวิธีในการถดถอยเชิงเส้นใน Python และการเปรียบเทียบความเร็ว (ตรวจสอบบทความที่ฉันเขียนใน freeCodeCamp)
การถดถอยหลายตัวแปรด้วยการทำให้เป็นมาตรฐาน

การถดถอยพหุนามโดยใช้ คุณสมบัติไปป์ไลน์ scikit-learn (ตรวจสอบบทความที่ฉันเขียนเกี่ยวกับ Towards Data Science )
แผนผังการตัดสินใจและการถดถอยแบบสุ่มของฟอเรสต์ (แสดงให้เห็นว่า Random Forest ทำงานอย่างไรในฐานะตัวประมาณค่าเมตาดาต้าที่แข็งแกร่ง/สม่ำเสมอ โดยปฏิเสธการติดตั้งมากเกินไป)
การวิเคราะห์ด้วยภาพโดยละเอียดและการทดสอบวินิจฉัยความเหมาะสมสำหรับปัญหาการถดถอยเชิงเส้น
การถดถอยเชิงเส้นที่แข็งแกร่งโดยใช้ HuberRegressor จาก Scikit-learn

การจำแนกประเภท

การถดถอย/การจำแนกประเภทลอจิสติก (นี่คือสมุดบันทึก)

k -การจำแนกเพื่อนบ้านที่ใกล้ที่สุด (นี่คือสมุดบันทึก)
ต้นไม้ตัดสินใจและการจำแนกป่าแบบสุ่ม (นี่คือสมุดบันทึก)
รองรับการจำแนกประเภทเครื่องเวกเตอร์ (นี่คือสมุดบันทึก) ( ตรวจสอบบทความที่ฉันเขียนใน สู่วิทยาศาสตร์ข้อมูล บน SVM และอัลกอริธึมการเรียงลำดับ)

การจำแนกประเภท Naive Bayes (นี่คือสมุดบันทึก)

การจัดกลุ่ม

K -หมายถึงการจัดกลุ่ม (นี่คือสมุดบันทึก)
การขยายพันธุ์แบบ Affinity (แสดงความซับซ้อนของเวลาและผลกระทบของปัจจัยการทำให้หมาด ๆ) (นี่คือสมุดบันทึก)
เทคนิคการเปลี่ยนค่าเฉลี่ย (แสดงความซับซ้อนของเวลาและผลกระทบของสัญญาณรบกวนต่อการค้นพบคลัสเตอร์) (นี่คือสมุดบันทึก)
DBSCAN (แสดงให้เห็นว่าสามารถตรวจจับพื้นที่ที่มีความหนาแน่นสูงโดยทั่วไปโดยไม่คำนึงถึงรูปร่างของคลัสเตอร์ ซึ่ง K-mean ไม่สามารถทำได้) (นี่คือสมุดบันทึก)
การจัดกลุ่มแบบลำดับชั้นด้วย Dendograms แสดงวิธีเลือกจำนวนคลัสเตอร์ที่เหมาะสมที่สุด (นี่คือสมุดบันทึก)

การลดขนาด

การวิเคราะห์องค์ประกอบหลัก

การเรียนรู้เชิงลึก/โครงข่ายประสาทเทียม

สมุดบันทึกสาธิตเพื่อแสดงให้เห็นถึงความเหนือชั้นของโครงข่ายประสาทเชิงลึกสำหรับงานการประมาณฟังก์ชันแบบไม่เชิงเส้นที่ซับซ้อน
การสร้างเครือข่ายหนาแน่นแบบซ่อน 1 เลเยอร์และ 2 เลเยอร์แบบซ่อนทีละขั้นตอนโดยใช้วิธี TensorFlow พื้นฐาน

การสร้างข้อมูลแบบสุ่มโดยใช้นิพจน์เชิงสัญลักษณ์

วิธีใช้แพ็คเกจ Sympy เพื่อสร้างชุดข้อมูลสุ่มโดยใช้นิพจน์ทางคณิตศาสตร์เชิงสัญลักษณ์
นี่คือบทความของฉันเกี่ยวกับสื่อในหัวข้อนี้: การสร้างปัญหาการถดถอยแบบสุ่มและการจำแนกประเภทด้วยการแสดงออกเชิงสัญลักษณ์

เทคนิคการสร้างข้อมูลสังเคราะห์

โน๊ตบุ๊คที่นี่

ตัวอย่างการใช้งานอย่างง่าย (ให้บริการโมเดล ML บน web API)

ให้บริการโมเดลการถดถอยเชิงเส้นผ่านอินเทอร์เฟซเซิร์ฟเวอร์ HTTP แบบธรรมดา ผู้ใช้จำเป็นต้องขอการคาดการณ์โดยการรันสคริปต์ Python ใช้ Flask และ Gunicorn
ให้บริการโครงข่ายประสาทเทียมที่เกิดซ้ำ (RNN) ผ่านหน้าเว็บ HTTP พร้อมด้วยเว็บฟอร์ม ซึ่งผู้ใช้สามารถป้อนพารามิเตอร์และคลิกปุ่มเพื่อสร้างข้อความตามโมเดล RNN ที่ได้รับการฝึกอบรมล่วงหน้า ใช้ Flask , Jinja , Keras / TensorFlow , WTForms

การเขียนโปรแกรมเชิงวัตถุด้วยการเรียนรู้ของเครื่อง

การใช้หลักการ OOP หลักบางประการในบริบทของแมชชีนเลิร์นนิงโดยสร้างตัวประมาณค่าที่คล้ายกับ Scikit-learn ของคุณเอง และทำให้ดีขึ้น

ดูบทความของฉันเกี่ยวกับสื่อในหัวข้อนี้

การเขียนโปรแกรมเชิงวัตถุสำหรับนักวิทยาศาสตร์ข้อมูล: สร้างตัวประมาณค่า ML ของคุณ
การผสมผสานการเขียนโปรแกรมเชิงวัตถุอย่างง่ายๆ สามารถทำให้ต้นแบบการเรียนรู้เชิงลึกของคุณคมชัดขึ้นได้อย่างไร

หน่วยทดสอบโค้ด ML ด้วย Pytest

ตรวจสอบไฟล์และคำแนะนำโดยละเอียดในไดเร็กทอรี Pytest เพื่อทำความเข้าใจว่าควรเขียนโค้ด/โมดูลการทดสอบหน่วยสำหรับโมเดลการเรียนรู้ของเครื่องอย่างไร

โปรไฟล์หน่วยความจำและกำหนดเวลา

การทำโปรไฟล์รหัสวิทยาศาสตร์ข้อมูลและโมเดล ML สำหรับขนาดหน่วยความจำและเวลาในการประมวลผลถือเป็นพื้นที่ที่สำคัญแต่มักมีการใช้งานมากเกินไป นี่คือสมุดบันทึกสองสามเครื่องที่แสดงแนวคิด