ที่เก็บรหัสหนังสือ Python Machine Learning
หมายเหตุสำคัญ (09/21/2017):
พื้นที่เก็บข้อมูล GitHub นี้มีตัวอย่างโค้ดของหนังสือ Python Machine Learning ฉบับพิมพ์ครั้งที่ 1 หากคุณกำลังมองหาตัวอย่างโค้ดของ ฉบับพิมพ์ครั้งที่ 2 โปรดดูที่พื้นที่เก็บข้อมูลนี้แทน
สิ่งที่คุณคาดหวังได้คือ 400 หน้าที่เต็มไปด้วยเนื้อหาที่เป็นประโยชน์ซึ่งครอบคลุมทุกสิ่งที่คุณจำเป็นต้องรู้เพื่อเริ่มต้นการเรียนรู้ของเครื่อง ... ตั้งแต่ทฤษฎีไปจนถึงโค้ดจริงที่คุณสามารถนำไปปฏิบัติได้โดยตรง! นี่ไม่ใช่แค่หนังสือ "นี่คือวิธีการทำงานของ scikit-learn" อีกเล่มหนึ่ง ฉันตั้งเป้าที่จะอธิบายแนวคิดพื้นฐานทั้งหมด บอกทุกสิ่งที่คุณจำเป็นต้องรู้ในแง่ของแนวทางปฏิบัติที่ดีที่สุดและคำเตือน และเราจะนำแนวคิดเหล่านั้นไปปฏิบัติจริงโดยใช้ NumPy, scikit-learn และ Theano เป็นหลัก
คุณไม่แน่ใจว่าหนังสือเล่มนี้เหมาะสำหรับคุณหรือไม่? โปรดตรวจสอบข้อความที่ตัดตอนมาจากคำนำและคำนำ หรือดูข้อมูลเพิ่มเติมในส่วนคำถามที่พบบ่อย
พิมพ์ครั้งแรกเมื่อ 23 กันยายน 2558
หนังสือปกอ่อน: 454 หน้า
สำนักพิมพ์: สำนักพิมพ์ Packt
ภาษา: อังกฤษ
ISBN-10: 1783555130
ISBN-13: 978-1783555130
Kindle ASIN: B00YSILNL0
ISBN-13 ของเยอรมัน: 978-3958454224
ISBN-13 ภาษาญี่ปุ่น: 978-4844380603
ISBN-13 ของอิตาลี: 978-8850333974
จีน (ตัวเต็ม) ISBN-13: 978-9864341405
จีน (แผ่นดินใหญ่) ISBN-13: 978-7111558804
เกาหลี ISBN-13: 979-1187497035
รัสเซีย ISBN-13: 978-5970604090
สารบัญและสมุดบันทึกโค้ด
เพียงคลิกลิงก์ ipynb
/ nbviewer
ถัดจากหัวข้อข่าวของบทเพื่อดูตัวอย่างโค้ด (ปัจจุบัน ลิงก์เอกสารภายในรองรับเฉพาะเวอร์ชัน NbViewer เท่านั้น) โปรดทราบว่านี่เป็นเพียงตัวอย่างโค้ดที่มาพร้อมกับหนังสือ ซึ่งฉันได้อัปโหลดไว้เพื่อความสะดวกของคุณ โปรดทราบว่าสมุดบันทึกเหล่านี้อาจไม่มีประโยชน์หากไม่มีสูตรและข้อความอธิบาย
- ตัดตอนมาจากคำนำและคำนำ
- คำแนะนำในการตั้งค่า Python และ Jupiter Notebook
- การเรียนรู้ของเครื่อง - ทำให้คอมพิวเตอร์สามารถเรียนรู้จากข้อมูล [dir] [ipynb] [nbviewer]
- อัลกอริทึมการเรียนรู้ของเครื่องฝึกอบรมสำหรับการจำแนกประเภท [dir] [ipynb] [nbviewer]
- ทัวร์ชมตัวแยกประเภทการเรียนรู้ของเครื่องโดยใช้ Scikit-Learn [dir] [ipynb] [nbviewer]
- การสร้างชุดการฝึกอบรมที่ดี – การประมวลผลข้อมูลล่วงหน้า [dir] [ipynb] [nbviewer]
- การบีบอัดข้อมูลผ่านการลดขนาด [dir] [ipynb] [nbviewer]
- การเรียนรู้แนวทางปฏิบัติที่ดีที่สุดสำหรับการประเมินโมเดลและการเพิ่มประสิทธิภาพไฮเปอร์พารามิเตอร์ [dir] [ipynb] [nbviewer]
- การรวมโมเดลต่างๆ สำหรับการเรียนรู้ทั้งมวล [dir] [ipynb] [nbviewer]
- การใช้การเรียนรู้ของเครื่องกับการวิเคราะห์ความรู้สึก [dir] [ipynb] [nbviewer]
- การฝังโมเดลการเรียนรู้ของเครื่องลงในเว็บแอปพลิเคชัน [dir] [ipynb] [nbviewer]
- การทำนายตัวแปรเป้าหมายต่อเนื่องด้วยการวิเคราะห์การถดถอย [dir] [ipynb] [nbviewer]
- การทำงานกับข้อมูลที่ไม่มีป้ายกำกับ - การวิเคราะห์การจัดกลุ่ม [dir] [ipynb] [nbviewer]
- การฝึกอบรมโครงข่ายประสาทเทียมสำหรับการจดจำภาพ [dir] [ipynb] [nbviewer]
- การฝึกอบรมโครงข่ายประสาทเทียมแบบขนานผ่าน Theano [dir] [ipynb] [nbviewer]
การอ้างอิงสมการ
[PDF] [เท็กซ์]
สไลด์เพื่อการสอน
ขอขอบคุณ Dmitriy Dligach เป็นอย่างยิ่งที่แบ่งปันสไลด์ของเขาจากหลักสูตรการเรียนรู้ของเครื่องซึ่งปัจจุบันเปิดสอนที่ Loyola University Chicago
- https://github.com/dmitriydligach/PyMLSlides
ทรัพยากรคณิตศาสตร์และ NumPy เพิ่มเติม
ผู้อ่านบางคนถามเกี่ยวกับไพรเมอร์ Math และ NumPy เนื่องจากไม่ได้รวมไว้เนื่องจากข้อจำกัดด้านความยาว อย่างไรก็ตาม ฉันเพิ่งรวบรวมแหล่งข้อมูลดังกล่าวสำหรับหนังสือเล่มอื่น แต่ฉันได้จัดทำ บท เหล่านี้ให้อ่านทางออนไลน์ได้อย่างอิสระ โดยหวังว่าบทเหล่านี้สามารถใช้เป็นเนื้อหาพื้นหลังที่เป็นประโยชน์สำหรับหนังสือเล่มนี้ด้วย:
พื้นฐานพีชคณิต [PDF] [EPUB]
แคลคูลัสและไพรเมอร์สร้างความแตกต่าง [PDF] [EPUB]
ข้อมูลเบื้องต้นเกี่ยวกับ NumPy [PDF] [EPUB] [Code Notebook]
อ้างถึงหนังสือเล่มนี้
เรายินดีอย่างยิ่งให้คุณนำข้อมูลโค้ดหรือเนื้อหาอื่นๆ จากหนังสือเล่มนี้กลับมาใช้ซ้ำในสิ่งพิมพ์ทางวิทยาศาสตร์และงานอื่นๆ ในกรณีนี้ ฉันขอขอบคุณการอ้างอิงแหล่งที่มาดั้งเดิม:
บิบเท็กซ์ :
@Book{raschka2015python,
author = {Raschka, Sebastian},
title = {Python Machine Learning},
publisher = {Packt Publishing},
year = {2015},
address = {Birmingham, UK},
isbn = {1783555130}
}
มลา :
รัชก้า, เซบาสเตียน. การเรียนรู้ของเครื่องหลาม เบอร์มิงแฮม, สหราชอาณาจักร: Packt Publishing, 2015. พิมพ์.
ข้อเสนอแนะและคำวิจารณ์
ตัวอย่างรีวิวสั้นๆ
Python Machine Learning หนังสือเล่มใหม่ของ Sebastian Raschka เพิ่งเปิดตัว ฉันได้มีโอกาสอ่านบทวิจารณ์และเป็นไปตามที่ฉันคาดไว้ เยี่ยมมาก! มีการจัดระเบียบอย่างดี ง่ายต่อการปฏิบัติตาม และไม่เพียงแต่เป็นรากฐานที่ดีสำหรับผู้ฉลาดที่ไม่ใช่ผู้เชี่ยวชาญเท่านั้น ผู้ปฏิบัติงานจะได้รับแนวคิดและเรียนรู้เคล็ดลับใหม่ๆ ที่นี่เช่นกัน
– ลอน รีสเบิร์ก จาก Data Elixir
งานสุดยอด! จนถึงตอนนี้ สำหรับฉันดูเหมือนว่าจะมีความสมดุลระหว่างทฤษฎีและการปฏิบัติ…คณิตศาสตร์และโค้ด!
– ไบรอัน โธมัส
ฉันได้อ่าน (แทบ) ทุกชื่อ Machine Learning ที่มีพื้นฐานมาจาก Scikit-learn และนี่คือสิ่งที่ดีที่สุด
– เจสัน โวโลโซโนวิช
หนังสือที่ดีที่สุดที่ฉันเคยเห็นมาจากสำนักพิมพ์ PACKT นี่เป็นการแนะนำ Machine Learning ด้วย Python ที่เป็นลายลักษณ์อักษรเป็นอย่างดี ดังที่คนอื่น ๆ สังเกตเห็นว่าเป็นส่วนผสมที่ลงตัวระหว่างทฤษฎีและการประยุกต์
– จอช ดี.
หนังสือที่ผสมผสานคุณสมบัติที่หาได้ยาก: ผสมผสานคณิตศาสตร์ที่จำเป็นในการควบคุมทฤษฎีเข้ากับการเขียนโค้ดที่ใช้ใน Python ยังดีที่เห็นว่ามันไม่เปลืองกระดาษในการให้ไพรเมอร์กับ Python เหมือนกับที่หนังสืออื่นๆ มากมายทำเพื่อดึงดูดผู้ชมจำนวนมากขึ้น คุณสามารถบอกได้เลยว่ามันเขียนโดยนักเขียนผู้มีความรู้ ไม่ใช่แค่พวกชอบ DIY เท่านั้น
– ลูกค้าอเมซอน
Sebastian Raschka ได้สร้างบทช่วยสอนการเรียนรู้ของเครื่องที่น่าทึ่งซึ่งผสมผสานทฤษฎีเข้ากับการปฏิบัติ หนังสือเล่มนี้อธิบายการเรียนรู้ของเครื่องจากมุมมองทางทฤษฎีและมีตัวอย่างโค้ดมากมายเพื่อแสดงให้เห็นว่าคุณจะใช้เทคนิคการเรียนรู้ของเครื่องจริงอย่างไร สามารถอ่านได้โดยผู้เริ่มต้นหรือโปรแกรมเมอร์ขั้นสูง
- William P. Ross, 7 ต้องอ่านหนังสือ Python
รีวิวอีกต่อไป
หากคุณต้องการความช่วยเหลือในการตัดสินใจว่าหนังสือเล่มนี้เหมาะกับคุณหรือไม่ โปรดดูบทวิจารณ์ "ยาวกว่า" บางส่วนตามลิงก์ด้านล่าง (หากคุณเขียนบทวิจารณ์ โปรดแจ้งให้เราทราบ และเรายินดีที่จะเพิ่มลงในรายการ)
- Python Machine Learning Review โดย Patrick Hill จาก Chartered Institute for IT
- รีวิวหนังสือ: Python Machine Learning โดย Sebastian Raschka โดย Alex Turner ที่ WhatPixel
ลิงค์
- ebook และหนังสือปกอ่อนที่ Amazon.com, Amazon.co.uk, Amazon.de
- ebook และหนังสือปกอ่อนจาก Packt (ผู้จัดพิมพ์)
- ที่ร้านหนังสืออื่นๆ: Google Books, O'Reilly, Safari, Barnes & Noble, Apple iBooks, ...
- แพลตฟอร์มโซเชียล: Goodreads
การแปล
- แปลภาษาอิตาลีผ่าน "Apogeo"
- แปลภาษาเยอรมันผ่าน "mitp Verlag"
- แปลภาษาญี่ปุ่นผ่าน "Impress Top Gear"
- การแปลภาษาจีน (ภาษาจีนตัวเต็ม)
- การแปลภาษาจีน (ภาษาจีนแบบง่าย)
- แปลภาษาเกาหลีผ่าน "Kyobo"
- แปลภาษาโปแลนด์ผ่าน "Helion"
การอ้างอิงวรรณกรรมและทรัพยากรการอ่านเพิ่มเติม
คลาดเคลื่อน
สมุดโน๊ตโบนัส (ไม่มีในเล่ม)
- การใช้งานการถดถอยโลจิสติก [dir] [ipynb] [nbviewer]
- การตั้งค่าการค้นหาไปป์ไลน์และกริดขั้นพื้นฐาน [dir] [ipynb] [nbviewer]
- ตัวอย่างการตรวจสอบข้ามแบบซ้อนแบบขยาย [dir] [ipynb] [nbviewer]
- เทมเพลต Webapp ของ Barebones Flask อย่างง่าย [ดูไดเรกทอรี] [ดาวน์โหลดเป็นไฟล์ zip]
- การอ่านตัวเลขที่เขียนด้วยลายมือจาก MNIST ลงในอาร์เรย์ NumPy [GitHub ipynb] [nbviewer]
- Scikit-Learn Model Persistence โดยใช้ JSON [GitHub ipynb] [nbviewer]
- การถดถอยโลจิสติกพหุนาม / การถดถอย softmax [GitHub ipynb] [nbviewer]
“เนื้อหาที่เกี่ยวข้อง” (ไม่มีในหนังสือ)
- การประเมินแบบจำลอง การเลือกแบบจำลอง และการเลือกอัลกอริทึมในการเรียนรู้ของเครื่อง - ส่วนที่ 1
- การประเมินแบบจำลอง การเลือกแบบจำลอง และการเลือกอัลกอริทึมในการเรียนรู้ของเครื่อง - ส่วนที่ 2
- การประเมินแบบจำลอง การเลือกแบบจำลอง และการเลือกอัลกอริทึมในการเรียนรู้ของเครื่อง - ส่วนที่ 3
ไซปี 2016
เรามีช่วงเวลาที่ดีที่ SciPy 2016 ในออสติน! รู้สึกยินดีอย่างยิ่งที่ได้พบและพูดคุยกับผู้อ่านหนังสือของฉันมากมาย ขอบคุณมากสำหรับคำพูดและข้อเสนอแนะที่ดีทั้งหมด! และเผื่อคุณพลาด ผมกับ Andreas Mueller ได้ให้ ข้อมูล Introduction to Machine Learning กับ Scikit-learn ; หากคุณสนใจ วิดีโอที่บันทึกไว้ของ Part I และ Part II ออนไลน์อยู่ในขณะนี้!
PyData ชิคาโก 2016
ฉันพยายามท้าทายงานที่ค่อนข้างท้าทายในการแนะนำ scikit-learn และการเรียนรู้ของเครื่องในเวลา เพียง 90 นาทีที่ PyData Chicago 2016 สไลด์และสื่อการสอนมีอยู่ที่ "การเรียนรู้ scikit-learn -- ความรู้เบื้องต้นเกี่ยวกับการเรียนรู้ของเครื่องใน Python"
บันทึก
ฉันได้ตั้งค่าไลบรารีแยกต่างหาก mlxtend
ซึ่งมีการใช้งานเพิ่มเติมของการเรียนรู้ของเครื่อง (และอัลกอริธึม "วิทยาศาสตร์ข้อมูล") ทั่วไป ฉันยังเพิ่มการใช้งานจากหนังสือเล่มนี้ด้วย (เช่น พล็อตขอบเขตการตัดสินใจ โครงข่ายประสาทเทียม และอัลกอริธึมการเลือกคุณสมบัติตามลำดับ) พร้อมฟังก์ชันเพิ่มเติม
การแปล
เรียนท่านผู้อ่านทุกท่าน
ก่อนอื่นฉันอยากจะขอบคุณทุกท่านสำหรับการสนับสนุนที่ยอดเยี่ยม! ฉันมีความสุขมากกับข้อเสนอแนะดีๆ ที่คุณส่งถึงฉันจนถึงตอนนี้ และฉันดีใจที่หนังสือเล่มนี้มีประโยชน์ต่อผู้ชมในวงกว้าง
ในช่วงสองสามเดือนที่ผ่านมา ฉันได้รับอีเมลหลายร้อยฉบับ และฉันพยายามตอบให้ได้มากที่สุดในเวลาที่มีอยู่ เพื่อให้มีประโยชน์ต่อผู้อ่านคนอื่นๆ เช่นกัน ฉันจึงรวบรวมคำตอบหลายข้อไว้ในส่วนคำถามที่พบบ่อย (ด้านล่าง)
นอกจากนี้บางท่านยังถามฉันเกี่ยวกับเวทีสำหรับผู้อ่านเพื่อหารือเกี่ยวกับเนื้อหาของหนังสือ ฉันหวังว่านี่จะเป็นโอกาสสำหรับคุณที่จะพูดคุยและแบ่งปันความรู้ของคุณกับผู้อ่านคนอื่น ๆ:
กระดานสนทนาของ Google Groups
(และฉันจะพยายามตอบคำถามตัวเองอย่างเต็มที่หากมีเวลาเหลือ! :))
สิ่งเดียวที่ต้องทำกับคำแนะนำที่ดีคือการส่งต่อ ไม่เคยมีประโยชน์อะไรกับตัวเองเลย
— ออสการ์ ไวลด์
ตัวอย่างและการใช้งานโดยผู้อ่าน
ฉันต้องพูดอีกครั้ง (ใหญ่!) ขอบคุณสำหรับคำติชมดีๆ เกี่ยวกับหนังสือเล่มนี้ ฉันได้รับอีเมลจำนวนมากจากผู้อ่านที่นำแนวคิดและตัวอย่างจากหนังสือเล่มนี้ออกไปสู่โลกแห่งความเป็นจริงและนำไปใช้ให้เกิดประโยชน์ในโครงการของพวกเขา ในส่วนนี้ ฉันเริ่มรวบรวมแอปพลิเคชันที่ยอดเยี่ยมเหล่านี้บางส่วน และฉันยินดีอย่างยิ่งที่จะเพิ่มโครงการของคุณลงในรายการนี้ เพียงส่งอีเมลถึงฉันอย่างรวดเร็ว
- 40 สคริปต์เกี่ยวกับการรู้จำอักขระด้วยแสงโดย Richard Lyman
- การทดลองโค้ดโดย Jeremy Nation
- สิ่งที่ฉันเรียนรู้ในการใช้ Classifier จาก Scratch ใน Python โดย Jean-Nicholas Hould
คำถามที่พบบ่อย
คำถามทั่วไป
- การเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูลคืออะไร?
- เหตุใดคุณและคนอื่นๆ จึงใช้อัลกอริธึมการเรียนรู้ของเครื่องตั้งแต่เริ่มต้นในบางครั้ง
- ฉันควรมุ่งเน้นเส้นทางการเรียนรู้/วินัยในวิทยาการข้อมูลใด
- เราควรเริ่มมีส่วนร่วมใน Open Source ณ จุดใด
- คุณคิดว่าการมีพี่เลี้ยงมีความสำคัญต่อกระบวนการเรียนรู้อย่างไร
- ชุมชนออนไลน์ที่ดีที่สุดที่มีศูนย์กลางอยู่ที่วิทยาศาสตร์ข้อมูล/การเรียนรู้ของเครื่องหรือ Python อยู่ที่ไหน
- คุณจะอธิบายการเรียนรู้ของเครื่องให้วิศวกรซอฟต์แวร์ฟังอย่างไร
- หลักสูตรของคุณสำหรับผู้เริ่มต้นแมชชีนเลิร์นนิงจะเป็นอย่างไร
- คำจำกัดความของวิทยาศาสตร์ข้อมูลคืออะไร?
- Data Scientist เลือกแบบจำลองอย่างไร มันแตกต่างจาก Kaggle หรือไม่?
คำถามเกี่ยวกับสาขาการเรียนรู้ของเครื่อง
- ปัญญาประดิษฐ์และการเรียนรู้ของเครื่องเกี่ยวข้องกันอย่างไร
- ตัวอย่างการใช้งานแมชชีนเลิร์นนิงในโลกแห่งความเป็นจริงมีอะไรบ้าง
- สาขาวิชาต่างๆ ในการทำเหมืองข้อมูลมีอะไรบ้าง?
- อะไรคือความแตกต่างในลักษณะการวิจัยระหว่างสองสาขา: การเรียนรู้ของเครื่องและการขุดข้อมูล?
- ฉันจะรู้ได้อย่างไรว่าปัญหาสามารถแก้ไขได้ด้วยการเรียนรู้ของเครื่อง
- Machine Learning มีต้นกำเนิดมาจากอะไร?
- การจำแนกประเภทในฐานะเครื่องจักรการเรียนรู้ได้รับการพัฒนาอย่างไร
- อัลกอริธึมการเรียนรู้ของเครื่องใดที่ถือได้ว่าดีที่สุด
- หมวดหมู่กว้าง ๆ ของตัวแยกประเภทคืออะไร?
- ความแตกต่างระหว่างลักษณนามและแบบจำลองคืออะไร?
- อะไรคือความแตกต่างระหว่างอัลกอริธึมการเรียนรู้แบบอิงพารามิเตอร์และอัลกอริธึมการเรียนรู้แบบไม่มีพารามิเตอร์?
- อะไรคือความแตกต่างระหว่างฟังก์ชันต้นทุนและฟังก์ชันการสูญเสียในการเรียนรู้ของเครื่อง?
คำถามเกี่ยวกับแนวคิดและสถิติ ML
ฟังก์ชันต้นทุนและการเพิ่มประสิทธิภาพ
- การปรับโมเดลให้เหมาะสมผ่านสมการแบบปิดเทียบกับ Gradient Descent กับ Stochastic Gradient Descent กับการเรียนรู้แบบ Mini-Batch -- อะไรคือความแตกต่าง
- คุณจะได้กฎไล่ระดับ Descent สำหรับการถดถอยเชิงเส้นและ Adaline ได้อย่างไร
การวิเคราะห์การถดถอย
- อะไรคือความแตกต่างระหว่าง Pearson R และการถดถอยเชิงเส้นอย่างง่าย?
โมเดลต้นไม้
- แบบจำลองฟอเรสต์แบบสุ่มทำงานอย่างไร มันแตกต่างจากการบรรจุถุงและการเพิ่มขนาดในรุ่น Ensemble อย่างไร?
- อะไรคือข้อเสียของการใช้อัลกอริทึมแผนผังการตัดสินใจแบบคลาสสิกสำหรับชุดข้อมูลขนาดใหญ่
- เหตุใดการใช้อัลกอริทึมโครงสร้างการตัดสินใจจึงมักเป็นแบบไบนารี และอะไรคือข้อดีของเมตริกที่ไม่บริสุทธิ์ต่างๆ
- เหตุใดเราจึงปลูกต้นไม้การตัดสินใจผ่านเอนโทรปี แทนที่จะเป็นข้อผิดพลาดในการจำแนกประเภท
- เมื่อใดที่ป่าสุ่มสามารถทำงานได้แย่มาก?
การประเมินแบบจำลอง
- โอเวอร์ฟิตติ้งคืออะไร?
- ฉันจะหลีกเลี่ยงการสวมอุปกรณ์มากเกินไปได้อย่างไร?
- จะดีกว่าไหมที่จะมีจำนวนพับมากที่สุดที่เป็นไปได้เมื่อทำการตรวจสอบข้าม?
- เมื่อฝึกตัวแยกประเภท SVM ควรมีเวกเตอร์สนับสนุนจำนวนมากหรือเล็กดีกว่ากัน
- ฉันจะประเมินแบบจำลองได้อย่างไร
- เมตริกการตรวจสอบที่ดีที่สุดสำหรับการจำแนกประเภทหลายคลาสคืออะไร
- ฉันควรพิจารณาปัจจัยใดบ้างเมื่อเลือกเทคนิคแบบจำลองการคาดการณ์
- ชุดข้อมูลของเล่นที่ดีที่สุดที่จะช่วยให้เห็นภาพและเข้าใจพฤติกรรมของลักษณนามคืออะไร
- ฉันจะเลือกเคอร์เนล SVM ได้อย่างไร
- สลับฉาก: การเปรียบเทียบและการวัดประสิทธิภาพการคำนวณในการตรวจสอบข้าม - ปัญหาในชั้นเรียนที่ไม่สมดุลและ 3 วิธีในการคำนวณคะแนน F1
การถดถอยโลจิสติก
- Softmax regression คืออะไร และเกี่ยวข้องกับ Logistic regression อย่างไร
- เหตุใดการถดถอยโลจิสติกจึงถือเป็นแบบจำลองเชิงเส้น
- การตีความความน่าจะเป็นของการถดถอยโลจิสติกแบบสม่ำเสมอคืออะไร
- การทำให้เป็นมาตรฐานในการถดถอยโลจิสติกส่งผลให้เกิดความพอดีและลักษณะทั่วไปที่ดีขึ้นหรือไม่
- อะไรคือความแตกต่างที่สำคัญระหว่างไร้เดียงสา Bayes และการถดถอยโลจิสติก?
- อะไรคือ "softmax และการสูญเสียลอจิสติกพหุนาม" ในบริบทของการเรียนรู้ของเครื่อง?
- ความสัมพันธ์ระหว่าง Logistic Regression และ Neural Networks คืออะไร และควรใช้เมื่อใด
- การถดถอยโลจิสติก: เหตุใดจึงทำงาน sigmoid
- มีวิธีการวิเคราะห์สำหรับการถดถอยโลจิสติกที่คล้ายกับสมการปกติสำหรับการถดถอยเชิงเส้นหรือไม่
โครงข่ายประสาทเทียมและการเรียนรู้เชิงลึก
- อะไรคือความแตกต่างระหว่างการเรียนรู้เชิงลึกและการเรียนรู้ของเครื่องตามปกติ?
- คุณช่วยอธิบายด้วยภาพเกี่ยวกับอัลกอริธึมการแพร่กระจายด้านหลังสำหรับโครงข่ายประสาทเทียมได้ไหม?
- เหตุใดจึงใช้เวลานานมากในการประดิษฐ์เครือข่ายระดับลึก?
- หนังสือ/เอกสารที่ดีสำหรับการเรียนรู้การเรียนรู้เชิงลึกมีอะไรบ้าง
- เหตุใดจึงมี Deep Learning Library มากมาย
- เหตุใดบางคนจึงเกลียดโครงข่ายประสาทเทียม/การเรียนรู้เชิงลึก
- ฉันจะรู้ได้อย่างไรว่า Deep Learning ทำงานได้ดีกว่าสำหรับปัญหาเฉพาะมากกว่า SVM หรือฟอเรสต์แบบสุ่ม
- เกิดอะไรขึ้นเมื่อข้อผิดพลาดของโครงข่ายประสาทเทียมของฉันเพิ่มขึ้น
- ฉันจะดีบักอัลกอริธึมโครงข่ายประสาทเทียมได้อย่างไร
- อะไรคือความแตกต่างระหว่างโมเดล Perceptron, Adaline และโครงข่ายประสาทเทียม?
- แนวคิดพื้นฐานเบื้องหลังเทคนิคการออกกลางคันคืออะไร?
อัลกอริทึมอื่นๆ สำหรับการเรียนรู้แบบมีผู้สอน
- เหตุใดเพื่อนบ้านที่ใกล้ที่สุดจึงเป็นอัลกอริธึม Lazy?
การเรียนรู้แบบไม่มีผู้ดูแล
- การรวมกลุ่มมีปัญหาอะไรบ้าง
การเรียนรู้แบบกึ่งกำกับดูแล
- อะไรคือข้อดีของการเรียนรู้แบบกึ่งมีผู้สอนมากกว่าการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้สอน?
วิธีการทั้งมวล
- การรวมตัวแยกประเภทกับการซ้อนดีกว่าการเลือกตัวที่ดีที่สุดหรือไม่?
การประมวลผลล่วงหน้า การเลือกคุณสมบัติ และการแตกข้อมูล
- เหตุใดเราจึงต้องใช้พารามิเตอร์การฝึกอบรมซ้ำเพื่อแปลงข้อมูลการทดสอบ
- วิธีการลดขนาดต่างๆ ในแมชชีนเลิร์นนิงมีอะไรบ้าง
- อะไรคือความแตกต่างระหว่าง LDA และ PCA สำหรับการลดขนาด?
- เมื่อใดที่ฉันควรใช้การทำให้เป็นมาตรฐาน/มาตรฐานของข้อมูล
- การจัดศูนย์กลางหรือการปรับขนาดคุณลักษณะส่งผลต่อการวิเคราะห์องค์ประกอบหลักหรือไม่
- คุณจะโจมตีปัญหาการเรียนรู้ของเครื่องด้วยฟีเจอร์จำนวนมากได้อย่างไร
- แนวทางทั่วไปในการจัดการกับข้อมูลที่ขาดหายไปมีอะไรบ้าง
- อะไรคือความแตกต่างระหว่างวิธีการกรอง, Wrapper และ Embedded สำหรับการเลือกคุณสมบัติ?
- ขั้นตอนการเตรียมข้อมูล/ก่อนการประมวลผลควรถือเป็นส่วนหนึ่งของวิศวกรรมฟีเจอร์หรือไม่ ทำไมหรือทำไมไม่?
- การแสดงคุณลักษณะถุงคำสำหรับการจำแนกข้อความถือเป็นเมทริกซ์กระจัดกระจายหรือไม่?
ไร้เดียงสา เบย์ส
- เหตุใด Naive Bayes Classifier จึงไร้เดียงสา
- ขอบเขตการตัดสินใจของ Naive Bayes คืออะไร?
- ฉันสามารถใช้ตัวแยกประเภท Naive Bayes สำหรับประเภทตัวแปรแบบผสมได้หรือไม่
- เป็นไปได้หรือไม่ที่จะผสมตัวแปรประเภทต่างๆ ใน Naive Bayes เช่น ไบนารี่ และฟีเจอร์ต่อเนื่อง
อื่น
- ระยะทางแบบยุคลิดในแง่ของการเรียนรู้ของเครื่องคืออะไร?
- เมื่อใดที่เราควรใช้ค่ามัธยฐาน เมื่อเทียบกับค่าเฉลี่ยหรือค่าเฉลี่ย
ภาษาการเขียนโปรแกรมและไลบรารีสำหรับวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่อง
- ปัจจุบัน R ใช้กันอย่างแพร่หลายในด้านวิทยาศาสตร์ข้อมูลหรือไม่?
- อะไรคือความแตกต่างที่สำคัญระหว่าง TensorFlow และ scikit-learn?
คำถามเกี่ยวกับหนังสือ
- ฉันสามารถใช้ย่อหน้าและรูปภาพจากหนังสือในการนำเสนอหรือบล็อกของฉันได้หรือไม่
- สิ่งนี้แตกต่างจากหนังสือการเรียนรู้ของเครื่องอื่น ๆ อย่างไร
- Python เวอร์ชันใดที่ใช้ในตัวอย่างโค้ด
- มีการใช้เทคโนโลยีและไลบรารีใดบ้าง?
- เล่ม/รูปแบบไหนที่คุณอยากแนะนำ?
- เหตุใดคุณจึงเลือก Python สำหรับการเรียนรู้ของเครื่อง
- เหตุใดคุณจึงใช้ขีดล่างนำหน้าและต่อท้ายจำนวนมากในตัวอย่างโค้ด
- จุดประสงค์ของการ
return self
สำนวนในตัวอย่างโค้ดของคุณคืออะไร? - มีข้อกำหนดเบื้องต้นและการอ่านล่วงหน้าที่แนะนำหรือไม่?
- ฉันจะใช้ SVM กับข้อมูลหมวดหมู่ได้อย่างไร
ติดต่อ
ฉันยินดีที่จะตอบคำถาม! เพียงเขียนอีเมลถึงฉันหรือลองถามคำถามในรายการอีเมลของ Google Groups
หากคุณสนใจที่จะติดต่อกัน ฉันมี Twitter สตรีม (@rasbt) ที่ค่อนข้างมีชีวิตชีวาเกี่ยวกับวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่อง ฉันยังดูแลบล็อกที่ฉันโพสต์ทุกสิ่งที่ฉันรู้สึกตื่นเต้นเป็นพิเศษ