การเรียนรู้ของเครื่องที่ตีความได้
อธิบายการตัดสินใจและพฤติกรรมของแบบจำลองการเรียนรู้ของเครื่อง
สรุป
คุณสามารถค้นหาเวอร์ชันปัจจุบันของหนังสือได้ที่นี่: https://christophm.github.io/interpretable-ml-book/
หนังสือเล่มนี้เกี่ยวกับการเรียนรู้ของเครื่องที่ตีความได้ การเรียนรู้ของเครื่องจักรกำลังถูกสร้างขึ้นในผลิตภัณฑ์และกระบวนการต่าง ๆ ในชีวิตประจำวันของเรา แต่การตัดสินใจของเครื่องจักรไม่ได้มาพร้อมกับคำอธิบายโดยอัตโนมัติ คำอธิบายเพิ่มความไว้วางใจในการตัดสินใจและในรูปแบบการเรียนรู้ของเครื่อง ในฐานะโปรแกรมเมอร์อัลกอริทึมที่คุณต้องการทราบว่าคุณสามารถไว้วางใจโมเดลที่เรียนรู้ได้หรือไม่ มันเรียนรู้คุณสมบัติทั่วไปหรือไม่? หรือมีสิ่งประดิษฐ์แปลก ๆ ในข้อมูลการฝึกอบรมที่อัลกอริทึมหยิบขึ้นมา? หนังสือเล่มนี้จะให้ภาพรวมเกี่ยวกับเทคนิคที่สามารถใช้ในการทำให้กล่องดำมีความโปร่งใสที่สุดเท่าที่จะเป็นไปได้และอธิบายการตัดสินใจ ในอัลกอริทึมบทแรกที่สร้างแบบจำลองที่ง่ายและตีความได้จะถูกนำมาใช้พร้อมกับคำแนะนำวิธีการตีความผลลัพธ์ บทต่อมามุ่งเน้นไปที่การวิเคราะห์แบบจำลองที่ซับซ้อนและการตัดสินใจของพวกเขา ในอนาคตในอุดมคติเครื่องจักรจะสามารถอธิบายการตัดสินใจของพวกเขาและทำการเปลี่ยนผ่านสู่ยุคอัลกอริทึมของมนุษย์มากขึ้น หนังสือเล่มนี้แนะนำสำหรับผู้ปฏิบัติงานการเรียนรู้ของเครื่องนักวิทยาศาสตร์ข้อมูลนักสถิติและผู้มีส่วนได้ส่วนเสียที่ตัดสินใจใช้การเรียนรู้ของเครื่องจักรและอัลกอริทึมอัจฉริยะ
หนังสือเล่มนี้ถูกสร้างขึ้นโดยอัตโนมัติจากสาขาหลักและผลักไปที่ GH-Pages โดยการกระทำของ GitHub
การบริจาค
ดูวิธีการมีส่วนร่วม
แสดงหนังสือ
โคลนที่เก็บ
git clone [email protected]:christophM/interpretable-ml-book.git
ตรวจสอบให้แน่ใจว่ามีการติดตั้งการพึ่งพาหนังสือทั้งหมด หนังสือเล่มนี้มีโครงสร้างของแพ็คเกจ R ดังนั้นสามารถติดตั้งได้อย่างง่ายดายเพียง R และห้องสมุด Devtools เท่านั้น เริ่มเซสชัน R ในโฟลเดอร์ของที่เก็บหนังสือและพิมพ์:
สำหรับการแสดงผลหนังสือให้เริ่มเซสชัน R และพิมพ์:
setwd("manuscript")
# first, generate the references
source("../scripts/references.R")
bookdown::render_book('.', 'bookdown::gitbook')
หลังจากเรนเดอร์ไฟล์ HTML ของหนังสือจะอยู่ในโฟลเดอร์ "_book" คุณสามารถดับเบิลดัชนี double.html โดยตรงหรือแน่นอนทำใน r:
browseURL('_book/index.html')
หมายเหตุเกี่ยวกับการพิมพ์ด้วย lulu.com
- ส่งออกจาก LeanPub ใน 7.44 "x 9.68" 18.9 ซม. x 24.6 ซม.
- สำหรับปก: 7.565 x 9.925 ", 19.226 x 25.224cm ดูขนาดที่แนะนำ
- แบบอักษรสำหรับปกหน้า: Francois One
การเขียน
สิ่งที่ทั้งคู่ใช้ได้กับ LeanPub และ Bookdown:
- ชื่อเริ่มต้นด้วย #, คำบรรยายด้วย ## และอื่น ๆ
- ชื่อเรื่องสามารถติดแท็กได้โดยใช้ {#tag-of-the-title}
- บทสามารถอ้างอิงได้โดยใช้
[text of the link](#tag-of-the-title)
- ตัวเลขสามารถอ้างอิงได้โดยใช้
[text of the link](#fig:tag-of-r-chunk-that-produced-figure)
- เริ่มต้นและสิ้นสุดการแสดงออกทางคณิตศาสตร์ด้วย
$
(อินไลน์) หรือด้วย $$
(เส้นพิเศษ) จะมีการเปลี่ยนแปลงโดยอัตโนมัติสำหรับ LeanPub ด้วย regexpr สคริปต์การแปลงใช้งานได้ก็ต่อเมื่อไม่มีพื้นที่ว่างอยู่ในสูตร - ทิ้งบรรทัดที่ว่างเปล่าระหว่างสูตรและข้อความ (หากสูตรไม่เป็นแบบอินไลน์) สูตร (ด้วย $$ ... $$) ควรอยู่ในบรรทัดเดียวและไม่เกินหลายบรรทัด (เนื่องจากตัวแยกวิเคราะห์)
- การอ้างอิงจะต้องเขียนเช่นนี้:
[^ref-tag]
และต้องอยู่ในตอนท้ายของไฟล์ที่เกี่ยวข้องกับ [^ref]: Details of the reference ...
ตรวจสอบให้แน่ใจว่ามีพื้นที่รวมอยู่ด้วย การอ้างอิงจะถูกรวบรวมใน 10-reference.rmd กับการอ้างอิงสคริปต์ ตรวจสอบให้แน่ใจว่าไม่ใช้ [^ref-tag]:
ที่ใดก็ได้ในข้อความเฉพาะที่ด้านล่างสำหรับการอ้างอิงจริง
การพิมพ์สำหรับการพิสูจน์อักษรด้วยระยะห่างบรรทัดพิเศษ: สร้างหนังสือ html, ไปที่ต้นฉบับ/_book/libs/gitbook*/css/style.css, เปลี่ยนสายไฟ: 1.7 ถึงจุดสูง: 2.5, เปิด html ท้องถิ่นด้วย Chrome, พิมพ์เป็น PDF ที่มีอัตรากำไรขั้นต้นที่กำหนดเอง
การเปลี่ยนแปลง
การเปลี่ยนแปลงที่โดดเด่นทั้งหมดของหนังสือเล่มนี้จะได้รับการบันทึกไว้ที่นี่
v2.0 (อยู่ระหว่างดำเนินการ) [รุ่น HTML]
- เพิ่ม "คำนำโดยผู้เขียน" บท
- ส่วนเริ่มต้นเกี่ยวกับการตีความเครือข่ายประสาท
- เพิ่มบทเกี่ยวกับการสร้างภาพคุณสมบัติ
- เพิ่มบท Shap
- เพิ่มบท Anchors
- แก้ไขข้อผิดพลาดในการถดถอยโลจิสติกบท: การถดถอยโลจิสติกกำลังทำนายคลาส "สุขภาพ" แต่การตีความในข้อความนั้นมีไว้สำหรับชั้นเรียน "มะเร็ง" ตอนนี้น้ำหนักการถดถอยมีสัญญาณที่ถูกต้อง
- เปลี่ยนชื่อคุณลักษณะสำคัญบทเป็น "ความสำคัญของคุณสมบัติการเปลี่ยนแปลง"
- เพิ่มบทเกี่ยวกับการสลายตัวของฟังก์ชั่น
- การจัดเรียงวิธีการตีความใหม่โดยการเรียนรู้ในระดับท้องถิ่นระดับโลกและลึก (ก่อนหน้า: Model-Incostic, Example-based, Deep Learning)
- errata:
- บทที่ 4.3 GLM, GAM และอื่น ๆ : การถดถอยโลจิสติกใช้ logit ไม่ใช่ฟังก์ชั่นโลจิสติกเป็นฟังก์ชันลิงก์
- บทที่โมเดลเชิงเส้น: สูตรสำหรับการปรับ R-squared ได้รับการแก้ไข (สองครั้ง)
- กฎการตัดสินใจของบท: การผสมผสานระหว่างสุขภาพและมะเร็งในบทที่ได้รับการแก้ไข
- บทที่ Rulefit: ความสำคัญของคำเชิงเส้นในการกำหนดความสำคัญทั้งหมดได้รับการจัดทำดัชนีด้วยไฟล์ $ l $ แทน $ j $ -
- อัปเดตรูปภาพ
v1.1 (2019-03-23) [เวอร์ชันพิมพ์, เวอร์ชัน ebook]
- แก้ไขดัชนีที่ไม่ถูกต้องในการรวมระยะทางของ Cooks (i -> j)
- แก้ไขสูตร BoxPlot (1.5 แทน 1.58)
- เปลี่ยนเป็นจานสีที่เป็นมิตรกับสีตาบอด (Viridis)
- ตรวจสอบให้แน่ใจว่าพล็อตทำงานเป็นสีดำและสีขาวเช่นกัน
- ขยายบท counterfactual ด้วย MOC (โดย Susanne Dandl)
v1.0 (2019-02-21)
- การพิสูจน์อักษรและขัดอย่างกว้างขวาง
v0.7 (2018-11-21)
- เปลี่ยนชื่อเป็นคำจำกัดความเป็นคำศัพท์
- เพิ่มสัญกรณ์ทางคณิตศาสตร์ไปยังคำศัพท์ (คำจำกัดความเดิม) บท
- เพิ่มตัวอย่าง Lasso
- บท LM ที่ปรับโครงสร้างและเพิ่มข้อดี/ข้อเสีย
- เปลี่ยนชื่อ "เกณฑ์วิธีการตีความ" เป็น "อนุกรมวิธานของวิธีการตีความ"
- เพิ่มข้อดีและข้อเสียของการถดถอยโลจิสติก
- เพิ่มรายการอ้างอิงในตอนท้ายของหนังสือ
- เพิ่มภาพในเรื่องสั้น
- เพิ่มข้อเสียเปรียบของ Shapley Value: คุณลักษณะจะต้องเป็นอิสระ
- เพิ่มการสลายตัวของต้นไม้และความสำคัญของคุณลักษณะในบทต้นไม้
- ปรับปรุงคำอธิบายของการทำนายส่วนบุคคลใน LM
- เพิ่มตัวอย่าง "เกิดอะไรขึ้นกับสุนัขของฉัน" ในตัวอย่างที่เป็นปฏิปักษ์
- เพิ่มลิงก์ไปยังไฟล์ข้อมูลและการประมวลผลสคริปต์ R ล่วงหน้า
v0.6 (2018-11-02)
- เพิ่มบทเกี่ยวกับพล็อตเอฟเฟกต์ท้องถิ่นสะสม
- เพิ่มข้อดีและข้อเสียบางประการให้กับ PDPS
- เพิ่มบทเกี่ยวกับการขยายโมเดลเชิงเส้น
- แก้ไขสี่เหลี่ยมจัตุรัสที่ขาดหายไปใน-Statistic Hriedman H-statistic
- เพิ่มการอภิปรายเกี่ยวกับการฝึกอบรมกับข้อมูลการทดสอบในบทสำคัญ
- ปรับปรุงคำจำกัดความนอกจากนี้ยังเพิ่มกราฟิกบางส่วน
- เพิ่มตัวอย่างด้วยคุณสมบัติเชิงหมวดหมู่ไปยัง PDP
v0.5 (2018-08-14)
- เพิ่มบทเกี่ยวกับอินสแตนซ์ที่มีอิทธิพล
- เพิ่มบทเกี่ยวกับกฎการตัดสินใจ
- เพิ่มบทเกี่ยวกับตัวอย่างของเครื่องจักร
- เพิ่มบทเกี่ยวกับต้นแบบและการวิพากษ์วิจารณ์
- เพิ่มบทเกี่ยวกับคำอธิบาย counterfactual
- ส่วนเพิ่มในภาพมะนาว (โดย Verena Haunschmid)
- เพิ่มส่วนเมื่อเราไม่ต้องการความสามารถในการตีความ
- เปลี่ยนชื่อบท: คำอธิบายสไตล์มนุษย์-> คำอธิบายที่เป็นมิตรกับมนุษย์
v0.4 (2018-05-23)
- เพิ่มบทเกี่ยวกับโมเดลตัวแทนทั่วโลก
- เพิ่มรูปสัญลักษณ์ Shapley
- เพิ่มบทกิตติกรรมประกาศบท
- เพิ่มบทการโต้ตอบคุณลักษณะ
- ตัวอย่างที่ดีขึ้นในบทพล็อตการพึ่งพาอาศัยกันบางส่วน
- น้ำหนักในบทข้อความมะนาวที่แสดงด้วยคำที่ไม่ถูกต้อง สิ่งนี้ได้รับการแก้ไขแล้ว
- ปรับปรุงข้อความแนะนำ
- เพิ่มบทเกี่ยวกับอนาคตของการตีความ
- เพิ่มเกณฑ์สำหรับวิธีการตีความ
v0.3 (2018-04-24)
- ทำใหม่บทที่สำคัญของคุณลักษณะ
- เพิ่มเรื่องสั้นที่สาม
- ลบ XKCD การ์ตูน
- รวมการแนะนำและเกี่ยวกับบทหนังสือ
- เพิ่มข้อดีและข้อเสียใน PDP และบทน้ำแข็ง
- เริ่มใช้แพ็คเกจ IML สำหรับแปลงในน้ำแข็งและ PDP
- ปรับโครงสร้างไฟล์หนังสือสำหรับ LeanPub
- เพิ่มฝาครอบ
- เพิ่ม CSS บางส่วนสำหรับการจัดรูปแบบที่ดีกว่า
v0.2 (2018-02-13)
- เพิ่มบทเกี่ยวกับคำอธิบายค่า Shapley
- เพิ่มบทเรื่องสั้น
- เพิ่มลิงค์การบริจาคในคำนำ
- Rulefit ที่ได้รับการปรับปรุงใหม่พร้อมตัวอย่างและทฤษฎี
- บทที่ตีความขยาย
- เพิ่มบทเกี่ยวกับคำอธิบายสไตล์มนุษย์
- ทำให้การทำงานร่วมกันง่ายขึ้น: Travis ตรวจสอบว่าหนังสือสามารถแสดงผลได้สำหรับคำขอดึง
v0.1 (2017-12-03)
- การเปิดตัวหนังสือการเรียนรู้ของเครื่องที่ตีความได้ครั้งแรก