Pembelajaran mesin yang dapat ditafsirkan
Menjelaskan keputusan dan perilaku model pembelajaran mesin.
Ringkasan
Anda dapat menemukan versi buku saat ini di sini: https://christophm.github.io/interpretable-ml-book/
Buku ini adalah tentang pembelajaran mesin yang dapat ditafsirkan. Pembelajaran mesin sedang dibangun ke dalam banyak produk dan proses kehidupan kita sehari -hari, namun keputusan yang dibuat oleh mesin tidak secara otomatis datang dengan penjelasan. Penjelasan meningkatkan kepercayaan pada keputusan dan model pembelajaran mesin. Sebagai programmer dari suatu algoritma, Anda ingin tahu apakah Anda dapat mempercayai model yang dipelajari. Apakah itu mempelajari fitur yang dapat digeneralisasikan? Atau apakah ada beberapa artefak aneh dalam data pelatihan yang diambil algoritma? Buku ini akan memberikan gambaran umum tentang teknik yang dapat digunakan untuk membuat kotak hitam seanugerasi mungkin dan menjelaskan keputusan. Dalam bab pertama algoritma yang menghasilkan model sederhana dan dapat ditafsirkan diperkenalkan bersama dengan instruksi bagaimana menafsirkan output. Bab -bab selanjutnya fokus pada menganalisis model kompleks dan keputusan mereka. Di masa depan yang ideal, mesin akan dapat menjelaskan keputusan mereka dan melakukan transisi ke zaman algoritmik lebih manusiawi. Buku -buku ini direkomendasikan untuk praktisi pembelajaran mesin, ilmuwan data, ahli statistik dan juga untuk pemangku kepentingan yang memutuskan penggunaan pembelajaran mesin dan algoritma cerdas.
Buku ini secara otomatis dibangun dari cabang master dan didorong ke halaman GH oleh tindakan github.
Berkontribusi
Lihat Cara Berkontribusi
Rendering buku itu
Klon Repositori.
git clone [email protected]:christophM/interpretable-ml-book.git
Pastikan semua dependensi untuk buku ini diinstal. Buku ini memiliki struktur paket R, sehingga dependensi dapat diinstal dengan mudah, hanya R dan perpustakaan Devtools diperlukan. Mulai sesi R di folder repositori buku dan ketik:
Untuk membuat buku, mulai sesi R dan ketik:
setwd("manuscript")
# first, generate the references
source("../scripts/references.R")
bookdown::render_book('.', 'bookdown::gitbook')
Setelah rendering, file HTML dari buku ini akan berada di folder "_book". Anda dapat mengklik dua kali index.html secara langsung atau, tentu saja, melakukannya di R:
browseURL('_book/index.html')
Catatan tentang Pencetakan dengan lulu.com
- Ekspor dari LeanPub di 7.44 "x 9.68" 18.9cm x 24.6cm
- Untuk penutup: 7.565 x 9.925 ", 19.226 x 25.224cm, lihat ukuran yang disarankan
- Font untuk sampul depan: Francois One
Menulis
Hal -hal yang keduanya berfungsi untuk LeanPub dan untuk bookdown:
- Judul dimulai dengan #, subtitle dengan ## dan sebagainya.
- Judul dapat ditandai menggunakan {#tag-of-the-title}
- Bab dapat dirujuk dengan menggunakan
[text of the link](#tag-of-the-title)
- Angka dapat direferensikan dengan menggunakan
[text of the link](#fig:tag-of-r-chunk-that-produced-figure)
- Mulai dan akhiri ekspresi matematika dengan
$
(inline) atau dengan $$
(garis tambahan). Akan diubah secara otomatis untuk LeanPub dengan RegExpr. Skrip konversi hanya berfungsi jika tidak ada ruang kosong dalam rumus. - Tinggalkan garis kosong antara formula dan teks (jika formula tidak sejalan). Rumus (dengan $$ ... $$) harus dalam satu baris dan tidak lebih dari beberapa baris (karena parser).
- Referensi harus ditulis seperti ini:
[^ref-tag]
dan harus berada di akhir file masing-masing dengan [^ref]: Details of the reference ...
Pastikan ruang sudah termasuk. Referensi dikumpulkan dalam 10-referensi.rmd dengan referensi skrip. Pastikan untuk tidak menggunakan [^ref-tag]:
di mana saja dalam teks, hanya di bagian bawah untuk referensi aktual.
Pencetakan untuk proofreading dengan jarak garis ekstra: Bangun buku html, buka naskah/_book/lib/gitbook*/css/style.css, ubah garis-garis: 1,7 menjadi garis-garis: 2.5, buka html lokal dengan krom, cetak ke ke PDF dengan margin khusus.
Changelog
Semua perubahan penting pada buku ini akan didokumentasikan di sini.
V2.0 (sedang berlangsung) [Versi HTML]
- Menambahkan Bab "Kata Pengantar oleh Penulis"
- Bagian Mulai tentang Interpretasi Jaringan Saraf
- Tambahan Bab tentang Visualisasi Fitur
- Menambahkan Bab Shap
- Menambahkan bab jangkar
- Kesalahan tetap dalam Bab Regresi Logistik: Regresi logistik memprediksi kelas "sehat", tetapi interpretasi dalam teks adalah untuk "kanker" kelas. Sekarang bobot regresi memiliki tanda yang benar.
- Berganti nama menjadi bab penting fitur untuk "Permutasi Fitur Pentingnya"
- Menambahkan bab tentang dekomposisi fungsional
- Metode interpretasi yang disusun ulang dengan pembelajaran lokal, global dan mendalam (sebelum: model-agnostik, berbasis contoh, pembelajaran mendalam)
- Errata:
- Bab 4.3 GLM, GAM dan Lainnya: Regresi logistik menggunakan logit, bukan fungsi logistik sebagai fungsi tautan.
- Bab Model Linear: Formula untuk R-Squared yang Disesuaikan dikoreksi (dua kali)
- Aturan Keputusan Bab: Perlamuan yang baru diperkenalkan antara Bab Sehat dan Kanker di Oner telah diperbaiki.
- Bab RuleFit: Pentingnya istilah linier dalam rumusan kepentingan total diindeks dengan $ l $ alih-alih $ j $ .
- Gambar yang diperbarui
V1.1 (2019-03-23) [Versi cetak, versi ebook]
- Memperbaiki indeks yang salah dalam penjumlahan jarak memasak (i -> j)
- Fefied Boxplot Formula (1,5 bukannya 1,58)
- Ubah Palet Warna Friendly ColorBlind (Viridis)
- Pastikan plot bekerja dalam warna hitam dan putih juga
- Memperluas bab kontrafaktual dengan MOC (oleh Susanne Dandl)
V1.0 (2019-02-21)
- Proofreading dan pemolesan yang luas
V0.7 (2018-11-21)
- Berganti nama menjadi bab definisi menjadi terminologi
- Menambahkan Notasi Matematika untuk Terminologi (Definisi sebelumnya) Bab
- Menambahkan contoh laso
- Bab LM yang direstrukturisasi dan penambahan pro/kontra
- Berganti nama menjadi "kriteria metode interpretabilitas" menjadi "taksonomi metode interpretabilitas"
- Menambahkan keuntungan dan kerugian dari regresi logistik
- Menambahkan daftar referensi di akhir buku
- Menambahkan gambar ke cerita pendek
- Menambahkan kelemahan nilai shapley: fitur harus mandiri
- Menambahkan dekomposisi pohon dan fitur penting untuk bab pohon
- Peningkatan penjelasan prediksi individu di LM
- Menambahkan contoh "apa yang salah dengan anjing saya"
- Menambahkan tautan ke file data dan skrip R pra-pemrosesan
V0.6 (2018-11-02)
- Tambahan Bab tentang Akumulasi Plot Efek Lokal
- Menambahkan beberapa keuntungan dan kerugian pada PDP
- Tambahan bab tentang memperluas model linier
- Memperbaiki persegi yang hilang di friedman h-statistik
- Menambahkan diskusi tentang pelatihan vs data uji di bab penting fitur
- Meningkatkan definisi, juga menambahkan beberapa grafik
- Menambahkan contoh dengan fitur kategori ke PDP
V0.5 (2018-08-14)
- Menambahkan bab tentang contoh yang berpengaruh
- Menambahkan bab tentang aturan keputusan
- Tambahan bab tentang contoh mesin permusuhan
- Menambahkan bab tentang prototipe dan kritik
- Tambahan bab tentang penjelasan kontrafaktual
- Bagian yang ditambahkan pada gambar kapur (oleh Verena Haunschmid)
- Menambahkan bagian saat kita tidak membutuhkan interpretabilitas
- Bab Berganti nama: Penjelasan Gaya Manusia-> Penjelasan Ramah Manusia
V0.4 (2018-05-23)
- Tambahan bab tentang model pengganti global
- Menambahkan piktogram shapley yang ditingkatkan
- Menambahkan Bab Ucapan Terima Kasih
- Bab Interaksi Fitur Menambahkan
- Contoh yang lebih baik dalam bab plot ketergantungan parsial
- Bab -bobot dalam bab teks kapur di mana ditunjukkan dengan kata -kata yang salah. Ini telah diperbaiki.
- Teks pengantar yang ditingkatkan
- Tambahan bab tentang masa depan interpretabilitas
- Menambahkan kriteria untuk metode interpretabilitas
V0.3 (2018-04-24)
- Mengolah ulang bab penting fitur
- Menambahkan cerita pendek ketiga
- Komik XKCD yang dihapus
- Pendahuluan yang digabungkan dan tentang bab -bab buku
- Menambahkan Pro & Kontra ke PDP dan Bab Es
- Mulai menggunakan paket IML untuk plot dalam ICE dan PDP
- Merestrukturisasi file buku untuk LeanPub
- Menambahkan penutup
- Menambahkan beberapa CSS untuk pemformatan yang lebih baik
V0.2 (2018-02-13)
- Tambahan Bab Tentang Penjelasan Nilai Shapley
- Menambahkan bab cerita pendek
- Menambahkan tautan donasi di Kata Pengantar
- RuleFit yang dikerjakan ulang dengan contoh dan teori.
- Bab Interpretabilitas Diperpanjang
- Tambahkan bab tentang penjelasan gaya manusia
- Membuatnya lebih mudah untuk berkolaborasi: Travis memeriksa apakah buku dapat diberikan untuk permintaan tarik
V0.1 (2017-12-03)
- Rilis pertama buku pembelajaran mesin yang dapat ditafsirkan