Интерпретируемое машинное обучение
Объяснение решений и поведения моделей машинного обучения.
Краткое содержание
Вы можете найти текущую версию книги здесь: https://christophm.github.io/interpretable-ml-book/
Эта книга о интерпретируемом машинном обучении. Машинное обучение встроено во многие продукты и процессы нашей повседневной жизни, но решения, принятые машинами, не автоматически поставляются с объяснением. Объяснение увеличивает доверие к решению и модели машинного обучения. Как программист алгоритма, вы хотите знать, можете ли вы доверять обученной модели. Он изучал обобщаемые функции? Или есть какие -то странные артефакты в учебных данных, которые подобрал алгоритм? Эта книга даст обзор по технике, которые можно использовать для того, чтобы сделать черные ящики максимально прозрачными и объяснить решения. В первой главе алгоритмы, которые создают простые, интерпретируемые модели вводятся вместе с инструкциями, как интерпретировать выход. Поздние главы сосредоточены на анализе сложных моделей и их решениях. В идеальном будущем машины смогут объяснить свои решения и сделать переход в алгоритмический век более человечным. Эти книги рекомендуются для практиков машинного обучения, ученых данных, статистиков, а также для заинтересованных сторон, решающих использование машинного обучения и интеллектуальных алгоритмов.
Книга автоматически построена из главной ветви и подталкивается на GH-страницы Github Actions.
Внося
Посмотрите, как внести свой вклад
Предоставление книги
Клонировать репозиторий.
git clone [email protected]:christophM/interpretable-ml-book.git
Убедитесь, что все зависимости для книги установлены. Эта книга имеет структуру пакета R, поэтому зависимости могут быть легко установлены, требуется только R и библиотека Devtools. Запустите сеанс R в папке репозитория книги и введите:
Для визуализации книги, запустите сеанс R и введите:
setwd("manuscript")
# first, generate the references
source("../scripts/references.R")
bookdown::render_book('.', 'bookdown::gitbook')
После рендеринга HTML -файлы книги будут в папке "_Book". Вы можете либо дважды щелкнуть index.html напрямую, либо, конечно, сделать это в R:
browseURL('_book/index.html')
Заметки о печати с Lulu.com
- Экспорт из LeanPub в 7,44 "x 9,68" 18,9 см х 24,6 см
- Для обложки: 7,565 x 9,925 ", 19.226 x 25,224 см, см. Рекомендуемые размеры
- Шрифт для обложки передней
Письмо
Вещи, которые работают как для Leanpub, так и для Bookdown:
- Названия начинаются с #, субтитров с ## и так далее.
- Названия можно пометить с помощью {#Tag-of The Title}
- В главы можно ссылаться с использованием
[text of the link](#tag-of-the-title)
- На рисунки можно ссылаться с использованием
[text of the link](#fig:tag-of-r-chunk-that-produced-figure)
- Начните и заканчивайте математические выражения с
$
(inline) или с $$
(дополнительная линия). Будет автоматически изменен для LeanPub с помощью Regexpr. Сценарий преобразования работает только в том случае, если в формуле нет пустых мест. - Оставьте пустые строки между формулами и текстом (если формула не встроена). Формулы (с $$ ... $$) должны быть в одной строке, а не на нескольких строках (из -за анализатора).
- Ссылки должны быть написаны так:
[^ref-tag]
и должны быть в конце соответствующего файла с [^ref]: Details of the reference ...
Убедитесь, что пространство включено. Ссылки собираются в 10-reference.rmd со сценариями. Убедитесь, что не используйте [^ref-tag]:
где-либо в тексте, только внизу для фактической ссылки.
Печать для корректуры с дополнительным расстоянием между линиями: построить книгу HTML, перейдите в Manuscript/_Book/Libs/GitBook*/css/style.css, изменение линии: 1,7 на высоту линии: 2.5, Откройте локальный html с хромом, печать на PDF с пользовательской маржой.
Изменение
Все заметные изменения в книге будут задокументированы здесь.
v2.0 (в процессе) [HTML -версия]
- Добавлена глава «Предисловие автора»
- Запуск раздела о интерпретации нейронной сети
- Добавлена глава о визуализации функций
- Добавлена глава формы
- Добавлена глава якорей
- Фиксированная ошибка в главе логистической регрессии: логистическая регрессия предсказывала класс «здоровый», но интерпретация в тексте была для класса «рак». Теперь веса регрессии имеет правильный знак.
- Переименованная главная важность функции «Особенность пермизации особенности»
- Добавлена глава о функциональном разложении
- Перестроенные методы интерпретации по локальному, глобальному и глубокому обучению (ранее: модель-агрессия, на основе примеров, глубокое обучение)
- Ошибки:
- Глава 4.3 GLM, GAM и другие: логистическая регрессия использует Logit, а не логистическую функцию в качестве функции ссылки.
- Глава линейные модели: формула для скорректированного R-квадрата была исправлена (дважды)
- Правила решения главы: недавно введенное смешивание между здоровым и раком в главе Oner было зафиксировано.
- Глава правил: важность линейного термина в сформулировании общей важности была проиндексирована с $ l $ вместо $ J $ Полем
- Обновленные изображения
v1.1 (2019-03-23) [Печатная версия, версия электронной книги]
- Исправляет неправильный индекс в сумме расстояния повара (i -> j)
- Формула с фиксированной диаграммой (1,5 вместо 1,58)
- Изменить на цветовые цветовые палитры, удобные для цвета (viridis)
- Убедитесь, что участки также работают в черно -белом
- Распространяет контрфактуальную главу с MOC (Сюзанна Дандл)
v1.0 (2019-02-21)
- Обширная корректура и полировка
v0.7 (2018-11-21)
- Переименованные определения главы к терминологии
- Добавлена математическая нотация к главе терминологии (прежние определения)
- Добавлен пример Lasso
- Реструктурированная глава LM и добавленные плюсы/минусы
- Переименованные «критерии методов интерпретации» к «таксономии методов интерпретации»
- Добавлены преимущества и недостатки логистической регрессии
- Добавлен список ссылок в конце книги
- Добавлены изображения в рассказы
- Добавлен недостаток значения Шапли: функция должна быть независимой
- Добавлена разложение деревьев и важность для главы деревьев
- Улучшено объяснение индивидуального прогнозирования в LM
- Добавил пример «что не так с моей собакой» в примеры состязания
- Добавлены ссылки на файлы данных и предварительную обработку R сценариев
v0.6 (2018-11-02)
- Добавлена глава о накопленных локальных графиках эффектов
- Добавил некоторые преимущества и недостатки в PDP
- Добавлена глава о расширении линейных моделей
- Исправлен отсутствующий квадрат в Friedman H-статистике
- Добавлено обсуждение обучения по сравнению с данными тестирования в главе «Значение значений»
- Улучшены определения, также добавили некоторую графику
- Добавлен пример с категориальной функцией в PDP
v0.5 (2018-08-14)
- Добавлена глава о влиятельных случаях
- Добавлена глава о правилах принятия решений
- Добавлена глава о примерах состязательных машин
- Добавлена глава по прототипам и критике
- Добавлена глава о контрфактивных объяснениях
- Добавлен раздел на изображениях извести (Verena Haunschmid)
- Добавлен раздел о том, когда нам не нужна интерпретация
- Переименованная Глава: Объяснения в стиле человека-> Объяснения, благоприятные для человека
v0.4 (2018-05-23)
- Добавлена глава о глобальных суррогатных моделях
- Добавлены улучшенные пиктограммы Shapley
- Добавлена глава подтверждения
- Добавлена глава взаимодействия с функциями
- Улучшенный пример в главе участка частичной зависимости
- Веса в главе текста извести, где показаны не теми словами. Это было исправлено.
- Улучшенный введение текст
- Добавлена глава о будущем интерпретации
- Добавлены критерии для методов интерпретации
v0.3 (2018-04-24)
- Переработал главу важности функции
- Добавлен третий рассказ
- Удален XKCD Comic
- Объединенное введение и в главы книги
- Добавлены плюсы и минусы в главы PDP и ICE
- Начало использовать пакет IML для участков в ICE и PDP
- Реструктурировал файлы книги для LeanPub
- Добавил крышку
- Добавил несколько CSS для более хорошего форматирования
v0.2 (2018-02-13)
- Добавлена глава о объяснениях ценности Шапли
- Добавлены главы рассказов
- Добавлены ссылки на пожертвования в предисловии
- Переработал правила с примерами и теорией.
- Глава интерпретации расширена
- Добавить главу о объяснениях в стиле человека
- Облегчение совместной работы: Трэвис проверяет, может ли книга быть отображена для запросов на привлечение
v0.1 (2017-12-03)
- Первый релиз интерпретационной книги машинного обучения