해석 가능한 기계 학습
기계 학습 모델의 결정과 행동을 설명합니다.
요약
이 책의 현재 버전을 여기에서 찾을 수 있습니다 : https://christophm.github.io/interpretable-ml-book/
이 책은 해석 가능한 기계 학습에 관한 것입니다. 머신 러닝은 일상 생활의 많은 제품과 프로세스에 내장되어 있지만 기계에 의한 결정에는 자동으로 설명이 나오지 않습니다. 설명은 의사 결정과 기계 학습 모델에 대한 신뢰를 증가시킵니다. 알고리즘의 프로그래머로서 학습 된 모델을 신뢰할 수 있는지 알고 싶습니다. 일반화 가능한 기능을 배웠습니까? 아니면 알고리즘이 선택한 교육 데이터에 이상한 아티팩트가 있습니까? 이 책은 블랙 박스를 가능한 한 투명하게 만들고 결정을 설명하는 데 사용할 수있는 기술에 대한 개요를 제공합니다. 첫 번째 장에서는 간단하고 해석 가능한 모델을 생성하는 알고리즘이 출력 해석 방법과 함께 소개됩니다. 후반 장은 복잡한 모델과 결정을 분석하는 데 중점을 둡니다. 이상적인 미래에는 기계가 자신의 결정을 설명하고 알고리즘 시대로 전환 할 수 있습니다. 이 책은 기계 학습 실무자, 데이터 과학자, 통계 학자 및 기계 학습 및 지능형 알고리즘 사용을 결정하는 이해 관계자에게 권장됩니다.
이 책은 마스터 브랜치에서 자동으로 지어졌으며 Github 액션에 의해 GH-Pages로 밀려납니다.
기여
기여하는 방법을보십시오
책을 렌더링합니다
저장소를 복제하십시오.
git clone [email protected]:christophM/interpretable-ml-book.git
책의 모든 종속성이 설치되어 있는지 확인하십시오. 이 책에는 R 패키지의 구조가 있으므로 종속성을 쉽게 설치할 수 있으며 R과 DevTools 라이브러리 만 필요합니다. 책 저장소 폴더에서 R 세션을 시작하고 다음을 입력하십시오.
책을 렌더링하려면 R 세션을 시작하고 다음을 입력하십시오.
setwd("manuscript")
# first, generate the references
source("../scripts/references.R")
bookdown::render_book('.', 'bookdown::gitbook')
렌더링 후 책의 HTML 파일은 "_Book"폴더에 있습니다. index.html을 직접 클릭하거나 물론 r에서 할 수 있습니다.
browseURL('_book/index.html')
lulu.com으로 인쇄에 대한 메모
- 7.44 "x 9.68"18.9cm x 24.6cm의 Leandpub에서 수출
- 표지 : 7.565 x 9.925 ", 19.226 x 25.224cm, 권장 크기를 참조하십시오.
- 앞 표지 용 글꼴 : Francois One
글쓰기
Leandpub 및 Bookdown에서 모두 작동하는 것 :
- 타이틀은 #, ## 등 자막으로 시작합니다.
- 타이틀은 {##of-the-title}을 사용하여 태그를 붙일 수 있습니다.
-
[text of the link](#tag-of-the-title)
사용하여 장을 참조 할 수 있습니다. - 수치는
[text of the link](#fig:tag-of-r-chunk-that-produced-figure)
-
$
(인라인) 또는 $$
(추가 선)로 수학 표현식을 시작하고 종료합니다. regexpr을 사용하여 Leandpub의 경우 자동으로 변경됩니다. 변환 스크립트는 빈 공간이 공식에없는 경우에만 작동합니다. - 공식과 텍스트 사이에 빈 줄을 남겨 두십시오 (공식이 인라인이 아닌 경우). 공식 ($$ ... $$ 포함)은 한 줄에 있어야하며 여러 줄에는 구문 분석기로 인해).
- 참고 문헌은 다음과 같이 작성되어야하며
[^ref-tag]
[^ref]: Details of the reference ...
. 공간이 포함되어 있는지 확인하십시오. 참조는 스크립트 참조와 함께 10-Reference.rmd로 수집됩니다. [^ref-tag]:
텍스트의 어느 곳에서나 실제 참조를 위해 바닥에만 사용하지 마십시오.
추가 라인 간격으로 교정을위한 인쇄 : HTML 책 빌드, 원고/_book/libs/gitbook*/css/style.css로 이동, 라인 높이 변경 : 1.7에서 라인 높이 : 2.5, 크롬이있는 로컬 HTML을 열고 인쇄 맞춤 마진이있는 PDF.
changelog
이 책에 대한 모든 주목할만한 변경 사항은 여기에 문서화됩니다.
v2.0 (진행중인) [HTML 버전]
- "저자에 의한 서문"장을 추가했습니다
- 신경망 해석에 관한 섹션이 시작되었습니다
- 기능 시각화에 대한 장이 추가되었습니다
- 추가 Shap 챕터
- 앵커 챕터가 추가되었습니다
- 로지스틱 회귀의 고정 오류 장 : 로지스틱 회귀는 "건강한"클래스를 예측했지만 텍스트의 해석은 클래스 "암"에 대한 것이 었습니다. 이제 회귀 가중치에는 올바른 부호가 있습니다.
- "순열 기능 중요성"으로 이름이 바뀌 었습니다.
- 기능 분해에 대한 장을 추가했습니다
- 지역, 글로벌 및 딥 러닝에 의한 재 배열 된 해석 방법 (이전 : 모델-공유, 예제 기반, 딥 러닝)
- 정오표:
- 4.3 장 GLM, GAM 등 : 로지스틱 회귀는 로지 기능이 아닌 로지트를 링크 함수로 사용합니다.
- 챕터 선형 모델 : 조정 된 R- 제곱에 대한 공식이 수정되었습니다 (두 번)
- 장 결정 규칙 : oner 챕터에서 건강과 암 사이의 새로 도입 된 혼합이 고정되었습니다.
- Chapter Rulefit : 총 중요성 공식에서 선형 항의 중요성은 $ l $ 대신 $ j $ .
- 업데이트 된 이미지
v1.1 (2019-03-23) [인쇄 버전, eBook 버전]
- Cooks 거리의 잘못된 색인 수정 (I-> J)
- 고정 BoxPlot 공식 (1.58 대신 1.5)
- Colorblind 친화적 인 컬러 팔레트로 변경 (Viridis)
- 음모가 흑백으로 작동하는지 확인하십시오.
- MOC (Susanne Dandl에 의해)와 함께 반 사실적 장을 확장
v1.0 (2019-02-21)
v0.7 (2018-11-21)
- 정의로 이름이 변경됩니다
- 용어에 수학 표기법이 추가되었습니다 (이전 정의) 장
- LASSO 예제가 추가되었습니다
- LM 장을 재구성하고 장단점을 추가했습니다
- "해석 가능성 방법의 분류"로 "해석 가능성 방법의 기준"으로 이름이 변경되었습니다.
- 로지스틱 회귀의 장점과 단점이 추가되었습니다
- 책 끝에서 참조 목록이 추가되었습니다
- 단편 소설에 이미지를 추가했습니다
- Shapley 가치의 단점 : 기능은 독립적이어야합니다.
- 나무 분해와 특징 중요성이 트리 챕터에 추가되었습니다
- LM의 개별 예측에 대한 개선 된 설명
- Adversarial 사례에 "내 개에게 무엇이 잘못되었는지"예제를 추가했습니다.
- 데이터 파일 및 사전 처리 r 스크립트에 대한 링크가 추가되었습니다
v0.6 (2018-11-02)
- 누적 된 로컬 효과 플롯에 대한 장이 추가되었습니다
- PDP에 몇 가지 장점과 단점이 추가되었습니다
- 선형 모델 확장에 대한 장이 추가되었습니다
- Friedman H-Statistic에서 누락 된 사각형을 고정했습니다
- 기능 중요도의 교육 대 테스트 데이터에 대한 토론이 추가되었습니다.
- 정의를 개선하고 일부 그래픽을 추가했습니다
- PDP에 범주 형 기능이있는 예를 추가했습니다
v0.5 (2018-08-14)
- 영향력있는 인스턴스에 대한 장이 추가되었습니다
- 의사 결정 규칙에 대한 장이 추가되었습니다
- Adversarial Machine 예제에 장이 추가되었습니다
- 프로토 타입 및 비판에 대한 장을 추가했습니다
- 반반에 대한 설명에 장이 추가되었습니다
- 라임 이미지에 추가 된 섹션 (Verena Haunschmid)
- 해석 가능성이 필요하지 않을 때 섹션이 추가되었습니다
- 이름이 바뀌는 장 : 인간 스타일의 설명-> 인간 친화적 인 설명
V0.4 (2018-05-23)
- 글로벌 대리 모델에 대한 장이 추가되었습니다
- 개선 된 Shapley Pictograms가 추가되었습니다
- 추가 승인 챕터
- 기능 상호 작용 장이 추가되었습니다
- 부분 의존성 플롯 장의 개선 된 예
- 라임 텍스트 장의 무게는 잘못된 단어로 표시됩니다. 이것은 고정되었습니다.
- 개선 된 소개 텍스트
- 해석의 미래에 대한 장을 추가했습니다
- 해석 가능성 방법에 대한 기준이 추가되었습니다
v0.3 (2018-04-24)
- 기능 중요 장을 재 작업했습니다
- 세 번째 단편 소설이 추가되었습니다
- XKCD 만화를 제거했습니다
- 병합 된 소개 및 책 장에 관한
- PDP 및 ICE 장에 장단점을 추가했습니다
- ICE 및 PDP의 플롯을위한 IML 패키지 사용을 시작했습니다.
- Leandpub의 책 파일을 재구성했습니다
- 표지를 추가했습니다
- 더 좋은 형식을 위해 일부 CSS가 추가되었습니다
v0.2 (2018-02-13)
- Shapley Value 설명에 대한 장이 추가되었습니다
- 짧은 이야기 장을 추가했습니다
- 서문에 기부 링크가 추가되었습니다
- 예와 이론이있는 Ruleft.
- 해석 가능성 장 확장
- 휴먼 스타일의 설명에 장을 추가하십시오
- 공동 작업을보다 쉽게하기 : Travis는 풀 요청에 대한 책을 렌더링 할 수 있는지 확인합니다.
v0.1 (2017-12-03)
- 해석 가능한 기계 학습 서적의 첫 번째 릴리스