Aprendizado de máquina interpretável
Explicando as decisões e o comportamento dos modelos de aprendizado de máquina.
Resumo
Você pode encontrar a versão atual do livro aqui: https://christophm.github.io/interpretable-ml-book/
Este livro é sobre aprendizado de máquina interpretável. O aprendizado de máquina está sendo incorporado a muitos produtos e processos de nossas vidas diárias, mas as decisões tomadas por máquinas não vêm automaticamente com uma explicação. Uma explicação aumenta a confiança na decisão e no modelo de aprendizado de máquina. Como programador de um algoritmo, você deseja saber se pode confiar no modelo aprendido. Aprendeu recursos generalizáveis? Ou existem alguns artefatos estranhos nos dados de treinamento que o algoritmo aumentou? Este livro fornecerá uma visão geral sobre as técnicas que podem ser usadas para fazer caixas pretas o mais transparentes possível e explicar as decisões. No primeiro capítulo, os algoritmos que produzem modelos simples e interpretáveis são introduzidos juntamente com instruções como interpretar a saída. Os capítulos posteriores se concentram na análise de modelos complexos e suas decisões. Em um futuro ideal, as máquinas poderão explicar suas decisões e fazer uma transição para uma idade algorítmica mais humana. Este livro é recomendado para profissionais de aprendizado de máquina, cientistas de dados, estatísticos e também para as partes interessadas que decidem o uso de aprendizado de máquina e algoritmos inteligentes.
O livro é construído automaticamente a partir da filial mestre e empurrado para as páginas GH pelas ações do GitHub.
Contribuindo
Veja como contribuir
Renderizando o livro
Clone o repositório.
git clone [email protected]:christophM/interpretable-ml-book.git
Verifique se todas as dependências do livro estão instaladas. Este livro possui a estrutura de um pacote R, para que as dependências possam ser instaladas facilmente, apenas R e a Biblioteca Devtools é necessária. Inicie uma sessão R na pasta do repositório do livro e digite:
Para renderizar o livro, inicie uma sessão R e digite:
setwd("manuscript")
# first, generate the references
source("../scripts/references.R")
bookdown::render_book('.', 'bookdown::gitbook')
Após a renderização, os arquivos HTML do livro estarão na pasta "_book". Você pode clicar duas vezes em index.html diretamente ou, é claro, fazê-lo em r:
browseURL('_book/index.html')
Notas sobre impressão com lulu.com
- Exportar de LeanPub em 7,44 "x 9,68" 18,9cm x 24,6cm
- Para cobertura: 7.565 x 9.925 ", 19.226 x 25.224cm, consulte tamanhos recomendados
- Fonte para a capa: Francois One
Escrita
Coisas que funcionam para Leanpub e para Bookdown:
- Os títulos começam com #, legendas com ## e assim por diante.
- Os títulos podem ser marcados usando {#tag-of-the-título}
- Os capítulos podem ser referenciados usando
[text of the link](#tag-of-the-title)
- Os números podem ser referenciados usando
[text of the link](#fig:tag-of-r-chunk-that-produced-figure)
- Iniciar e final expressões matemáticas com
$
(em linha) ou com $$
(linha extra). Será alterado automaticamente para o LeanPub com um regexpr. O script de conversão funciona apenas se não houver espaços vazios na fórmula. - Deixe linhas vazias entre fórmulas e texto (se a fórmula não estiver embutida). As fórmulas (com $$ ... $$) devem estar em uma linha e não em várias linhas (devido ao analisador).
- As referências devem ser escritas assim:
[^ref-tag]
e devem estar no final do respectivo arquivo com [^ref]: Details of the reference ...
Verifique se o espaço está incluído. As referências são coletadas em 10-reference.rmd com as referências de script.r. Certifique-se de não usar [^ref-tag]:
em qualquer lugar do texto, apenas na parte inferior para a referência real.
Impressão para revisão com espaçamento extra de linha: construir um livro html, acesse manuscrito/_book/libs/gitbook*/css/style.css, altere a altura da linha: 1.7 para altura de linha: 2.5, abra HTML local com Chrome, imprimir para imprimir para PDF com margem personalizada.
Changelog
Todas as alterações notáveis no livro serão documentadas aqui.
v2.0 (em andamento) [versão html]
- Adicionado "Prefácio pelo autor" capítulo
- Seção iniciada sobre interpretação da rede neural
- Capítulo adicionado sobre a visualização de recursos
- Capítulo de Shap adicionado
- Capítulo de âncoras adicionadas
- Erro corrigido no capítulo de regressão logística: A regressão logística estava prevendo a classe "saudável", mas a interpretação no texto era para "câncer de classe". Agora, os pesos de regressão têm o sinal correto.
- Renomeado Capítulo de Importance de Recurso para "Importância do recurso de permutação"
- Capítulo adicionado sobre decomposição funcional
- Métodos de interpretação reorganizados por aprendizado local, global e profundo (antes: Modelo-Agnóstico, Aprendizagem Deep e Baseada em Exempostos)
- Errata:
- CAPÍTULO 4.3 GLM, GAM E MAIS: A regressão logística usa logit, não a função logística como função de link.
- Capítulo Modelos Lineares: A fórmula para R-Squared ajustada foi corrigida (duas vezes)
- Regras de decisão do capítulo: A mistura recém -introduzida entre o Capítulo Saudável e Câncer foi corrigida.
- Capítulo Regrafit: A importância do termo linear na importância total de importância foi indexada com um $ L $ em vez de $ j $ .
- Imagens atualizadas
v1.1 (2019-03-23) [versão impressa, versão ebook]
- Corrige o índice errado na soma da distância de cozinheiros (i -> j)
- Fórmula corrigida de boxplot (1,5 em vez de 1,58)
- Mudança para paletas de cores adequadas para a cor de cor (viridis)
- Verifique se as parcelas também funcionam em preto e branco
- Estende o capítulo contrafactual com o MOC (por Susanne Dandl)
v1.0 (2019-02-21)
- Extensa revisão e polimento
v0.7 (2018-11-21)
- Renomeado Capítulo Definições para Terminologia
- Notação matemática adicionada ao capítulo de terminologia (definições anteriores)
- Exemplo de lasso adicionado
- Capítulo LM reestruturado e adicionado prós/contras
- Renomeado "Critérios de Métodos de Interpretação" para "Taxonomia de Métodos de Interpretabilidade"
- Adicionado vantagens e desvantagens da regressão logística
- Lista adicionada de referências no final do livro
- Imagens adicionadas aos contos
- Adicionado desvantagem do Shapley Valor: o recurso deve ser independente
- Adicionada decomposição de árvores e importância ao capítulo da árvore
- Melhor explicação da previsão individual em LM
- Acrescentou exemplo "o que há de errado com meu cachorro" aos exemplos adversários
- Links adicionados a arquivos de dados e scripts de pré-processamento R
v0.6 (2018-11-02)
- Capítulo adicionado sobre parcelas de efeitos locais acumulados
- Adicionou algumas vantagens e desvantagens aos PDPs
- Capítulo adicionado sobre a extensão de modelos lineares
- Fixo quadrado ausente no Friedman H-Statistic
- Adicionado discussão sobre treinamento versus dados de teste no capítulo de importância do recurso
- Melhorou as definições, também adicionou alguns gráficos
- Adicionado um exemplo com um recurso categórico ao PDP
v0.5 (2018-08-14)
- Capítulo adicionado sobre instâncias influentes
- Capítulo adicionado sobre regras de decisão
- Capítulo adicionado sobre exemplos de máquinas adversárias
- Capítulo adicionado sobre protótipos e críticas
- Capítulo adicionado sobre explicações contrafactuais
- Seção adicionada sobre imagens de cal (de Verena Haunschmid)
- Seção adicionada sobre quando não precisamos de interpretabilidade
- Capítulo renomeado: Explicações de estilo humano-> Explicações amigas do ser humano
v0.4 (2018-05-23)
- Capítulo adicionado sobre modelos de substitutos globais
- Adicionado pictogramas de shapey aprimorados
- Capítulo Agradecimentos adicionados
- Capítulo de interação de recurso adicionado
- Exemplo aprimorado no capítulo da parcela de dependência parcial
- Os pesos no capítulo de texto de cal, onde mostrados com as palavras erradas. Isso foi corrigido.
- Texto de introdução aprimorado
- Capítulo adicionado sobre o futuro da interpretabilidade
- Critérios adicionados para métodos de interpretabilidade
v0.3 (2018-04-24)
- Rework o capítulo de importância do recurso
- Adicionado terceiro conto
- Removido xkcd Comic
- Introdução mesclada e sobre os capítulos do livro
- Adicionado prós e contras aos capítulos de PDP e gelo
- Comecei a usar o pacote IML para gráficos em gelo e PDP
- Reestruturou os arquivos do livro para Leanpub
- Adicionou uma tampa
- Adicionado alguns CSs para formatação mais agradável
v0.2 (2018-02-13)
- Capítulo adicionado sobre explicações de valor de Shapley
- Capítulos de história curta adicionados
- Links de doação adicionados no prefácio
- Regra reformulado com exemplos e teoria.
- Capítulo Interpretabilidade estendida
- Adicione o capítulo sobre explicações de estilo humano
- Facilitando a colaboração: travis cheques se o livro puder ser renderizado para solicitações de tração
v0.1 (2017-12-03)
- Primeira liberação do livro interpretável de aprendizado de máquina