Aprendizaje automático interpretable
Explicando las decisiones y el comportamiento de los modelos de aprendizaje automático.
Resumen
Puede encontrar la versión actual del libro aquí: https://christophm.github.io/interpretable-ml-book/
Este libro trata sobre el aprendizaje automático interpretable. El aprendizaje automático se está integrando en muchos productos y procesos de nuestra vida cotidiana, sin embargo, las decisiones tomadas por las máquinas no tienen una explicación automáticamente. Una explicación aumenta la confianza en la decisión y en el modelo de aprendizaje automático. Como programador de un algoritmo, desea saber si puede confiar en el modelo aprendido. ¿Aprendió características generalizables? ¿O hay algunos artefactos impares en los datos de capacitación que el algoritmo recogió? Este libro dará una visión general sobre las técnicas que se pueden utilizar para hacer que las cajas negras sean lo más transparentes posible y explicar las decisiones. En el primer capítulo, los algoritmos que producen modelos simples e interpretables se introducen junto con instrucciones sobre cómo interpretar la salida. Los capítulos posteriores se centran en analizar modelos complejos y sus decisiones. En un futuro ideal, las máquinas podrán explicar sus decisiones y hacer una transición a una edad algorítmica más humana. Se recomienda estos libros para profesionales de aprendizaje automático, científicos de datos, estadísticos y también para las partes interesadas que deciden el uso del aprendizaje automático y los algoritmos inteligentes.
El libro se construye automáticamente a partir de la rama maestra y se empuja a las páginas de GH Github.
Que contribuye
Ver cómo contribuir
Renderizando el libro
Clon el repositorio.
git clone [email protected]:christophM/interpretable-ml-book.git
Asegúrese de que se instalen todas las dependencias para el libro. Este libro tiene la estructura de un paquete R, por lo que las dependencias se pueden instalar fácilmente, solo se requiere R y la Biblioteca DevTools. Comience una sesión R en la carpeta del repositorio de libros y escriba:
Para representar el libro, comience una sesión R y escriba:
setwd("manuscript")
# first, generate the references
source("../scripts/references.R")
bookdown::render_book('.', 'bookdown::gitbook')
Después de representar, los archivos HTML del libro estarán en la carpeta "_book". Puede hacer doble clic en index.html directamente o, por supuesto, hacerlo en r:
browseURL('_book/index.html')
Notas sobre la impresión con Lulu.com
- Exportar desde LeanPub en 7.44 "x 9.68" 18.9cm x 24.6cm
- Para cobertura: 7.565 x 9.925 ", 19.226 x 25.224cm, ver tamaños recomendados
- Fuente para la cubierta frontal: Francois One
Escribiendo
Cosas que funcionan para LeanPub y para Bookdown:
- Los títulos comienzan con #, subtítulos con ## y así sucesivamente.
- Los títulos se pueden etiquetar usando {#etiqueta del tito}
- Los capítulos se pueden hacer referencia utilizando
[text of the link](#tag-of-the-title)
- Las figuras se pueden hacer referencia utilizando
[text of the link](#fig:tag-of-r-chunk-that-produced-figure)
- Inicie y termine las expresiones matemáticas con
$
(en línea) o con $$
(línea adicional). Se cambiará automáticamente para LeanPub con un RegExpr. El script de conversión solo funciona si no hay espacios vacíos en la fórmula. - Deje líneas vacías entre fórmulas y texto (si fórmula no está en línea). Las fórmulas (con $$ ... $$) deben estar en una línea y no sobre múltiples líneas (debido al analizador).
- Las referencias deben escribirse así:
[^ref-tag]
y deben estar al final del archivo respectivo con [^ref]: Details of the reference ...
Asegúrese de que el espacio esté incluido. Las referencias se recopilan en 10-reference.rmd con las referencias de script. R. Asegúrese de no usar [^ref-tag]:
en cualquier lugar del texto, solo en la parte inferior para la referencia real.
Impresión para la revisión con un espacio de línea adicional: construir libro HTML, visitar el manuscrito/_book/libs/gitbook*/css/style.css, cambiar la línea de línea: 1.7 a la altura de línea: 2.5, abrir html local con Chrome, imprimir a PDF con margen personalizado.
Colegio de cambios
Todos los cambios notables en el libro se documentarán aquí.
v2.0 (en progreso) [Versión HTML]
- Capítulo agregado "Prefacio por el autor"
- Sección iniciada sobre interpretación de la red neuronal
- Capítulo agregado sobre visualización de funciones
- Capítulo SHAP agregado
- Capítulo de anclajes agregados
- Error fijo en el capítulo de regresión logística: la regresión logística predecía la clase "saludable", pero la interpretación en el texto era para la clase "cáncer". Ahora los pesos de regresión tienen el signo correcto.
- CAPÍTULO DE IMPORTANCIA DE FUNCIONES CAMBIADO A LA "Permutación de la importancia de la característica"
- Capítulo agregado sobre la descomposición funcional
- Métodos de interpretación reorganizados por aprendizaje local, global y profundo (antes: aprendizaje profundo basado en el ejemplo del modelo)
- Errata:
- Capítulo 4.3 GLM, GAM y más: la regresión logística usa logit, no la función logística como función de enlace.
- Modelos lineales del capítulo: se corrigió la fórmula para R-cuadrado ajustado (dos veces)
- Reglas de decisión del capítulo: Se solucionó la mezcla recientemente introducida entre sano y cáncer en el capítulo Oner.
- Capítulo de reglas: la importancia del término lineal en la importancia total formulada se indexó con un $ L $ en lugar de $ j $ .
- Imágenes actualizadas
V1.1 (2019-03-23) [Versión impresa, versión de libro electrónico]
- Corrección del índice incorrecto en la suma de distancia Cooks (i -> j)
- Fórmula de diagrama de caja fijo (1.5 en lugar de 1.58)
- Cambiar a paletas de colores amigables con los colorblind (Viridis)
- Asegúrese de que las tramas funcionen en blanco y negro también
- Extiende el capítulo contrafactual con MOC (por Susanne Dandl)
V1.0 (2019-02-21)
- Revisión y pulido extensos
V0.7 (2018-11-21)
- Capítulo de definiciones renombrado a la terminología
- Capítulo de notación matemática agregada al Capítulo de terminología (definiciones anteriores)
- Ejemplo de lazo agregado
- Capítulo LM reestructurado y pros/contras adicionales
- Renombrado "Criterios de métodos de interpretabilidad" a "taxonomía de métodos de interpretabilidad"
- Ventajas y desventajas adicionales de la regresión logística
- Se agregó una lista de referencias al final del libro
- Imágenes agregadas a las historias cortas
- Incribuible adicional del valor de Shapley: la función debe ser independiente
- Descomposición de árbol agregada y característica de importancia para el Capítulo de árboles
- Explicación mejorada de la predicción individual en LM
- Se agregó el ejemplo de "qué pasa con mi perro" a los ejemplos adversos
- Enlaces agregados a archivos de datos y scripts R previa al procesamiento
V0.6 (2018-11-02)
- Capítulo agregado sobre parcelas de efectos locales acumulados
- Agregó algunas ventajas y desventajas a PDPS
- Capítulo agregado sobre la extensión de modelos lineales
- Se corrigió el cuadrado faltante en la estadística de Friedman H
- Discusión adicional sobre la capacitación versus datos de prueba en el capítulo de importancia de características
- Mejoró las definiciones, también agregó algunos gráficos
- Se agregó un ejemplo con una característica categórica a PDP
V0.5 (2018-08-14)
- Capítulo agregado sobre instancias influyentes
- Capítulo agregado sobre reglas de decisión
- Capítulo agregado sobre ejemplos de máquina adversas
- Capítulo agregado sobre prototipos y críticas
- Capítulo agregado sobre explicaciones contrafactuales
- Sección agregada sobre imágenes de cal (por Verena Haunschmid)
- Sección agregada sobre cuándo no necesitamos interpretabilidad
- Capítulo renombrado: Explicaciones de estilo humano-> Explicaciones amigables para los humanos
V0.4 (2018-05-23)
- Capítulo agregado sobre modelos sustitutos globales
- Se agregaron pictogramas de Shapley mejorados
- Capítulo de reconocimientos agregados
- Capítulo de interacción de funciones agregado
- Ejemplo mejorado en el capítulo de la parcela de dependencia parcial
- Los pesos en el Capítulo del texto de lima se muestran con las palabras incorrectas. Esto ha sido arreglado.
- Texto de introducción mejorado
- Capítulo agregado sobre el futuro de la interpretabilidad
- Criterios agregados para métodos de interpretabilidad
V0.3 (2018-04-24)
- Reelaboró el capítulo de importancia de la característica
- Se agregó la tercera historia corta
- Eliminado el cómic xkcd
- Introducción fusionada y sobre los capítulos de los libros
- Pros y contras agregados a los capítulos PDP y ICE
- Comenzó a usar el paquete IML para tramas en hielo y PDP
- Reestructurado los archivos de libros para LeanPub
- Se agregó una cubierta
- Se agregó algunos CSS para un formato más agradable
V0.2 (2018-02-13)
- Capítulo agregado sobre explicaciones de valor de Shapley
- Capítulos de cuento cortos agregados
- Enlaces de donación agregados en prefacio
- Fit de reglas reelaborado con ejemplos y teoría.
- Capítulo de interpretabilidad extendido
- Agregar capítulo sobre explicaciones de estilo humano
- Haciendo que sea más fácil colaborar: cheques de Travis si el libro se puede representar para las solicitudes de extracción
V0.1 (2017-12-03)
- Primer lanzamiento del libro de aprendizaje automático interpretable