Descarga de Machine Learning with Python - Descarga del código fuente Machine Learning with Python

Machine Learning with Python

Código Fuente de IA

1.0.0

Descargar

Cuadernos Jupyter de aprendizaje automático de Python (sitio web de ML)

Dr. Tirthajyoti Sarkar, Fremont, California (no dude en conectarse en LinkedIn aquí)

Consulte también estos repositorios súper útiles que seleccioné

Artículos útiles y muy citados relacionados con el aprendizaje automático, el aprendizaje profundo, la inteligencia artificial, la teoría de juegos y el aprendizaje por refuerzo.
Enlaces de recursos cuidadosamente seleccionados para ciencia de datos en un solo lugar

Requisitos

Pitón 3.6+
NumPy ( pip install numpy )
Pandas ( pip install pandas )
Scikit-learn ( pip install scikit-learn )
SciPy ( pip install scipy )
Modelos de estadísticas ( pip install statsmodels )
MatplotLib ( pip install matplotlib )
Seaborn ( pip install seaborn )
Sympy ( pip install sympy )
Matraz ( pip install flask )
WTForms ( pip install wtforms )
Tensorflow ( pip install tensorflow>=1.15 )
Keras ( pip install keras )
pdpipe ( pip install pdpipe )

Puedes comenzar con este artículo que escribí en la revista Heartbeat (en la plataforma Medium):

"Algunos trucos y trucos esenciales para el aprendizaje automático con Python"

Cuadernos esenciales tipo tutorial sobre Pandas y Numpy

Cuadernos Jupyter que cubren una amplia gama de funciones y operaciones sobre temas de NumPy, Pandans, Seaborn, Matplotlib, etc.

Operaciones detalladas de Numpy
Operaciones detalladas de Pandas
Conceptos básicos rápidos de Numpy y Pandas
Conceptos básicos rápidos de Matplotlib y Seaborn
Operaciones avanzadas de Pandas
Cómo leer varias fuentes de datos
Demostración de lectura de PDF y procesamiento de tablas
¿Qué tan rápidas son las operaciones de Numpy en comparación con el código Python puro? (Lea mi artículo en Medium relacionado con este tema)
Lectura rápida de Numpy usando el formato de archivo .npy (lea mi artículo en Medium sobre este tema)

Cuadernos tipo tutorial que cubren regresión, clasificación, agrupamiento, reducción de dimensionalidad y algunos algoritmos básicos de redes neuronales.

Regresión

Regresión lineal simple con generación de estadístico t

Múltiples formas de realizar regresión lineal en Python y su comparación de velocidad (consulte el artículo que escribí en freeCodeCamp)
Regresión multivariada con regularización.

Regresión polinomial utilizando la función de canalización scikit-learn (consulte el artículo que escribí sobre Towards Data Science )
Árboles de decisión y regresión de Random Forest (que muestra cómo funciona Random Forest como un metaestimador robusto/regularizado que rechaza el sobreajuste)
Análisis visuales detallados y pruebas de diagnóstico de bondad de ajuste para un problema de regresión lineal
Regresión lineal robusta utilizando HuberRegressor de Scikit-learn

Clasificación

Regresión/clasificación logística (Aquí está el cuaderno)

k -clasificación del vecino más cercano (aquí está el cuaderno)
Árboles de decisión y clasificación de bosques aleatorios (aquí está el cuaderno)
Admite clasificación de máquinas vectoriales (aquí está el cuaderno) ( consulte el artículo que escribí en Towards Data Science sobre SVM y algoritmo de clasificación)

Clasificación ingenua de Bayes (Aquí está el cuaderno)

Agrupación

K significa agrupación (aquí está el cuaderno)
Propagación por afinidad (que muestra su complejidad temporal y el efecto del factor de amortiguación) (aquí está el cuaderno)
Técnica de cambio medio (que muestra su complejidad temporal y el efecto del ruido en el descubrimiento de clústeres) (Aquí está el cuaderno)
DBSCAN (que muestra cómo puede detectar genéricamente áreas de alta densidad independientemente de las formas de los grupos, lo que k-means no logra) (Aquí está el cuaderno)
Agrupación jerárquica con dendogramas que muestran cómo elegir el número óptimo de agrupaciones (aquí está el cuaderno)

Reducción de dimensionalidad

Análisis de componentes principales

Aprendizaje profundo/red neuronal

Cuaderno de demostración para ilustrar la superioridad de la red neuronal profunda para tareas complejas de aproximación de funciones no lineales
Construcción paso a paso de una red densa de 1 capa oculta y 2 capas ocultas utilizando métodos básicos de TensorFlow

Generación aleatoria de datos mediante expresiones simbólicas.

Cómo utilizar el paquete Sympy para generar conjuntos de datos aleatorios utilizando expresiones matemáticas simbólicas.
Aquí está mi artículo en Medium sobre este tema: Generación de problemas de clasificación y regresión aleatoria con expresión simbólica

Técnicas de generación de datos sintéticos.

Cuadernos aquí

Ejemplos de implementación simples (que ofrecen modelos de aprendizaje automático en API web)

Sirviendo un modelo de regresión lineal a través de una interfaz de servidor HTTP simple. El usuario debe solicitar predicciones ejecutando un script de Python. Utiliza Flask y Gunicorn .
Sirve una red neuronal recurrente (RNN) a través de una página web HTTP, completa con un formulario web, donde los usuarios pueden ingresar parámetros y hacer clic en un botón para generar texto basado en el modelo RNN previamente entrenado. Utiliza Flask , Jinja , Keras / TensorFlow , WTForms .

Programación orientada a objetos con aprendizaje automático.

Implementar algunos de los principios básicos de programación orientada a objetos en un contexto de aprendizaje automático mediante la creación de su propio estimador tipo Scikit-learn y mejorarlo.

Vea mis artículos en Medium sobre este tema.

Programación orientada a objetos para científicos de datos: cree su estimador de ML
Cómo una simple combinación de programación orientada a objetos puede perfeccionar su prototipo de aprendizaje profundo

Prueba unitaria de código ML con Pytest

Consulte los archivos y las instrucciones detalladas en el directorio de Pytest para comprender cómo se debe escribir el código/módulo de prueba unitaria para modelos de aprendizaje automático.

Perfiles de memoria y sincronización

Elaborar perfiles de código de ciencia de datos y modelos de aprendizaje automático para determinar la huella de memoria y el tiempo de computación es un área crítica pero a menudo pasada por alto. Aquí os dejo un par de Cuadernos mostrando las ideas,