pip install numpy
)pip install pandas
)pip install scikit-learn
)pip install scipy
)pip install statsmodels
)pip install matplotlib
)pip install seaborn
)pip install sympy
)pip install flask
)pip install wtforms
)pip install tensorflow>=1.15
)pip install keras
)pip install pdpipe
)Puedes comenzar con este artículo que escribí en la revista Heartbeat (en la plataforma Medium):
Cuadernos Jupyter que cubren una amplia gama de funciones y operaciones sobre temas de NumPy, Pandans, Seaborn, Matplotlib, etc.
Múltiples formas de realizar regresión lineal en Python y su comparación de velocidad (consulte el artículo que escribí en freeCodeCamp)
Regresión multivariada con regularización.
Regresión polinomial utilizando la función de canalización scikit-learn (consulte el artículo que escribí sobre Towards Data Science )
Árboles de decisión y regresión de Random Forest (que muestra cómo funciona Random Forest como un metaestimador robusto/regularizado que rechaza el sobreajuste)
Análisis visuales detallados y pruebas de diagnóstico de bondad de ajuste para un problema de regresión lineal
Regresión lineal robusta utilizando HuberRegressor
de Scikit-learn
k -clasificación del vecino más cercano (aquí está el cuaderno)
Árboles de decisión y clasificación de bosques aleatorios (aquí está el cuaderno)
Admite clasificación de máquinas vectoriales (aquí está el cuaderno) ( consulte el artículo que escribí en Towards Data Science sobre SVM y algoritmo de clasificación)
K significa agrupación (aquí está el cuaderno)
Propagación por afinidad (que muestra su complejidad temporal y el efecto del factor de amortiguación) (aquí está el cuaderno)
Técnica de cambio medio (que muestra su complejidad temporal y el efecto del ruido en el descubrimiento de clústeres) (Aquí está el cuaderno)
DBSCAN (que muestra cómo puede detectar genéricamente áreas de alta densidad independientemente de las formas de los grupos, lo que k-means no logra) (Aquí está el cuaderno)
Agrupación jerárquica con dendogramas que muestran cómo elegir el número óptimo de agrupaciones (aquí está el cuaderno)
Cómo utilizar el paquete Sympy para generar conjuntos de datos aleatorios utilizando expresiones matemáticas simbólicas.
Aquí está mi artículo en Medium sobre este tema: Generación de problemas de clasificación y regresión aleatoria con expresión simbólica
Sirviendo un modelo de regresión lineal a través de una interfaz de servidor HTTP simple. El usuario debe solicitar predicciones ejecutando un script de Python. Utiliza Flask
y Gunicorn
.
Sirve una red neuronal recurrente (RNN) a través de una página web HTTP, completa con un formulario web, donde los usuarios pueden ingresar parámetros y hacer clic en un botón para generar texto basado en el modelo RNN previamente entrenado. Utiliza Flask
, Jinja
, Keras
/ TensorFlow
, WTForms
.
Implementar algunos de los principios básicos de programación orientada a objetos en un contexto de aprendizaje automático mediante la creación de su propio estimador tipo Scikit-learn y mejorarlo.
Vea mis artículos en Medium sobre este tema.
Consulte los archivos y las instrucciones detalladas en el directorio de Pytest para comprender cómo se debe escribir el código/módulo de prueba unitaria para modelos de aprendizaje automático.
Elaborar perfiles de código de ciencia de datos y modelos de aprendizaje automático para determinar la huella de memoria y el tiempo de computación es un área crítica pero a menudo pasada por alto. Aquí os dejo un par de Cuadernos mostrando las ideas,