Cuadernos IPython que demuestran la funcionalidad de aprendizaje profundo.
Tutoriales adicionales de TensorFlow:
Computadora portátil | Descripción |
---|---|
conceptos básicos de tsf | Aprenda operaciones básicas en TensorFlow, una biblioteca para diversos tipos de tareas de percepción y comprensión del lenguaje de Google. |
tsf-lineal | Implementar regresión lineal en TensorFlow. |
tsf-logistica | Implementar regresión logística en TensorFlow. |
tsf-nn | Implemente vecinos más cercanos en TensorFlow. |
tsf-alex | Implemente AlexNet en TensorFlow. |
tsf-cnn | Implemente redes neuronales convolucionales en TensorFlow. |
tsf-mlp | Implemente perceptrones multicapa en TensorFlow. |
tsf-rnn | Implementar redes neuronales recurrentes en TensorFlow. |
tsf-gpu | Obtenga información sobre el cálculo básico de múltiples GPU en TensorFlow. |
tsf-gviz | Obtenga más información sobre la visualización de gráficos en TensorFlow. |
tsf-lviz | Obtenga más información sobre la visualización de pérdidas en TensorFlow. |
Computadora portátil | Descripción |
---|---|
tsf-no-mnist | Aprenda a conservar datos de forma sencilla creando un pickle con conjuntos de datos formateados para entrenamiento, desarrollo y pruebas en TensorFlow. |
tsf-completamente-conectado | Entrene progresivamente modelos más profundos y precisos utilizando regresión logística y redes neuronales en TensorFlow. |
regularización tsf | Explore técnicas de regularización entrenando redes completamente conectadas para clasificar caracteres notMNIST en TensorFlow. |
tsf-convoluciones | Cree redes neuronales convolucionales en TensorFlow. |
tsf-word2vec | Entrene un modelo de salto de gramo sobre datos de Text8 en TensorFlow. |
tsf-lstm | Entrene un modelo de caracteres LSTM sobre datos de Text8 en TensorFlow. |
Computadora portátil | Descripción |
---|---|
theano-introducción | Introducción a Theano, que le permite definir, optimizar y evaluar expresiones matemáticas que involucran matrices multidimensionales de manera eficiente. Puede utilizar GPU y realizar una diferenciación simbólica eficiente. |
theano-scan | Aprenda escaneos, un mecanismo para realizar bucles en un gráfico Theano. |
teano-logistica | Implementar regresión logística en Theano. |
theano-rnn | Implementar redes neuronales recurrentes en Theano. |
theano-mlp | Implementar perceptrones multicapa en Theano. |
Computadora portátil | Descripción |
---|---|
keras | Keras es una biblioteca de redes neuronales de código abierto escrita en Python. Es capaz de ejecutarse sobre Tensorflow o Theano. |
configuración | Conozca los objetivos del tutorial y cómo configurar su entorno Keras. |
introducción-aprendizaje-profundo-ann | Obtenga una introducción al aprendizaje profundo con Keras y redes neuronales artificiales (ANN). |
téano | Aprenda sobre Theano trabajando con matrices de pesos y gradientes. |
keras-otto | Aprenda sobre Keras observando el desafío Kaggle Otto. |
ann-mnist | Revise una implementación simple de ANN para MNIST usando Keras. |
redes-conv | Obtenga más información sobre las redes neuronales convolucionales (CNN) con Keras. |
conv-net-1 | Reconocer dígitos escritos a mano de MNIST usando Keras - Parte 1. |
conv-net-2 | Reconocer dígitos escritos a mano de MNIST usando Keras - Parte 2. |
modelos-keras | Utilice modelos previamente entrenados como VGG16, VGG19, ResNet50 e Inception v3 con Keras. |
codificadores automáticos | Obtenga más información sobre los codificadores automáticos con Keras. |
rnn-lstm | Obtenga más información sobre las redes neuronales recurrentes (RNN) con Keras. |
lstm-sentencia-gen | Obtenga información sobre los RNN que utilizan redes de memoria a corto plazo (LSTM) con Keras. |
Computadora portátil | Descripción |
---|---|
sueño profundo | Programa de visión por computadora basado en Caffe que utiliza una red neuronal convolucional para encontrar y mejorar patrones en imágenes. |
Cuadernos IPython que demuestran la funcionalidad scikit-learn.
Computadora portátil | Descripción |
---|---|
introducción | Cuaderno de introducción a scikit-learn. Scikit-learn agrega soporte de Python para matrices y arreglos multidimensionales grandes, junto con una gran biblioteca de funciones matemáticas de alto nivel para operar en estos arreglos. |
knn | Implemente k-vecinos más cercanos en scikit-learn. |
registro lineal | Implementar regresión lineal en scikit-learn. |
svm | Implemente clasificadores de máquinas de vectores de soporte con y sin kernel en scikit-learn. |
bosque aleatorio | Implemente clasificadores y regresores de bosque aleatorios en scikit-learn. |
k-significa | Implemente la agrupación de k-means en scikit-learn. |
pca | Implementar el análisis de componentes principales en scikit-learn. |
mmm | Implementar modelos de mezcla gaussiana en scikit-learn. |
validación | Implementar validación y selección de modelos en scikit-learn. |
Cuadernos IPython que demuestran inferencia estadística con la funcionalidad SciPy.
Computadora portátil | Descripción |
---|---|
picante | SciPy es una colección de algoritmos matemáticos y funciones de conveniencia creadas en la extensión Numpy de Python. Agrega un poder significativo a la sesión interactiva de Python al proporcionar al usuario comandos y clases de alto nivel para manipular y visualizar datos. |
tamaño del efecto | Explore estadísticas que cuantifiquen el tamaño del efecto analizando la diferencia de altura entre hombres y mujeres. Utiliza datos del Sistema de Vigilancia de Factores de Riesgo del Comportamiento (BRFSS) para estimar la media y la desviación estándar de la altura para mujeres y hombres adultos en los Estados Unidos. |
muestreo | Explore el muestreo aleatorio analizando el peso promedio de hombres y mujeres en los Estados Unidos utilizando datos BRFSS. |
hipótesis | Explore las pruebas de hipótesis analizando la diferencia entre los primogénitos en comparación con otros. |
Cuadernos IPython que demuestran la funcionalidad de pandas.
Computadora portátil | Descripción |
---|---|
pandas | Biblioteca de software escrita para manipulación y análisis de datos en Python. Ofrece estructuras de datos y operaciones para manipular tablas numéricas y series de tiempo. |
disputa-de-datos-de-github | Aprenda a cargar, limpiar, fusionar y diseñar funciones analizando datos de GitHub desde el repositorio Viz . |
Introducción a los pandas | Introducción a los pandas. |
Presentación-de-objetos-pandas | Aprenda sobre los objetos Pandas. |
Indexación y selección de datos | Aprenda sobre la indexación y selección de datos en Pandas. |
Operaciones en pandas | Aprenda a operar con datos en Pandas. |
Valores perdidos | Obtenga información sobre cómo manejar datos faltantes en Pandas. |
Indexación jerárquica | Obtenga información sobre la indexación jerárquica en Pandas. |
Concat-y-añadir | Obtenga información sobre cómo combinar conjuntos de datos: concat y append en Pandas. |
Fusionar y unir | Aprenda a combinar conjuntos de datos: fusionar y unirse en Pandas. |
Agregación y agrupación | Aprenda sobre agregación y agrupación en Pandas. |
Tablas dinámicas | Obtenga más información sobre las tablas dinámicas en Pandas. |
Trabajar con cuerdas | Obtenga más información sobre las operaciones de cadenas vectorizadas en Pandas. |
Trabajar con series de tiempo | Aprenda a trabajar con series temporales en pandas. |
Evaluación y consulta de rendimiento | Obtenga información sobre Pandas de alto rendimiento: eval() y query() en Pandas. |
Cuadernos IPython que demuestran la funcionalidad matplotlib.
Computadora portátil | Descripción |
---|---|
matplotlib | Biblioteca de trazado 2D de Python que produce figuras con calidad de publicación en una variedad de formatos impresos y entornos interactivos en todas las plataformas. |
matplotlib-aplicado | Aplique visualizaciones matplotlib a competencias de Kaggle para análisis de datos exploratorios. Aprenda a crear gráficos de barras, histogramas, subplot2grid, gráficos normalizados, gráficos de dispersión, subgráficos y gráficos de estimación de densidad del núcleo. |
Introducción a Matplotlib | Introducción a Matplotlib. |
Gráficos de líneas simples | Aprenda sobre diagramas de líneas simples en Matplotlib. |
Gráficos de dispersión simples | Aprenda sobre diagramas de dispersión simples en Matplotlib. |
Barras de error.ipynb | Aprenda a visualizar errores en Matplotlib. |
Gráficos de densidad y contorno | Obtenga más información sobre los gráficos de densidad y contorno en Matplotlib. |
Histogramas y binnings | Obtenga información sobre histogramas, agrupaciones y densidad en Matplotlib. |
Personalización-leyendas | Obtenga información sobre cómo personalizar las leyendas de la trama en Matplotlib. |
Personalización de barras de colores | Aprenda a personalizar barras de colores en Matplotlib. |
Subtramas múltiples | Obtenga más información sobre varias subtramas en Matplotlib. |
Texto y anotación | Obtenga información sobre texto y anotaciones en Matplotlib. |
Personalización de ticks | Obtenga información sobre cómo personalizar ticks en Matplotlib. |
Configuraciones y hojas de estilo | Aprenda a personalizar Matplotlib: configuraciones y hojas de estilo. |
Trazado tridimensional | Aprenda sobre el trazado tridimensional en Matplotlib. |
Datos geográficos con mapa base | Obtenga información sobre datos geográficos con mapa base en Matplotlib. |
Visualización con Seaborn | Aprenda sobre visualización con Seaborn. |
Cuadernos IPython que demuestran la funcionalidad NumPy.
Computadora portátil | Descripción |
---|---|
engordado | Agrega compatibilidad con Python para matrices y arreglos multidimensionales grandes, junto con una gran biblioteca de funciones matemáticas de alto nivel para operar en estos arreglos. |
Introducción a NumPy | Introducción a NumPy. |
Comprender los tipos de datos | Obtenga más información sobre los tipos de datos en Python. |
Los-conceptos-básicos-de-las-matrices-NumPy | Conozca los conceptos básicos de las matrices NumPy. |
Computación en matrices ufuncs | Obtenga información sobre cálculos en matrices NumPy: funciones universales. |
Computación-en-arrays-agregados | Obtenga información sobre agregaciones: mínima, máxima y todo lo demás en NumPy. |
Difusión de computación en matrices | Aprenda sobre cálculo en matrices: transmisión en NumPy. |
Matrices-y-máscaras-booleanas | Aprenda sobre comparaciones, máscaras y lógica booleana en NumPy. |
Indexación elegante | Aprenda sobre la indexación elegante en NumPy. |
Clasificación | Obtenga información sobre cómo ordenar matrices en NumPy. |
Datos estructurados NumPy | Obtenga más información sobre datos estructurados: matrices estructuradas de NumPy. |
Cuadernos IPython que demuestran la funcionalidad de Python orientada al análisis de datos.
Computadora portátil | Descripción |
---|---|
estructuras de datos | Aprenda los conceptos básicos de Python con tuplas, listas, dictados y conjuntos. |
utilidades de estructura de datos | Aprenda operaciones de Python como división, rango, rango x, bisección, clasificación, ordenación, inversión, enumeración, compresión, lista por comprensión. |
funciones | Conozca más características avanzadas de Python: funciones como objetos, funciones lambda, cierres, *args, **kwargs curry, generadores, expresiones generadoras, itertools. |
fecha y hora | Aprenda a trabajar con fechas y horas de Python: datetime, strftime, strptime, timedelta. |
explotación florestal | Obtenga información sobre el registro de Python con RotatingFileHandler y TimedRotatingFileHandler. |
pbd | Aprenda a depurar en Python con el depurador de código fuente interactivo. |
pruebas unitarias | Aprenda a realizar pruebas en Python con pruebas unitarias de Nose. |
Cuadernos IPython utilizados en competencias de Kaggle y análisis comerciales.
Computadora portátil | Descripción |
---|---|
titánico | Predice la supervivencia en el Titanic. Aprenda limpieza de datos, análisis exploratorio de datos y aprendizaje automático. |
análisis de abandono | Predecir la pérdida de clientes. Ejercite la regresión logística, clasificadores de aumento de gradiente, máquinas de vectores de soporte, bosques aleatorios y k vecinos más cercanos. Incluye discusiones sobre matrices de confusión, gráficos ROC, importancias de características, probabilidades de predicción y calibración/descriminación. |
Cuadernos IPython que demuestran la funcionalidad Spark y HDFS.
Computadora portátil | Descripción |
---|---|
chispa | Marco informático de clúster en memoria, hasta 100 veces más rápido para determinadas aplicaciones y muy adecuado para algoritmos de aprendizaje automático. |
hdfs | Almacena de manera confiable archivos muy grandes en máquinas en un clúster grande. |
Cuadernos IPython que demuestran Hadoop MapReduce con la funcionalidad mrjob.
Computadora portátil | Descripción |
---|---|
mapreduce-python | Ejecuta trabajos de MapReduce en Python, ejecutando trabajos localmente o en clústeres de Hadoop. Muestra Hadoop Streaming en código Python con prueba unitaria y archivo de configuración mrjob para analizar registros de depósitos de Amazon S3 en Elastic MapReduce. Disco es otra alternativa basada en Python. |
Cuadernos IPython que demuestran la funcionalidad de Amazon Web Services (AWS) y herramientas de AWS.
Consulte también:
Computadora portátil | Descripción |
---|---|
boto | SDK oficial de AWS para Python. |
s3cmd | Interactúa con S3 a través de la línea de comando. |
s3distcp | Combina archivos más pequeños y los agrega tomando un patrón y un archivo de destino. S3DistCp también se puede utilizar para transferir grandes volúmenes de datos desde S3 a su clúster Hadoop. |
s3-paralelo-poner | Carga varios archivos a S3 en paralelo. |
corrimiento al rojo | Actúa como un almacén de datos rápido construido sobre tecnología de procesamiento paralelo masivo (MPP). |
cinesis | Transmite datos en tiempo real con la capacidad de procesar miles de flujos de datos por segundo. |
lambda | Ejecuta código en respuesta a eventos, administrando automáticamente los recursos informáticos. |
Cuadernos IPython que demuestran varias líneas de comando para Linux, Git, etc.
Computadora portátil | Descripción |
---|---|
Linux | Sistema operativo informático similar a Unix y mayoritariamente compatible con POSIX. Uso de disco, división de archivos, grep, sed, curl, visualización de procesos en ejecución, resaltado de sintaxis de terminal y Vim. |
anaconda | Distribución del lenguaje de programación Python para procesamiento de datos a gran escala, análisis predictivo y computación científica, cuyo objetivo es simplificar la gestión y el despliegue de paquetes. |
cuaderno ipython | Entorno computacional interactivo basado en web donde puede combinar ejecución de código, texto, matemáticas, gráficos y medios enriquecidos en un solo documento. |
git | Sistema de control de revisiones distribuido con énfasis en la velocidad, la integridad de los datos y la compatibilidad con flujos de trabajo distribuidos y no lineales. |
rubí | Se utiliza para interactuar con la línea de comandos de AWS y para Jekyll, un marco de blog que se puede alojar en páginas de GitHub. |
jekyll | Generador de sitios estáticos, sencillo y compatible con blogs, para sitios personales, de proyectos u organizaciones. Representa plantillas de Markdown o Textile and Liquid y produce un sitio web estático completo listo para ser atendido por el servidor Apache HTTP, Nginx u otro servidor web. |
pelícano | Alternativa basada en Python a Jekyll. |
Django | Marco web Python de alto nivel que fomenta un desarrollo rápido y un diseño limpio y pragmático. Puede resultar útil para compartir informes/análisis y para blogs. Las alternativas más livianas incluyen Pyramid, Flask, Tornado y Bottle. |
Cuadernos IPython que demuestran diversas funciones.
Computadora portátil | Descripción |
---|---|
expresión regular | Hoja de trucos de expresiones regulares útil en la manipulación de datos. |
algoritmia | Algorithmia es un mercado para algoritmos. Este portátil presenta 4 algoritmos diferentes: detección de rostros, resumen de contenido, asignación de Dirichlet latente y reconocimiento óptico de caracteres. |
Anaconda es una distribución gratuita del lenguaje de programación Python para procesamiento de datos a gran escala, análisis predictivo e informática científica que tiene como objetivo simplificar la administración y la implementación de paquetes.
Siga las instrucciones para instalar Anaconda o la miniconda más liviana.
Para obtener instrucciones detalladas, scripts y herramientas para configurar su entorno de desarrollo para el análisis de datos, consulte el repositorio dev-setup.
Para ver contenido interactivo o modificar elementos dentro de los cuadernos de IPython, primero debe clonar o descargar el repositorio y luego ejecutar el cuaderno. Puede encontrar más información sobre los portátiles IPython aquí.
$ git clone https://github.com/donnemartin/data-science-ipython-notebooks.git
$ cd data-science-ipython-notebooks
$ jupyter notebook
Cuadernos probados con Python 2.7.x.
¡Las contribuciones son bienvenidas! Para informes de errores o solicitudes, envíe un problema.
No dude en ponerse en contacto conmigo para discutir cualquier problema, pregunta o comentario.
Este repositorio contiene una variedad de contenidos; algunos desarrollados por Donne Martin y otros de terceros. El contenido de terceros se distribuye bajo la licencia proporcionada por esos terceros.
El contenido desarrollado por Donne Martin se distribuye bajo la siguiente licencia:
Le proporciono código y recursos en este repositorio bajo una licencia de código abierto. Debido a que este es mi repositorio personal, la licencia que recibe para mi código y mis recursos es mía y no de mi empleador (Facebook).
Copyright 2015 Donne Martin
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.