Creado por Tang Yudi
La intención original de organizar este proyecto es facilitar a los estudiantes el inicio rápido del plan de autoaprendizaje de inteligencia artificial, evitar desvíos en el proceso de aprendizaje y comenzar con la IA lo más rápido posible e iniciar proyectos prácticos . y proyectos Estos no están en línea. Lo que he recopilado son casos desarrollados y acumulados por mí en los últimos cinco años de enseñanza en línea y fuera de línea. Se puede decir que se han actualizado repetida e iterativamente y son adecuados para que los estudiantes aprendan y practiquen paso a paso. Estudiantes que vengan aquí, ¡recuerden hacer clic en una estrella para guardarla!
A finales de 2019, publiqué el libro de texto de apoyo para el curso de aprendizaje automático "Aprenda el análisis de datos de Python y la práctica del aprendizaje automático con Diego". El estilo aún es fácil de entender. Me tomó dos años y más de diez revisiones finalmente conocerlo. . Para facilitar que más estudiantes comiencen su plan de estudio rápidamente, decidí ofrecerles la versión electrónica de este libro de forma gratuita . ¡Espero que pueda aportar beneficios de aprendizaje a todos! Puede descargar la versión PDF en la página de inicio de este proyecto. Si le gustan los materiales didácticos, también puede comprarlos en JD.com.
"Aprenda el análisis de datos de Python y la práctica del aprendizaje automático con Diego" Descarga original en PDF :
(Enlace del disco de red: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ Código de extracción: tece)
El siguiente catálogo es la ruta de aprendizaje. Se recomienda a los principiantes que estudien en el orden indicado en el catálogo. Los estudiantes que ya han comenzado pueden elegir según sus propias preferencias.
Los datos involucrados en el caso son todos conjuntos de datos reales, y algunos serán bastante grandes. Cargarlos directamente en github será muy lento para que todos los descarguen. Gradualmente subiré los enlaces del disco de red de cada módulo, que incluyen datos y código. , PPT y otros recursos de aprendizaje. Si necesita una explicación en video de apoyo, agregue WeChat: digexiaozhushou (Pinyin del pequeño asistente de Di Ge)
Si tiene algún problema de cooperación, comunicación o proyecto en varios aspectos, puede agregar WeChat directamente: digexiaozhushou (Pinyin de Dige Assistant)
Para aprender inteligencia artificial (ciencia de datos), todavía necesitas algunas habilidades básicas. ¡Las más básicas y básicas son Python y matemáticas ! No es difícil para estos dos hermanos comenzar. ¡Está bien dominar los conceptos básicos primero y aprender mientras los usas!
Si no está familiarizado con Python, le sugiero que vea mi curso en video introductorio de Python para comenzar rápidamente. portal
¡La explicación más directa es que todo el mundo lo usa! Solía ser programación orientada a objetos, pero luego la gente prefirió la programación de copiar y pegar, y ahora son demasiado vagos para programar para GitHub. Es cierto, tienes que ser vago cuando deberías serlo, y Python hace esto. ! Todo el contenido práctico posterior se basará en Python, ¡así que no tienes otra opción!
¡Anaconda es suficiente! ¡Anaconda es suficiente! ¡Anaconda es suficiente! Bien, lo he dicho tres veces. Para obtener una explicación detallada, consulte el curso del portal anterior.
El kit de herramientas significa que otros han escrito todas las funciones y podemos llamarlo directamente y ¡listo! Existen kits de herramientas correspondientes para procesamiento de datos, análisis, modelado, etc. Para aprender, no es necesario memorizar estos kits de herramientas. Primero debe familiarizarse con ellos y definitivamente necesitará usarlos y verificarlos más tarde.
Nombre del kit de herramientas | Resumen de funciones |
---|---|
numpy | ¡Imprescindible para los cálculos matriciales! Es el núcleo de todos los cálculos posteriores y el conjunto de herramientas principal en el campo de la ciencia de datos. |
pandas | ¡Imprescindible para el procesamiento de datos! ¡Él debe realizar la lectura, el procesamiento y el análisis de datos! |
Matplotlib | ¡La visualización es imprescindible! La función es muy poderosa. ¡No hay imagen que no se pueda dibujar! ¡El análisis y la visualización dependen de ella! |
nacido en el mar | ¡Una herramienta de visualización más sencilla! Una línea de código le brinda una visualización visual de los resultados. |
Los estudiantes deben ser muy conscientes de lo importantes que son las matemáticas, especialmente en el campo de la inteligencia artificial (ciencia de datos). Es difícil hacer algo sin saber matemáticas. Muchos estudiantes me han hecho una pregunta: ¿se pueden realmente utilizar tantas matemáticas en el trabajo? ? Déjame explicarte que la industria de la inteligencia artificial se está desarrollando muy rápidamente. En el trabajo real, ¿qué debes aprender mientras lo haces? Deben ser algunos de los artículos más destacados actualmente. Si ni siquiera puedes entender las fórmulas matemáticas básicas, entonces no hay necesidad de hablar de tecnología de alta gama. Los estudiantes en este campo definitivamente tendrán esta idea. ¡La llamada inteligencia artificial simplemente hace varios cálculos matemáticos con datos!
No creo que sea necesario empezar desde cero y dedicar mucho tiempo a aprender paso a paso. Por ejemplo, mis colegas, amigos y yo hemos estado haciendo esto durante mucho tiempo. Estudié matemáticas. He resuelto innumerables preguntas a veces, pero también me encontraré con este problema. Muchos puntos de conocimiento se olvidarán rápidamente si no los he mirado por un tiempo. Una de las cosas que hago con más frecuencia es buscar cualquier cosa que uso. El proceso de búsqueda es en realidad un proceso de aprendizaje y progreso. Se recomienda que analice rápidamente los puntos de conocimiento comunes (matemáticas avanzadas, linealidad, conceptos básicos de la teoría de la probabilidad). Durante este proceso, no observe varios procesos de resolución de problemas ni se preocupe por los métodos de solución específicos. Para decirlo sin rodeos, solo comprenda Lo que hace una fórmula y para qué se usa es suficiente. Similar a los ejercicios del libro de texto y las soluciones del libro de ejercicios, no los necesitará en el futuro. Un bolígrafo para calcular estas cosas problemáticas. ¡Ahorre tiempo para estudiar! ¡Los algoritmos son más rentables!
Puntos de conocimiento | contenido | efecto |
---|---|---|
Matemáticas Avanzadas | Conceptos básicos de matemáticas avanzadas, cálculo, fórmula de Taylor y Lagrange, | Esencial para derivar fórmulas de aprendizaje automático |
álgebra lineal | Conceptos básicos de álgebra lineal, valores propios y descomposición matricial, | Necesario para la solución del algoritmo. |
teoría de la probabilidad | Conceptos básicos de la teoría de la probabilidad, variables aleatorias y estimación de probabilidad, distribuciones de uso común. | El aprendizaje automático a menudo menciona estas palabras |
Análisis estadístico | Análisis de regresión, prueba de hipótesis, análisis de correlación, análisis de varianza. | Esencial para el análisis de datos |
El núcleo del campo de la inteligencia artificial es el aprendizaje automático. No importa qué dirección desee seguir en el futuro, ¡debe comenzar con el aprendizaje automático! Hay dos cosas principales: la primera es dominar los principios de los algoritmos clásicos y la segunda es dominar el uso del conjunto de herramientas de Python para el modelado práctico.
¿Qué aprender sobre algoritmos? Comprender cómo operan los algoritmos de aprendizaje automático con datos para completar el proceso de modelado y solución. Para decirlo sin rodeos, significa familiarizarse con cómo se utilizan las matemáticas en los algoritmos. ¡Lo importante es entender! No te detengas interminablemente en un problema, es una pérdida de tiempo y es posible que puedas resolverlo en poco tiempo durante el proceso de aprendizaje posterior. Creo que debes estudiar los algoritmos más de una vez, especialmente para los estudiantes que se están preparando para una entrevista de trabajo. Es normal estudiar el algoritmo dos o tres veces (un compañero me dijo una vez que estudió el curso un total de 6 veces antes de la entrevista). )
Con el aprendizaje profundo, ¿sigue siendo necesario el aprendizaje automático?
Se puede decir que el aprendizaje profundo es un tipo de algoritmo de aprendizaje automático, lo que no significa que no se necesiten otros algoritmos clásicos con las redes neuronales. Se debe seleccionar el algoritmo más apropiado en función de diferentes tareas y datos. Aprendizaje automático. De hecho, ¡es realmente fácil observar las redes neuronales después de dominar estos algoritmos clásicos!
Puntos de conocimiento | contenido | Descripción general |
---|---|---|
Algoritmo de clasificación | Regresión logística, árbol de decisión, máquina de vectores de soporte, algoritmo de conjunto, algoritmo bayesiano | Los estudiantes que se preparan para entrevistas deben dominar |
Algoritmo de regresión | Regresión lineal, árboles de decisión, algoritmos de conjunto. | Algunos algoritmos pueden realizar tanto clasificación como regresión. |
Algoritmo de agrupamiento | k-means, dbscan, etc. | Sólo se considera no supervisado cuando realmente no existe ninguna etiqueta. |
Algoritmo de reducción de dimensionalidad | Análisis de componentes principales, análisis discriminante lineal, etc. | Centrarse en comprender la idea de reducción de dimensionalidad. |
Algoritmos avanzados | Algoritmo de refuerzo GBDT, lightgbm, algoritmo EM, modelo oculto de Markov | Los estudiantes que tienen tiempo y energía pueden desafiar algoritmos avanzados |
Analice el impacto de los métodos y parámetros de modelado de algoritmos clásicos en los resultados a través de experimentos comparativos y comprenda los parámetros y ejemplos de aplicación en los algoritmos a través de experimentos y presentaciones visuales.
Nombre del caso | Resumen de contenido |
---|---|
Análisis experimental de regresión lineal. | Domine la regresión lineal univariada y múltiple, los métodos de regresión no lineal y el papel de la penalización de regularización. |
Método de evaluación del modelo | Comparación de métodos de evaluación de algoritmos de clasificación y regresión comúnmente utilizados, ejemplos de segmentación de conjuntos de datos |
Análisis experimental de regresión logística. | Método de construcción del modelo de clasificación clásico, método de dibujo de límites del árbol de decisión |
Análisis experimental del algoritmo de agrupamiento. | Ejemplos de modelado no supervisado, métodos de evaluación de algoritmos de agrupamiento, roles no supervisados y ejemplos de aplicaciones. |
Análisis experimental del árbol de decisión. | Ejemplos de visualización de modelos de árbol y métodos de construcción, aplicaciones de clasificación y regresión de modelos de árbol. |
Análisis experimental de algoritmo integrado. | Ejemplos de aplicación y análisis de efectos de métodos de integración, comparación de estrategias de integración comunes. |
Análisis experimental de máquinas de vectores de soporte. | SVM implica parámetros y experimentos de comparación de modelos. |
Análisis práctico de las reglas de asociación. | Puntos de conocimiento esenciales y ejemplos de análisis de modelos de reglas de asociación |
Para comprender mejor el mecanismo del algoritmo, reproducimos el algoritmo clásico desde cero, nos adherimos al principio de no pérdida de paquetes y completamos todos los módulos requeridos por el algoritmo paso a paso.
El objetivo principal es comprender mejor el principio de funcionamiento del algoritmo, ¡y el énfasis está en la práctica! Los estudiantes que tienen tiempo pueden reproducirlo ellos mismos, pero los estudiantes que tienen poco tiempo no tienen que hacerlo ellos mismos.
Nombre del caso | Resumen de contenido |
---|---|
Implementación de código de regresión lineal | Funciones comúnmente utilizadas de algoritmos de construcción de módulos. |
Implementación del código de regresión logística. | Ejemplo de interpretación del método de implementación de regresión logística |
Implementación del código Kmeans | Algoritmo no supervisado muy simple y fácil de entender. |
Implementación del código del árbol de decisiones | El modelo de árbol es en realidad una implementación recursiva. |
Implementación de código de red neuronal | La cantidad de código es ligeramente grande, por lo que se recomienda aprender el modo de depuración. |
Implementación de código bayesiano | Bayes es aún más fácil de explicar en tareas de texto. |
Implementación del código de reglas de asociación | Algoritmos de análisis de datos comúnmente utilizados |
Construye un sistema de recomendación de música. | Construya un modelo de sistema de recomendación desde cero |
En el combate real, los puntos de conocimiento matemático pueden debilitarse, porque la mayoría de las veces usamos kits de herramientas ya preparados para completar tareas (hombre de transferencia de paquetes). Hay muchas funciones de ahorro de energía que todos deben dominar aquí. La primera es dominar el uso de estos conjuntos de herramientas comunes. El preprocesamiento de datos, la ingeniería de funciones, el ajuste de parámetros y la verificación son pasos muy básicos. En resumen, los procesos y rutinas necesarios para completar diferentes tareas son similares, pero los métodos y algoritmos utilizados pueden ser diferentes, lo que requiere que todos acumulen continuamente para enriquecer la experiencia práctica. ¡Estos casos proporcionados a los estudiantes pueden usarse como sus propias plantillas prácticas!
Lo más importante es aprender a preprocesar y analizar diferentes datos (valores numéricos, texto, imágenes), aplicar hábilmente las principales funciones centrales del conjunto de herramientas para participar en el preprocesamiento, proponer múltiples soluciones para diferentes tareas y realizar análisis experimentales. En resumen, haga más experimentos y más trabajo práctico. ¡Cuanto más escriba código, más competente se volverá!
Nombre del caso | Resumen de contenido |
---|---|
K algoritmo del vecino más cercano en la práctica | Caso introductorio de aprendizaje automático, dominio del conjunto de herramientas aplicadas a métodos de modelado. |
Detección de anomalías en los datos de transacciones | Muy importante, análisis detallado y comparación de estrategias de modelado y procesamiento de datos. |
Práctica de modelado de algoritmos integrados. | No necesito decir más sobre la integración, es una estrategia central imprescindible. |
Predicción de temperatura basada en bosque aleatorio. | El bosque aleatorio es el algoritmo más utilizado en el aprendizaje automático. |
Práctica de clasificación de noticias. | Análisis y procesamiento de datos de texto y modelado práctico basado en algoritmo bayesiano. |
Análisis de prácticas de agrupación | Ejemplos de aplicaciones no supervisadas |
análisis de series de tiempo | Método de producción de datos de series de tiempo, modelado basado en datos de secuencia. |
Advertencia de abandono de usuarios | Suelo decir que los usuarios de Fantasy Westward Journey están perdiendo, esto es solo una DEMOSTRACIÓN |
Utilice lightgbm para predecir el tráfico del hotel | Otro gran asesino, incluso peor que xgboost |
Práctica del proyecto de conjunto de datos del censo: pronóstico de ingresos | Están todas las plantillas centrales, análisis de datos, visualización, etc. |
Optimización bayesiana en la práctica | Ejemplos de uso del kit de herramientas de optimización bayesiana más difíciles |
Comparación de métodos de características de texto. | Comparación de métodos de extracción de características comúnmente utilizados para datos de texto |
Haz tu propio kit de herramientas | Haz tu propio bolso para divertirte |
Nombre del caso | Resumen de contenido |
---|---|
Reglas prácticas de asociación de Python | Es muy fácil utilizar el conjunto de herramientas para crear reglas de asociación |
Análisis y modelado de conjuntos de datos de Airbnb | Ejemplos de modelado y análisis de conjuntos de datos de precios de vivienda |
Sistema de recomendación de hoteles basado en similitud | Construir un sistema de recomendación para completar recomendaciones de hoteles. |
Análisis de regresión de ventas de productos. | La previsión de ventas, una tarea muy rutinaria, se puede realizar con métodos rutinarios. |
Análisis y modelado de exploración de conjuntos de datos de PUBG. | Conjunto de datos de PlayerUnknown's Battlegrounds, veamos quién te mató |
Método de interpretación del modelo en la práctica. | ¿Cómo interpretar el modelo después del modelado? Estos kits de herramientas pueden ayudarle a hacerlo. |
Conjunto de herramientas esenciales para el procesamiento del lenguaje natural en la práctica | Interpretación de conjuntos de herramientas comunes de PNL y ejemplos prácticos. |
Previsión de probabilidad de pago de clientes bancarios | Datos de clientes bancarios para predecir la probabilidad de pago |
Práctica de análisis de grupos de características de imagen | ¿Cómo agrupar datos de imágenes? |
Práctica del proyecto de conjunto de datos del censo: pronóstico de ingresos | Están todas las plantillas centrales, análisis de datos, visualización, etc. |
Todo el mundo escucha la palabra análisis de datos todos los días, pero ¿qué debemos hacer? No es más que obtener información valiosa a partir de datos, y todavía existen muchos métodos y rutinas. Esta dirección no requiere ninguna acumulación teórica, ¡solo usa los datos y hazlo! ¡La acumulación de casos es el proceso de aprendizaje!
En pocas palabras, la minería de datos es la aplicación de algoritmos de aprendizaje automático a cantidades masivas de datos para obtener los resultados deseados. El enfoque en la minería de datos no es la elección del algoritmo de aprendizaje automático, sino cómo procesar los datos para obtener mejores resultados de predicción. Aquí la ingeniería de características y el preprocesamiento se convertirán en la solución principal.
Nombre del caso | Resumen de contenido |
---|---|
Predicciones del rescate del Titanic | Caso de competencia clásico de Kaggle, el primer proyecto práctico para la minería de datos de nivel básico |
Construcción de características de datos | La ingeniería de funciones es el núcleo de la minería de datos. Basado en sklearn, se explican varios métodos de construcción de funciones. |
Práctica de retrato de usuario | Todo el mundo debe haber oído hablar de los retratos de usuarios. ¿Cómo aplicar datos para completar el retrato? |
Ejemplo de estrategia de integración | En la minería de datos, las estrategias de integración generalmente se eligen para mejorar mejor el efecto. |
combate real xgboost | Un típico representante en la integración y un arma letal en la competición. |
Previsión de intención de compra de JD.com | Problema de predicción clásico: complete tareas de predicción basadas en datos de comportamiento históricos del usuario |
encuesta de ciencia de datos de kaggle | Muestre visualmente a los participantes en la competencia kaggle. |
previsión del precio de la vivienda | Casos básicos de minería de datos para dominar rápidamente las rutinas |
Análisis de usuarios sensibles al poder | Ejemplos de competencia, que explican principalmente el papel de la ingeniería de características. |
predicción de series temporales de fbprophet | Un algoritmo muy práctico para la previsión de series temporales, muy sencillo de utilizar. |
Hemos seleccionado casos de competencia a gran escala como Tianchi, Kaggle y Rongji para todos, y los códigos y soluciones proporcionados son las ideas de solución de los ganadores durante la competencia. Al igual que si quieres aprender a jugar ajedrez, debes jugar con los mejores jugadores para mejorar. Cada caso explicará las ideas del ganador y la solución general y proporcionará la implementación del código. ¡Muy útil para que todos mejoren!
Nombre del caso | Resumen de contenido |
---|---|
Análisis de actividad del usuario de video corto de Kuaishou | Predecir la próxima actividad en función de los datos de comportamiento del usuario |
Pronóstico de producción de productos químicos industriales | Analizar datos y modelos de la industria química para predecir la eficiencia de la producción. |
Predicción inteligente del tiempo de viaje entre ciudades y carreteras | Una competencia muy realista que predice el tiempo de viaje basándose en datos de la carretera. |
Kit de herramientas interpretables de modelado de ingeniería de características | Uno de los aspectos más difíciles de la minería de datos es la interpretación de características. Estos conjuntos de herramientas son muy útiles. |
Datos médicos sobre diabetes denominados reconocimiento de entidades | Explicación del algoritmo de reconocimiento de entidades nombradas y análisis de ejemplos de aplicación |
Ingeniería de características del modelo de control de riesgos de la plataforma de préstamos | El uso de modelos gráficos para crear ingeniería de características es una idea ampliamente utilizada. |
Modelo de extracción de palabras clave de noticias | Se puede decir que la extracción de palabras clave es una habilidad esencial para la PNL |
Plantilla práctica de proyecto de aprendizaje automático. | La plantilla está aquí. Puede aplicarla a tareas futuras. Los métodos son similares. |
Análisis de usuarios sensibles al poder | Ejemplos de competencia, que explican principalmente el papel de la ingeniería de características. |
La minería de datos utiliza principalmente modelos para hacer predicciones, mientras que el análisis de datos se centra en la visualización y el análisis del impacto de varios indicadores en los resultados. Hemos seleccionado para usted algunos casos de análisis clásicos, muchos de los cuales se pueden utilizar directamente como plantillas.
Nombre del caso | Resumen de contenido |
---|---|
Técnicas de dibujo de diagramas de dispersión. | Se ha dicho que la visualización es el punto clave y el dibujo es definitivamente imprescindible. |
Análisis y modelado de operaciones de taxis en Nueva York | Después de haber utilizado muchos kits de herramientas, podrá familiarizarse con cómo analizar y mostrar datos geográficos. |
Tarea de recomendación de películas basada en análisis estadístico. | Métodos comúnmente utilizados para análisis estadístico y recomendaciones. |
Plantillas de análisis de datos y aprendizaje automático | Esta plantilla es realmente completa e incluye análisis, visualización, modelado y evaluación. |
Reducción de la dimensionalidad de los datos. | Análisis comparativo y visualización de varios algoritmos de reducción de dimensionalidad de uso común. |
Visualización del producto y procesamiento de texto. | Preprocesamiento de datos de texto y visualización visual. |
análisis multivariado | El análisis multivariado también es un método común en el análisis de datos. |
Análisis del conjunto de datos de pedidos de productos. | Análisis de conjuntos de datos de pedidos |
Análisis de datos de préstamos KIVA | Análisis del conjunto de datos de préstamos. |
Se puede decir que el aprendizaje profundo es el algoritmo más útil en este momento y se puede utilizar en varios campos. De hecho, el núcleo todavía está en la visión por computadora y el procesamiento del lenguaje natural, porque los algoritmos de redes neuronales son más adecuados para datos de imágenes y texto. Lo principal que debe dominar son los algoritmos y los marcos. Los algoritmos son modelos de red clásicos como CNN y RNN, y los marcos son herramientas prácticas como tenorflow, Pytorch, etc., que se analizarán en detalle más adelante.
Parece que cuando muchos amigos reciben una tarea ahora, lo primero que piensan es utilizar el aprendizaje profundo directamente. Si el aprendizaje profundo fuera difícil y engorroso, ¿seguiría siendo tan popular? De hecho, por el contrario, creo que el aprendizaje profundo es mucho más simple que el aprendizaje automático. En el aprendizaje automático, debemos elegir diferentes métodos de preprocesamiento y métodos de construcción de ingeniería de características para diferentes datos. Las rutinas del aprendizaje profundo son relativamente más fijas y, con estos marcos de código abierto y las principales arquitecturas de red clásicas, todo lo que normalmente tenemos que hacer es aplicarlas. La dificultad general es más fácil que la tarea de aprendizaje automático (¡relativamente hablando!).
Nombre del algoritmo | Resumen de contenido |
---|---|
red neuronal | La red neuronal es la más básica, lo que equivale a sentar las bases para el aprendizaje de redes posteriores. |
red neuronal convolucional | Esto les suena familiar a todos: ¡el hermano mayor del aprendizaje profundo! Red central de visión por computadora |
red neuronal recurrente | ¡Bei Qiao Feng y Nan Murong son los hermanos mayores en el procesamiento del lenguaje natural! |
red generativa adversaria | Es un modelo popular ahora, es divertido jugar con él y puede usarse para varias fusiones de imágenes. |
modelo de red de secuencia | Las arquitecturas comúnmente utilizadas en PNL, los modelos de traducción de aprendizaje automático, tienen muchos puntos de aplicación. |
Principales arquitecturas de red clásicas | CNN y RNN mencionados hace un momento son modelos de red relativamente básicos y hay muchas extensiones basadas en ellos que todos deben dominar. |
El marco es como decir que usted diseña un modelo de red, pero sería demasiado problemático completar todos los procesos de cálculo específicos usted mismo. El marco proporciona un método de cálculo eficiente y no requiere que lo completemos, un conjunto de cálculos completamente automáticos. Equivale a que solo necesitamos diseñar la estructura y dejarle la construcción específica. Lo que se necesita para jugar al aprendizaje profundo es un marco.
Tensorflow, Pytorch, keras, caffe, etc., hay tantos frameworks, ¿cuál debo elegir? ¿Existen grandes diferencias entre los diferentes marcos? Los más populares ahora son tensorflow y PyTorch, que son equivalentes a KFC y McDonald's. Ambos son muy sólidos en cuanto a cuál elegir, consulte su respectivo equipo de proyecto y los requisitos de la tarea. Si tuviera que recomendar uno, recomendaría PyTorch a todos porque es más conciso y popular. He usado todos estos marcos. La razón principal es que a menudo necesito consultar artículos y proyectos de código abierto en mi trabajo. Por lo general, hago un seguimiento de los marcos utilizados para el código fuente en los artículos de otras personas para el desarrollo secundario. ¡Usaré estos marcos tarde o temprano!
No existe una teoría para hablar sobre el marco y no es necesario leer todo tipo de explicaciones largas, ¡simplemente úsala! De hecho, es un conjunto de herramientas, puede aprender mientras lo usa y los casos se pueden usar como plantillas para resumir.
Nombre del marco | Resumen de contenido |
---|---|
Marco de café | El marco a nivel de dios de la antigüedad ha caído en desgracia ahora. Fue el primer marco que aprendí. |
Versión Tensorflow2 | La versión 2 ha realizado muchas mejoras y finalmente es más fácil de usar. Es mucho más cómoda de usar que la versión 1. |
Keras | ¡En una frase, es simple! ¡Simple! ¡Simple! No es necesario aprender, es muy fácil de entender mirando el código. |
PyTorch | El marco más popular en esta etapa, calculo que también será el marco más popular este año (2020), ¡recomendado! |
Le proporcionamos una gran cantidad de casos prácticos para cada marco importante de aprendizaje profundo. ¡Cuál utilice depende de sus preferencias!
No necesito explicar que es producido por Google. Muchos de los proyectos de código abierto de Google definitivamente se basan en el marco TF. Si desea estudiar o consultar proyectos y artículos de código abierto de otras personas, debe aprender TF. También es muy utilizado en la industria. ¡Esta ola definitivamente dará sus frutos!
Nombre del caso | Resumen de contenido |
---|---|
instalación e introducción de tensorflow | La versión 2 se introduce en el método de instalación, revísela brevemente. |
Interpretación de los principios de las redes neuronales y su arquitectura general. | Revisar la arquitectura de la red neuronal. |
Construya una red neuronal para tareas de clasificación y regresión. | Utilice TF para completar tareas básicas de clasificación y regresión y dominar sus métodos de aplicación. |
Principios de redes neuronales convolucionales e interpretación de parámetros. | La arquitectura de CNN se explica en detalle para cada parámetro. |
Práctica de identificación de perros y gatos. | La clásica tarea de clasificación de imágenes, hay mucho de qué hablar aquí, es muy importante |
Ejemplos de mejora de datos de imagen | Se puede decir que la mejora de datos es ahora una habilidad imprescindible. |
Estrategia de formación: transferencia del aprendizaje en la práctica | El efecto del aprendizaje por transferencia sigue siendo bastante bueno. |
Interpretación de los principios de las redes neuronales recursivas y los vectores de palabras. | Interpretación del modelo RNN |
Implementando word2vec basado en TensorFlow | Interpretación e implementación del modelo vectorial de Word basado en TF |
Tarea de clasificación de texto basada en el modelo RNN | Completar tareas de clasificación de texto basadas en TF. |
tfrecord crea fuente de datos | Ejemplo de producción de fuente de datos |
Aplicar la red CNN a la práctica de clasificación de textos | CNN también puede realizar clasificación de texto. |
pronóstico de series de tiempo | Ejemplos de procesamiento y modelado de datos de series temporales. |
Redes generativas adversarias en la práctica | GAN está aquí, esto es muy divertido. |
Fusión práctica de imágenes basada en el proyecto de código abierto CycleGan | Mi GAN favorito para jugar, ¡el efecto es bastante divertido! |
Arquitectura de red clásica Resnet en la práctica | ¡Puedes aprender la arquitectura de red que debes comprender! |
A finales de 2019, el número de usuarios del marco Pytorch superó a tensorflow y se convirtió en el marco más popular en este momento. La razón es realmente muy simple. A todos les gusta usar marcos más simples y fáciles de entender. La sensación general es más fácil de usar que tensorflow y muy conveniente para depurar. También se recomienda que los principiantes den prioridad al marco Pytorch.
Nombre del caso | Resumen de contenido |
---|---|
Operaciones de procesamiento básicas del marco PyTorch. | Simplemente familiarícese con PyTorch y será muy fácil comenzar. |
Tareas prácticas de clasificación y regresión de redes neuronales. | Usar PyTorch para construir un modelo de red neuronal es realmente más fácil de usar que TF |
Principios de redes neuronales convolucionales e interpretación de parámetros. | Arquitectura del modelo CNN e interpretación del libro de parámetros. |
Interpretación práctica del módulo central de reconocimiento de imágenes. | Muy importante, el módulo central de procesamiento de imágenes en PyTorch |
El papel y los ejemplos de aplicación del aprendizaje por transferencia. | Cargando modelos en PyTorch para aprendizaje por transferencia |
Interpretación de los principios de las redes neuronales recursivas y los vectores de palabras. | Interpretación de la arquitectura del modelo RNN. |
Práctica práctica sobre clasificación de textos de conjuntos de datos de noticias. | Cree un modelo de clasificación de texto basado en PyTorch |
Principios y análisis práctico de la arquitectura de red generativa adversaria. | Interpretación popular del modelo GAN |
Fusión práctica de imágenes basada en el proyecto de código abierto CycleGan | Versión PyTorch de CYCLEGAN, este proyecto de código abierto está muy bien escrito |
Principio de reconocimiento de texto OCR | El principio de OCR es realmente muy simple y requiere la ayuda de múltiples modelos para completarlo. |
Práctica del proyecto de reconocimiento de texto OCR | Construir modelo de red OCR |
Análisis de vídeo y reconocimiento de acciones basado en convolución 3D. | Utilice convolución 3D para procesar datos de video y completar el reconocimiento de comportamiento |
Modelo BERT práctico basado en PyTorch | La arquitectura de BERT es tan popular que es uno de los modelos imprescindibles. |
Interpretación de plantillas prácticas del marco PyTorch. | Proporcione una plantilla para que las tareas futuras se puedan mejorar en función de la plantilla. |
La sensación general es que no necesitas aprender nada, simplemente puedes usarlo directamente desde el caso. La versión TF2 es en realidad muy similar a keras. Adecuado para hacer experimentos y escribir artículos, ¡sencillo y rápido!
Nombre del caso | Resumen de contenido |
---|---|
Instalación e introducción | Keras es fácil de instalar y comenzar, basado en tf |
Construir un modelo de red neuronal | Construya un modelo de red neuronal para probar las aguas |
Otra batalla con las redes neuronales convolucionales | Los modelos CNN también son muy fáciles de construir. |
Tarea de previsión de series temporales de LSTM | Modelo LSTM aplicado a tareas de series temporales. |
Práctica de clasificación de textos. | Ejemplo de clasificación de texto |
Múltiples etiquetas y múltiples salidas | Las tareas de múltiples etiquetas son muy comunes y tienen un gran valor de aprendizaje |
Práctica práctica sobre clasificación de texto de conjuntos de datos de noticias | Tarea de clasificación de texto basada en keras |
aumento de datos | Interpretación de ejemplos de aumento de datos |
red generativa adversaria | Arquitectura de Gan, es más fácil usar keras |
Transferir el aprendizaje y la red residual de resnet | Debes jugar con el modelo de resnet tú mismo |
Tarea de secuencia múltiple de código postal de dirección postal | Ejemplo de modelo de texto |
práctica de red SEQ2SEQ | El modelo de red de secuencia todavía se usa ampliamente. |
Resumen de plantillas prácticas | La plantilla de Keras se proporciona para todos. |
Creo que TensorFlow y Pytorch ya están disponibles en esta etapa, y no es el turno de Caffe para aparecer por el momento. ¡Puede haber algunos documentos y tareas que aún requieren el marco de la cafetería.
Nombre del caso | Resumen de contenido |
---|---|
Interpretación del archivo de configuración de Caffe | Interpretación de archivos de configuración de Caffe Framework comúnmente utilizados |
Varios métodos de construcción del conjunto de datos | Método de construcción del conjunto de datos, esto es muy importante |
Interpretación de herramientas de café comunes | Hay muchas herramientas pequeñas integradas para completar tareas rápidamente |
Detección de cara en la práctica | Construya un modelo de detección de cara basado en el marco de la cafetería |
Práctica práctica de localizar puntos clave faciales | Modelo completo de reconocimiento de puntos de clave facial basado en el marco de la cafetería |
No necesito decir mucho sobre la industria de la visión por computadora, es la más popular en este momento. Entonces, ¿qué necesitas aprender? El núcleo es en realidad dos partes, una es el procesamiento de imágenes y el otro es el modelado de imágenes. El llamado procesamiento de imágenes es lo que hace OpenCV. El modelado de imágenes utiliza principalmente el aprendizaje profundo para completar tareas como la detección y el reconocimiento. En esta etapa de estudio, creo que no necesita leer sobre los algoritmos de procesamiento de imágenes tradicionales.
Se recomienda que elija la versión de Python para aprender y usarla. Si encuentra algo con lo que no está familiarizado, consulte la API más. Básicamente, todas las funciones en OpenCV implican muchas fórmulas matemáticas.
Hemos preparado muchos recursos de aprendizaje y casos para todos.
Nombre del caso | Resumen de contenido |
---|---|
Introducción de OpenCV y configuración del entorno | Instalación y configuración del entorno |
Operaciones de imagen básicas | ¡Use OpenCV para completar las operaciones básicas de procesamiento de imágenes y la práctica! |
Umbral y suavizado | Las operaciones de procesamiento más utilizadas se pueden completar con solo unas pocas líneas de código. |
Operaciones de morfología de imágenes | Simplemente familiarizarse con estas operaciones morfológicas |
Cálculo de gradiente de imagen | Ejemplo de cálculo de gradiente de imagen |
detección de bordes | La detección de borde tiene una amplia gama de aplicaciones |
Detección de la pirámide y el contorno | Ejemplo de detección de contorno, el efecto sigue siendo bueno |
Histograma y transformación de Fourier | Solo familiar |
Identificación digital de tarjeta de práctica de práctica de proyecto | Hacer un proyecto práctico para detectar e identificar números de tarjetas de crédito |
Proyecto Práctica Documento de escaneo OCR Reconocimiento | Escanee datos de documentos para el reconocimiento de OCR |
Imagen características-harris | Métodos de extracción de características comúnmente utilizados, el algoritmo es simple y familiar |
Imagen características-sift | El método de extracción de características más antiguo, todavía requiere muchas matemáticas. |
Costura de imagen de práctica de casos | Todos deben haber jugado con cámara panorámica, ¿cómo lograrlo? |
Identificación del espacio de la práctica de la práctica del proyecto | Proyecto de servicio pesado, construyendo un modelo de reconocimiento de espacio de estacionamiento desde cero |
Práctica de proyecto-respuesta de la tarjeta de respuesta y juzgado | Vamos a divertirnos con el marcado automático |
Modelado de fondo | Métodos de tratamiento convencionales |
Estimación de flujo óptico | Solo estés familiarizado con él |
Módulo OpenCV DNN | Cargue el modelo entrenado para su reconocimiento |
Práctica de proyecto - Seguimiento de objetivos | El efecto de seguimiento es bastante interesante. |
Principios y operaciones de convolución | Donde quiera que vaya la convolución, es el núcleo. |
Detección de práctica de proyectos-fatiga | Detectar fatiga basada en la cámara |
Recomiendo que los estudiantes que se están preparando para las entrevistas de trabajo lo lean todo. El código dentro de la cantidad será relativamente grande, por lo que se recomienda comenzar con el modo de depuración y mirar el código línea por línea.
Recomendamos encarecidamente el proyecto práctico Mask-RCNN. Los escenarios de aplicación son muy amplios, y también es adecuado para el desarrollo y la mejora secundaria. ¡Me centraré en explicar el proyecto y aplicarlo a mí mismo.
Nombre del proyecto | Resumen de contenido |
---|---|
Transferencia de estilo de imagen (transferencia de estilo) | Principalmente para aprender sus ideas, el efecto sigue siendo muy interesante |
Completar automáticamente las imágenes faltantes | Hay muchos escenarios de aplicación para la red GaN, y las imágenes también pueden ser reparadas por sí mismas. |
Reconstrucción de súper resolución | Una de las áreas clave de la investigación en los últimos años, los resultados de este documento ya son muy buenos. |
Proyecto de marco de detección de objetos-Maskrcnn | Este es el proyecto de código abierto que resalto, ¡una visita obligada! ¡Una visita obligada! ¡Una visita obligada! |
Explicación detallada del código fuente del marco de la red Maskrcnn | El código fuente es muy importante, ¡debe comprender cada línea! |
Capacite sus propios datos en función del marco Mask-RCNN | ¿Cómo etiquetar los datos de la imagen y entrenarlos? Aquí está tu respuesta |
Demostración de reconocimiento de postura humana | Hay muchos escenarios de aplicación para Maskrcnn |
Detección de objetos Serie FASTERRCNN | Un trabajo clásico en la detección de objetos que se puede utilizar como recurso de aprendizaje |
Fusión práctica de imagen basada en el proyecto de código abierto de CycleGan | Versión de Pytorch de Cyclegan, este proyecto de código abierto está muy bien escrito |
Principio de reconocimiento de texto de OCR | El principio de OCR es en realidad muy simple y requiere la ayuda de múltiples modelos para completarlo. |
Práctica de proyecto de reconocimiento de texto de OCR | Construir el modelo de red OCR |
Análisis de video y reconocimiento de acción basado en la convolución 3D | Use la convolución 3D para procesar datos de video y completar el reconocimiento de comportamiento |
Se puede decir que la dificultad es bastante alta. Pero los datos de texto no son tan fijos, y a veces no es fácil de entender para los humanos, y mucho menos las computadoras. Los altos desafíos también son altos beneficios.
En 2018, salió un documento de Google, Bert! Es equivalente a un marco de solución general para el procesamiento del lenguaje natural, ¡y básicamente puede hacer todas las tareas! Esto requiere que todos se concentren en el aprendizaje, y se puede escribir como un proyecto en su currículum.
Nombre del proyecto | Resumen de contenido |
---|---|
modelo de lenguaje | El modelo de idioma requiere que todos estén familiarizados con la base de los vectores de palabras posteriores. |
Use gemsim para construir vectores de palabras | ¡Gensim es un paquete realmente útil! |
Tarea de clasificación basada en Word2Vec | Primero usemos este ejemplo para comprender cómo usar vectores de palabras |
Comparación de métodos de características de texto NLP | Hay muchas formas de construir características de texto, ¿cuál es mejor? |
Análisis de sentimientos LSTM | Use este proyecto para comprender cómo se ve la entrada requerida por un modelo RNN |
Modelo de similitud de PNL | Método de cálculo de similitud de texto |
Bot | Construya un chatbot basado en el marco tensorlfow |
Crea tu propio método de entrada | ¿Puedes construir tu propio método de entrada? ¡Ayúdate a hacerlo! |
El robot escribe poesía de tang | ¡Echa un vistazo a la poesía Tang escrita por el modelo! |
Caja de traducción automática de NMT | Proyecto de código abierto, capaz de desarrollo secundario |
Tarea de secuencia múltiple de código postal de dirección postal | Tareas de clasificación de texto clásico |
Principio de Bert, un marco general para el procesamiento del lenguaje natural | Este es el Bert mencionado anteriormente, el punto! ¡El punto! ¡El punto! |
Interpretación del código fuente del proyecto de código abierto de Google Bert | El código fuente es muy importante, cada línea debe entenderse |
Análisis de sentimientos chino basado en Bert | Desarrollo del modelo basado en proyectos de código abierto |
Reconocimiento de entidades con nombre chino basado en Bert | Reconocimiento de entidad nombrado basado en proyectos de código abierto |
A través de cursos en línea y capacitación corporativa fuera de línea en los últimos años, he conocido a muchos amigos. Todos me conocen básicamente a través de cursos de video, y estoy muy feliz de poder traer beneficios a todos. Gracias a tantos amigos por su apoyo, vamos, ¡eres lo mejor!