Descarga de ML foundations - ML foundations Descarga del código fuente

ML foundations

Pitón

1.0.0

Descargar

Fundamentos del aprendizaje automático

Este repositorio alberga el código que acompaña al plan de estudios Machine Learning Foundations de Jon Krohn, que proporciona una descripción general completa de todas las materias (matemáticas, estadísticas e informática) que subyacen a los enfoques contemporáneos de aprendizaje automático, incluido el aprendizaje profundo y otras inteligencias artificiales. técnicas.

Hay ocho materias en el plan de estudios, organizadas en cuatro áreas temáticas. Consulte la sección "Casa de aprendizaje automático" a continuación para obtener detalles sobre por qué estas son las áreas temáticas fundamentales esenciales:

Álgebra lineal
- 1: Introducción al álgebra lineal
- 2: Álgebra lineal II: operaciones matriciales
Cálculo
- 3: Cálculo I: Límites y Derivadas
- 4: Cálculo II: Derivadas parciales e integrales
Probabilidad y Estadística
- 5: Teoría de la probabilidad y la información
- 6: Introducción a la estadística
Ciencias de la Computación
- 7: Algoritmos y estructuras de datos
- 8: Optimización

Las materias posteriores se basan en el contenido de las materias anteriores, por lo que el enfoque recomendado es avanzar en las ocho materias en el orden indicado. Dicho esto, puedes elegir temas individuales según tu interés o tu familiaridad con el material. En particular, cada una de las cuatro áreas temáticas es bastante independiente, por lo que podrían abordarse por separado.

Donde y cuando

Jon Krohn ofreció inicialmente las ocho materias de ML Foundations como capacitaciones en vivo en línea en la plataforma de aprendizaje O'Reilly de mayo a septiembre de 2020 (y se ofrecieron por segunda vez de julio a diciembre de 2021; consulte aquí las fechas de las conferencias individuales).

Para adaptarse a su modo preferido de aprendizaje, el contenido ahora está disponible a través de varios canales:

YouTube
- Lista de reproducción completa de álgebra lineal aquí y publicación de blog detallada aquí
- Lista de reproducción completa de Cálculo aquí
- La lista de reproducción de probabilidad está en desarrollo activo (suscríbase a mi boletín informativo por correo electrónico en jonkrohn.com para recibir notificaciones sobre nuevos lanzamientos de videos)
- Con el tiempo, todas las materias de mi plan de estudios ML Foundations estarán disponibles gratuitamente en YouTube.
O'Reilly (muchos empleadores e instituciones educativas brindan acceso gratuito a esta plataforma; si no tiene acceso, puede obtener una prueba gratuita de 30 días a través de mi código especial SDSPOD23)
- Vídeos de álgebra lineal publicados en diciembre de 2020 (lección gratuita de una hora)
- Vídeos de cálculo publicados en enero de 2021 (lección gratuita de una hora)
- Vídeos de probabilidad y estadísticas publicados en mayo de 2021 (lección gratuita de una hora)
- Vídeos de informática publicados en junio de 2021 (lección gratuita de una hora)
- (Para mayor comodidad, este editor recopiló aquí las 28 horas de las cuatro series de videos anteriores en una sola lista de reproducción).
Udemy : todo el contenido de Álgebra lineal y cálculo está disponible en un curso de Fundamentos matemáticos de ML desde septiembre de 2021 (video de descripción general gratuito aquí). Si bien este curso es por sí solo una introducción completa a las materias de matemáticas, las materias 5 a 8 eventualmente se agregarán como material adicional gratuito.
Conferencia abierta sobre ciencia de datos : toda la serie se impartió en vivo en línea desde diciembre de 2020 hasta junio de 2021. Las grabaciones bajo demanda de todas estas capacitaciones ahora están disponibles en la plataforma Ai+.
Libro : Existe un contrato de libro con Pearson; Con el tiempo tendré ancho de banda para trabajar en el manuscrito y los borradores de los capítulos previos al lanzamiento estarán disponibles a través de oreilly.com.

(Tenga en cuenta que, si bien YouTube contiene el 100% del contenido enseñado, las opciones pagas, por ejemplo, Udemy, O'Reilly y ODSC, contienen tutoriales completos de soluciones para ejercicios que no están disponibles en YouTube. Algunas de las opciones pagas también incluyen Funciones exclusivas específicas de la plataforma, como pruebas interactivas, "hojas de trucos" y la concesión de un certificado por completar con éxito el curso).

Notificaciones push

Para mantenerse informado sobre futuras sesiones de capacitación en vivo, nuevos lanzamientos de videos y lanzamientos de capítulos de libros, considere suscribirse al boletín informativo por correo electrónico de Jon Krohn a través de su página de inicio.

Cuadernos

Todo el código se proporciona en los cuadernos de Jupyter de este directorio. Estos portátiles están diseñados para su uso dentro del entorno de nube (gratuito) de Colab y ese es el único entorno actualmente compatible de forma activa.

Dicho esto, si está familiarizado con la ejecución de notebooks de Jupyter localmente, puede hacerlo (tenga en cuenta que las versiones de la biblioteca en el Dockerfile de este repositorio no son necesariamente actuales, pero pueden proporcionar un punto de partida razonable para ejecutar Jupyter dentro de un contenedor Docker). .

La casa del aprendizaje automático

Para ser un científico de datos o un ingeniero de ML destacado, no basta con saber cómo utilizar algoritmos de ML a través de las interfaces abstractas que proporcionan las bibliotecas más populares (por ejemplo, scikit-learn, Keras). Para entrenar modelos innovadores o implementarlos para que se ejecuten de manera eficiente en producción, una apreciación en profundidad de la teoría del aprendizaje automático (representada como el piso morado central de la "Casa del Aprendizaje Automático") puede ser útil o esencial. Y, para cultivar una apreciación tan profunda del ML, uno debe poseer una comprensión práctica de los temas fundamentales.

Cuando los cimientos de la "Casa del aprendizaje automático" son firmes, también será mucho más fácil dar el salto de los principios generales de ML (piso morado) a dominios de ML especializados (el piso superior, que se muestra en gris), como el aprendizaje profundo, el aprendizaje natural procesamiento del lenguaje, visión artificial y aprendizaje por refuerzo. Esto se debe a que, cuanto más especializada sea la aplicación, es más probable que los detalles para su implementación estén disponibles sólo en artículos académicos o libros de texto de posgrado, los cuales generalmente suponen una comprensión de los temas fundamentales.

El contenido de esta serie puede ser particularmente relevante para usted si:

Utiliza bibliotecas de software de alto nivel para entrenar o implementar algoritmos de aprendizaje automático y ahora le gustaría comprender los fundamentos subyacentes de las abstracciones, lo que le permitirá ampliar sus capacidades.
Eres un científico de datos y te gustaría reforzar tu comprensión de los temas centrales de tu disciplina profesional.
Es un desarrollador de software al que le gustaría desarrollar una base sólida para la implementación de algoritmos de aprendizaje automático en sistemas de producción.
Eres un analista de datos o un entusiasta de la IA y te gustaría convertirte en científico de datos o ingeniero de datos/ML, por lo que estás interesado en comprender en profundidad el campo en el que estás ingresando desde cero (¡muy sabio de tu parte!).
Simplemente desea comprender los conceptos básicos de álgebra lineal, cálculo, probabilidad, estadísticas, algoritmos y/o estructuras de datos.

Los temas fundamentales se han mantenido prácticamente sin cambios en las últimas décadas y es probable que sigan así durante las próximas décadas; sin embargo, son fundamentales en todos los enfoques de aprendizaje automático y ciencia de datos. Por lo tanto, los cimientos proporcionan una base sólida para toda la carrera.

Enfoque pedagógico

El propósito de esta serie es brindarle una comprensión práctica y funcional del contenido cubierto. Se brindará contexto para cada tema, destacando su relevancia para el aprendizaje automático.

Al igual que con otros materiales creados por Jon Krohn (como el libro Deep Learning Illustrated y su serie de videos de 18 horas Deep Learning con TensorFlow, Keras y PyTorch) , el contenido de la serie cobra vida mediante la combinación de:

Ilustraciones vívidas a todo color
Ejercicios de comprensión con lápiz y papel con soluciones completamente trabajadas.
Cientos de ejemplos sencillos de código Python en cuadernos prácticos de Jupyter (con especial atención en las bibliotecas PyTorch y TensorFlow)
Aplicaciones prácticas de aprendizaje automático
Recursos para profundizar aún más en temas que despiertan su curiosidad

Requisitos previos

Programación : todas las demostraciones de código estarán en Python, por lo que sería útil tener experiencia con él u otro lenguaje de programación orientado a objetos para seguir los ejemplos de código. Un buen recurso (¡y gratuito!) para comenzar con Python es Automate the Boring Stuff de Al Sweigart.

Matemáticas : La familiaridad con las matemáticas de nivel de escuela secundaria hará que sea más fácil seguir la clase. Si se siente cómodo manejando información cuantitativa, como comprender gráficos y reorganizar ecuaciones simples, entonces debe estar bien preparado para seguir todas las matemáticas. Si descubre que tiene algunas lagunas en matemáticas mientras trabaja en este plan de estudios de ML Foundations , le recomiendo Khan Academy, completa y gratuita, para llenar esas lagunas.