Este repositorio alberga el código que acompaña al plan de estudios Machine Learning Foundations de Jon Krohn, que proporciona una descripción general completa de todas las materias (matemáticas, estadísticas e informática) que subyacen a los enfoques contemporáneos de aprendizaje automático, incluido el aprendizaje profundo y otras inteligencias artificiales. técnicas.
Hay ocho materias en el plan de estudios, organizadas en cuatro áreas temáticas. Consulte la sección "Casa de aprendizaje automático" a continuación para obtener detalles sobre por qué estas son las áreas temáticas fundamentales esenciales:
Las materias posteriores se basan en el contenido de las materias anteriores, por lo que el enfoque recomendado es avanzar en las ocho materias en el orden indicado. Dicho esto, puedes elegir temas individuales según tu interés o tu familiaridad con el material. En particular, cada una de las cuatro áreas temáticas es bastante independiente, por lo que podrían abordarse por separado.
Jon Krohn ofreció inicialmente las ocho materias de ML Foundations como capacitaciones en vivo en línea en la plataforma de aprendizaje O'Reilly de mayo a septiembre de 2020 (y se ofrecieron por segunda vez de julio a diciembre de 2021; consulte aquí las fechas de las conferencias individuales).
Para adaptarse a su modo preferido de aprendizaje, el contenido ahora está disponible a través de varios canales:
(Tenga en cuenta que, si bien YouTube contiene el 100% del contenido enseñado, las opciones pagas, por ejemplo, Udemy, O'Reilly y ODSC, contienen tutoriales completos de soluciones para ejercicios que no están disponibles en YouTube. Algunas de las opciones pagas también incluyen Funciones exclusivas específicas de la plataforma, como pruebas interactivas, "hojas de trucos" y la concesión de un certificado por completar con éxito el curso).
Para mantenerse informado sobre futuras sesiones de capacitación en vivo, nuevos lanzamientos de videos y lanzamientos de capítulos de libros, considere suscribirse al boletín informativo por correo electrónico de Jon Krohn a través de su página de inicio.
Todo el código se proporciona en los cuadernos de Jupyter de este directorio. Estos portátiles están diseñados para su uso dentro del entorno de nube (gratuito) de Colab y ese es el único entorno actualmente compatible de forma activa.
Dicho esto, si está familiarizado con la ejecución de notebooks de Jupyter localmente, puede hacerlo (tenga en cuenta que las versiones de la biblioteca en el Dockerfile de este repositorio no son necesariamente actuales, pero pueden proporcionar un punto de partida razonable para ejecutar Jupyter dentro de un contenedor Docker). .
Para ser un científico de datos o un ingeniero de ML destacado, no basta con saber cómo utilizar algoritmos de ML a través de las interfaces abstractas que proporcionan las bibliotecas más populares (por ejemplo, scikit-learn, Keras). Para entrenar modelos innovadores o implementarlos para que se ejecuten de manera eficiente en producción, una apreciación en profundidad de la teoría del aprendizaje automático (representada como el piso morado central de la "Casa del Aprendizaje Automático") puede ser útil o esencial. Y, para cultivar una apreciación tan profunda del ML, uno debe poseer una comprensión práctica de los temas fundamentales.
Cuando los cimientos de la "Casa del aprendizaje automático" son firmes, también será mucho más fácil dar el salto de los principios generales de ML (piso morado) a dominios de ML especializados (el piso superior, que se muestra en gris), como el aprendizaje profundo, el aprendizaje natural procesamiento del lenguaje, visión artificial y aprendizaje por refuerzo. Esto se debe a que, cuanto más especializada sea la aplicación, es más probable que los detalles para su implementación estén disponibles sólo en artículos académicos o libros de texto de posgrado, los cuales generalmente suponen una comprensión de los temas fundamentales.
El contenido de esta serie puede ser particularmente relevante para usted si:
Los temas fundamentales se han mantenido prácticamente sin cambios en las últimas décadas y es probable que sigan así durante las próximas décadas; sin embargo, son fundamentales en todos los enfoques de aprendizaje automático y ciencia de datos. Por lo tanto, los cimientos proporcionan una base sólida para toda la carrera.
El propósito de esta serie es brindarle una comprensión práctica y funcional del contenido cubierto. Se brindará contexto para cada tema, destacando su relevancia para el aprendizaje automático.
Al igual que con otros materiales creados por Jon Krohn (como el libro Deep Learning Illustrated y su serie de videos de 18 horas Deep Learning con TensorFlow, Keras y PyTorch) , el contenido de la serie cobra vida mediante la combinación de:
Programación : todas las demostraciones de código estarán en Python, por lo que sería útil tener experiencia con él u otro lenguaje de programación orientado a objetos para seguir los ejemplos de código. Un buen recurso (¡y gratuito!) para comenzar con Python es Automate the Boring Stuff de Al Sweigart.
Matemáticas : La familiaridad con las matemáticas de nivel de escuela secundaria hará que sea más fácil seguir la clase. Si se siente cómodo manejando información cuantitativa, como comprender gráficos y reorganizar ecuaciones simples, entonces debe estar bien preparado para seguir todas las matemáticas. Si descubre que tiene algunas lagunas en matemáticas mientras trabaja en este plan de estudios de ML Foundations , le recomiendo Khan Academy, completa y gratuita, para llenar esas lagunas.
Por último, aquí tenéis una ilustración de Oboe, la mascota de Machine Learning Foundations , creada por el maravilloso artista Aglaé Bassens: