Aquí están las secciones:
Esta sección contiene hojas de referencia de conceptos básicos en ciencia de datos que se preguntarán en las entrevistas:
Esta sección contiene libros que he leído sobre ciencia de datos y aprendizaje automático:
Esta sección contiene ejemplos de preguntas que se formularon en entrevistas reales sobre ciencia de datos:
Esta sección contiene preguntas de estudios de casos relacionados con el diseño de sistemas de aprendizaje automático para resolver problemas prácticos.
Esta sección contiene un portafolio de proyectos de ciencia de datos completados por mí con fines académicos, de autoaprendizaje y de pasatiempo.
Para disfrutar de una experiencia visual más agradable al explorar el portafolio, visite jameskle.com/data-portfolio
Transfer Rec: Mi trabajo de investigación en curso que cruza el aprendizaje profundo y los sistemas de recomendación.
Recomendación de películas: diseñó 4 modelos diferentes que recomiendan elementos en el conjunto de datos MovieLens.
Herramientas: PyTorch, TensorBoard, Keras, Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-Learn, Surprise, Wordcloud
Trip Optimizer: utilizó XGBoost y algoritmos evolutivos para optimizar el tiempo de viaje de los vehículos taxi en la ciudad de Nueva York.
Análisis de la cesta de la compra de Instacart: se abordó el desafío del análisis de la cesta de la compra de Instacart para predecir qué productos estarán en el próximo pedido de un usuario.
Herramientas: Pandas, NumPy, Matplotlib, XGBoost, Geopy, Scikit-Learn
Recomendación de moda: creó un modelo basado en ResNet que clasifica y recomienda imágenes de moda en la base de datos DeepFashion en función de la similitud semántica.
Clasificación de moda: se desarrollaron 4 redes neuronales convolucionales diferentes que clasifican imágenes en el conjunto de datos Fashion MNIST.
Clasificación de razas de perros: diseñó una red neuronal convolucional que identifica la raza de perro.
Segmentación de carreteras: implementó una red totalmente convolucional para la tarea de segmentación semántica en el conjunto de datos de Kitty Road.
Herramientas: TensorFlow, Keras, Pandas, NumPy, Matplotlib, Scikit-Learn, TensorBoard
Análisis de equipos de la Copa Mundial 2018: Análisis y visualización del conjunto de datos de FIFA 18 para predecir las mejores alineaciones de equipos internacionales posibles para 10 equipos en la Copa Mundial 2018 en Rusia.
Análisis de Artistas de Spotify: Análisis y visualización de estilos musicales de 50 artistas diferentes con una amplia gama de géneros en Spotify.
Herramientas: Pandas, NumPy, Matplotlib, Rspotify, httr, dplyr, tidyr, radarchart, ggplot2
Esta sección contiene un portafolio de artículos de periodismo de datos completados por mí para clientes independientes y con fines de autoaprendizaje.
Para disfrutar de una experiencia visual más agradable al explorar el portafolio, visite jameskle.com/data-journalism
Las 10 técnicas estadísticas que los científicos de datos deben dominar
Tutorial de regresión logística
Tutorial de árboles de decisión
Tutorial de máquinas de vectores de soporte
Una introducción amigable al marketing basado en datos para líderes empresariales
Los 10 algoritmos que los ingenieros de aprendizaje automático deben conocer
12 cosas útiles que debes saber sobre el aprendizaje automático
Un recorrido por los 10 mejores algoritmos para principiantes en aprendizaje automático
Las 10 técnicas de minería de datos que los científicos de datos necesitan en su caja de herramientas
Agrupación y clasificación en el comercio electrónico
El ABC de aprender a clasificar
Seis formas de depurar un modelo de aprendizaje automático
8 trayectorias profesionales en aprendizaje automático a seguir hoy
Los 10 métodos de aprendizaje profundo que los profesionales de la IA deben aplicar
Las 8 arquitecturas de redes neuronales que los investigadores de ML necesitan aprender
Los 5 marcos de aprendizaje profundo con los que todo aprendiz automático serio debería estar familiarizado
Las 5 técnicas de visión por computadora que cambiarán tu forma de ver el mundo
Redes neuronales convolucionales: el modelo de inspiración biológica
Redes neuronales recurrentes: la potencia del modelado del lenguaje
Las 7 técnicas de PNL que cambiarán tu forma de comunicarte en el futuro
Las 5 tendencias que dominarán la visión por computadora en 2018
Los 3 marcos de aprendizaje profundo para el reconocimiento de voz de un extremo a otro que impulsan sus dispositivos
Los 5 algoritmos para una inferencia eficiente de aprendizaje profundo en dispositivos pequeños
Las 4 técnicas de investigación para entrenar modelos de redes neuronales profundas de manera más eficiente
Las 2 arquitecturas de hardware para una formación e inferencia eficientes de redes profundas
Diez mejores prácticas de aprendizaje profundo a tener en cuenta en 2020
Estas hojas de trucos en PDF provienen de BecomingHuman.AI.