Вот разделы:
В этом разделе содержатся шпаргалки по основным понятиям в области науки о данных, которые будут спрашивать на собеседованиях:
В этом разделе собраны прочитанные мной книги о науке о данных и машинном обучении:
В этом разделе приведены примеры вопросов, которые задавались на реальных собеседованиях по науке о данных:
В этом разделе содержатся вопросы для тематического исследования, касающиеся разработки систем машинного обучения для решения практических задач.
В этом разделе содержится портфолио проектов по науке о данных, выполненных мной для академических целей, самообучения и хобби.
Для более удобного просмотра портфолио посетите сайт jameskle.com/data-portfolio.
Transfer Rec: Моя текущая исследовательская работа, которая пересекает системы глубокого обучения и рекомендаций.
Рекомендация по фильму: разработаны 4 различные модели, которые рекомендуют элементы из набора данных MovieLens.
Инструменты: PyTorch, TensorBoard, Keras, Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-Learn, Surprise, Wordcloud.
Оптимизатор поездки: используется XGBoost и эволюционные алгоритмы для оптимизации времени в пути для автомобилей такси в Нью-Йорке.
Анализ рыночной корзины Instacart: решена задача анализа рыночной корзины Instacart, чтобы предсказать, какие продукты будут в следующем заказе пользователя.
Инструменты: Pandas, NumPy, Matplotlib, XGBoost, Geopy, Scikit-Learn.
Рекомендации по моде: создана модель на основе ResNet, которая классифицирует и рекомендует модные изображения в базе данных DeepFashion на основе семантического сходства.
Классификация моды: разработаны 4 различные сверточные нейронные сети, которые классифицируют изображения в наборе данных Fashion MNIST.
Классификация пород собак: разработала сверточную нейронную сеть, которая идентифицирует породу собак.
Сегментация дорог: реализована полностью сверточная сеть для задачи семантической сегментации в наборе данных Kitty Road.
Инструменты: TensorFlow, Keras, Pandas, NumPy, Matplotlib, Scikit-Learn, TensorBoard.
Анализ команд чемпионата мира по футболу 2018 года: анализ и визуализация набора данных FIFA 18 для прогнозирования наилучших возможных составов международных команд для 10 команд на чемпионате мира по футболу 2018 года в России.
Анализ исполнителей Spotify: анализ и визуализация музыкальных стилей 50 различных исполнителей широкого спектра жанров на Spotify.
Инструменты: Pandas, NumPy, Matplotlib, Rspotify, httr, dplyr, tidyr, Radarchart, ggplot2.
В этом разделе содержится портфолио статей по журналистике данных, написанных мной для клиентов-фрилансеров и в целях самообучения.
Для более удобного просмотра портфолио посетите сайт jameskle.com/data-journalism.
10 статистических методов, которыми должны овладеть ученые, работающие с данными
Учебное пособие по логистической регрессии
Учебное пособие по деревьям решений
Учебное пособие по машинам опорных векторов
Дружественное введение в маркетинг, основанный на данных, для бизнес-лидеров
10 алгоритмов, которые должны знать инженеры машинного обучения
12 полезных вещей, которые нужно знать о машинном обучении
Обзор 10 лучших алгоритмов машинного обучения для новичков
10 методов интеллектуального анализа данных, которые нужны ученым, работающим с данными, в своем наборе инструментов
Кластеризация и классификация в электронной коммерции
Азбука обучения ранжированию
6 способов отладки модели машинного обучения
8 карьерных возможностей в области машинного обучения, которыми стоит заняться сегодня
10 методов глубокого обучения, которые необходимо применять специалистам по искусственному интеллекту
8 архитектур нейронных сетей, которые должны изучить исследователи машинного обучения
5 фреймворков глубокого обучения, с которыми должен быть знаком каждый серьезный специалист по машинному обучению
5 методов компьютерного зрения, которые изменят ваш взгляд на мир
Сверточные нейронные сети: биологическая модель
Рекуррентные нейронные сети: мощный инструмент языкового моделирования
7 техник НЛП, которые изменят ваше общение в будущем
5 тенденций, доминирующих в компьютерном зрении в 2018 году
3 платформы глубокого обучения для комплексного распознавания речи, которые обеспечивают работу ваших устройств
5 алгоритмов для эффективного вывода глубокого обучения на небольших устройствах
4 исследовательских метода для более эффективного обучения моделей глубоких нейронных сетей
Две аппаратные архитектуры для эффективного обучения и вывода глубоких сетей
10 лучших практик глубокого обучения, о которых следует помнить в 2020 году
Эти шпаргалки в формате PDF взяты из сайта BecomingHuman.AI.