Загрузка Machine Learning with Python — загрузка исходного кода Machine Learning with Python

Machine Learning with Python

AI Исходный код

1.0.0

Скачать

Блокноты Jupyter для машинного обучения Python (веб-сайт ML)

Доктор Тиртаджиоти Саркар, Фремонт, Калифорния (пожалуйста, не стесняйтесь подключиться к LinkedIn здесь)

Также ознакомьтесь с этими суперполезными репозиториями, которые я курировал.

Высоко цитируемые и полезные статьи, связанные с машинным обучением, глубоким обучением, искусственным интеллектом, теорией игр, обучением с подкреплением.
Тщательно подобранные ссылки на ресурсы по науке о данных в одном месте.

Требования

Питон 3.6+
NumPy ( pip install numpy )
Панды ( pip install pandas )
Scikit-learn ( pip install scikit-learn )
SciPy ( pip install scipy )
Statsmodels ( pip install statsmodels )
MatplotLib ( pip install matplotlib )
Seaborn ( pip install seaborn )
Sympy ( pip install sympy )
Колба ( pip install flask )
WTForms ( pip install wtforms )
Tensorflow ( pip install tensorflow>=1.15 )
Керас ( pip install keras )
pdpipe ( pip install pdpipe )

Вы можете начать со статьи, которую я написал в журнале Heartbeat (на платформе Medium):

«Некоторые важные приемы и приемы машинного обучения с помощью Python»

Основные блокноты обучающего типа по Pandas и Numpy

Блокноты Jupyter, охватывающие широкий спектр функций и операций по темам NumPy, Pandans, Seaborn, Matplotlib и т. д.

Подробные операции Numpy
Подробные операции Pandas
Краткое руководство по Numpy и Pandas
Краткое описание Matplotlib и Seaborn
Расширенные операции Pandas
Как читать различные источники данных
Демонстрация чтения PDF и обработки таблиц
Насколько быстро выполняются операции Numpy по сравнению с чистым кодом Python? (Прочитайте мою статью на Medium, связанную с этой темой)
Быстрое чтение из Numpy с использованием формата файла .npy (прочитайте мою статью на Medium по этой теме)

Блокноты учебного типа, посвященные регрессии, классификации, кластеризации, уменьшению размерности и некоторым базовым алгоритмам нейронных сетей.

Регрессия

Простая линейная регрессия с генерацией t-статистики

Несколько способов выполнения линейной регрессии в Python и сравнение их скорости (см. статью, которую я написал на freeCodeCamp)
Многомерная регрессия с регуляризацией

Полиномиальная регрессия с использованием функции конвейера scikit-learn (см. статью, которую я написал в разделе «На пути к науке о данных »).
Деревья решений и регрессия случайного леса (показывающие, как случайный лес работает как надежный/регуляризованный мета-оценщик, отвергающий переобучение)
Подробный визуальный анализ и диагностические тесты согласия для задачи линейной регрессии
Надежная линейная регрессия с использованием HuberRegressor из Scikit-learn.

Классификация

Логистическая регрессия/классификация (вот блокнот)

k - классификация ближайших соседей (вот блокнот)
Деревья решений и классификация случайных лесов (вот блокнот)
Классификация машин опорных векторов (вот блокнот) ( см. статью, которую я написал в разделе «Наука о данных» о SVM и алгоритме сортировки)

Наивная байесовская классификация (вот блокнот)

Кластеризация

K - означает кластеризацию (Вот блокнот)
Распространение сходства (показывает его временную сложность и влияние коэффициента затухания) (Вот блокнот)
Метод среднего сдвига (показывающий его временную сложность и влияние шума на обнаружение кластеров) (Вот блокнот)
DBSCAN (показывает, как он может в целом обнаруживать области с высокой плотностью независимо от формы кластеров, чего не может сделать k-среднее) (Вот блокнот)
Иерархическая кластеризация с дендограммами, показывающими, как выбрать оптимальное количество кластеров (вот блокнот)

Уменьшение размерности

Анализ главных компонентов

Глубокое обучение/Нейронная сеть

Демо-блокнот, иллюстрирующий превосходство глубокой нейронной сети в решении сложных задач аппроксимации нелинейных функций.
Пошаговое построение плотной сети с 1 скрытым слоем и 2 скрытыми слоями с использованием базовых методов TensorFlow.

Генерация случайных данных с использованием символьных выражений

Как использовать пакет Sympy для генерации случайных наборов данных с использованием символьных математических выражений.
Вот моя статья на Medium на эту тему: Генерация задач случайной регрессии и классификации с символьным выражением.

Методы генерации синтетических данных

Ноутбуки здесь

Простые примеры развертывания (обслуживание моделей машинного обучения в веб-API)

Обслуживание модели линейной регрессии через простой интерфейс HTTP-сервера. Пользователю необходимо запросить прогнозы, выполнив скрипт Python. Использует Flask и Gunicorn .
Обслуживание рекуррентной нейронной сети (RNN) через веб-страницу HTTP с веб-формой, где пользователи могут вводить параметры и нажимать кнопку для генерации текста на основе предварительно обученной модели RNN. Использует Flask , Jinja , Keras / TensorFlow , WTForms .

Объектно-ориентированное программирование с машинным обучением

Реализация некоторых основных принципов ООП в контексте машинного обучения путем создания собственного оценщика, подобного Scikit-learn, и его улучшения.

Смотрите мои статьи на Medium по этой теме.

Объектно-ориентированное программирование для специалистов по данным: создайте свой оценщик ML
Как простое сочетание объектно-ориентированного программирования может улучшить ваш прототип глубокого обучения

Модульное тестирование кода ML с помощью Pytest

Проверьте файлы и подробные инструкции в каталоге Pytest, чтобы понять, как писать код/модуль модульного тестирования для моделей машинного обучения.

Профилирование памяти и времени

Профилирование кода обработки данных и моделей машинного обучения с учетом объема памяти и времени вычислений — важная, но часто упускаемая из виду область. Вот пара блокнотов, демонстрирующих идеи: