Чтобы увидеть еще больше крутости, посмотрите .
Это тщательно подобранный список замечательных ресурсов со всем, что вам нужно для разработки решений машинного обучения.
Каждый пункт в этом списке научит вас как минимум одному отчетливому и важному навыку или части информации.
Существует три уровня контента:
? Важное чтение для всех инженеров ML
? Дополнительная литература для профессиональных инженеров ML
? Экспертный материал для опытных инженеров ML
Описания пишутся для завершения предложения «После прочтения этой статьи вы узнаете…» .
Коммуникация
Программная инженерия
Машинное обучение
DevOps
BLUF: Военный стандарт, который может сделать ваше письмо более эффективным. Как сделать ваше общение более эффективным (5 минут)
Проблема XY. Как сосредоточиться на объяснении вашей конечной цели при обращении за помощью (5 минут)
Навес для велосипедов: насколько вы зрелый инженер? - Как избежать и предупредить о парковке велосипедов (5 минут)
Пишите по электронной почте как начальник. Как лучше писать электронные письма (5 минут)
Хватит швейцарской сырности своему календарю: как управлять календарем, чтобы можно было сосредоточиться (15 минут)
Как писать простым английским языком — Как писать простым английским языком (30 минут)
Правила презентации: как создать отличную презентацию (30 минут)
Критерии SMART. Как определить цели (15 минут)
Принцип MECE. Как полностью разложить проблему в структурированный список (15 минут)
SCQA: Что это такое, как это работает и чем это может мне помочь? - Как структурировать презентации, предложения и планы продаж (15 минут)
Никаких недопониманий: как избежать недопонимания путем перефразирования (15 минут)
Ненасильственное общение. Как обеспечить конструктивную обратную связь в сложных ситуациях (15 минут)
Эффект ореола. Как распознать эффект ореола и использовать его в своих целях (15 минут)
Мифический человеко-месяц — взаимосвязь между человеко-днями и временем выполнения проекта (15 минут)
Четырехсторонняя модель. Как эффективно общаться, учитывая, как получатель интерпретирует ваше сообщение (30 минут)
Семантическое управление версиями. Как повысить версию ваших приложений и пакетов (15 минут)
__all__
и дикий импорт в Python. Как __all__
определяет общедоступный API ваших пакетов Python (15 минут)
API для машинного обучения. Как разрабатывать RESTful API для приложений машинного обучения (30 минут)
Документация FastAPI. Как создавать RESTful API, которые однозначно соответствуют спецификации OpenAPI (1 день)
Правило трех: когда создавать повторно используемые компоненты, а когда нет (15 минут)
Ложные представления программистов о времени. Как избежать распространенных ошибок, связанных со временем (15 минут)
Программисты верят в ложь об именах. Как избежать распространенных ошибок, связанных с именами (15 минут)
Рекомендации по интерфейсу командной строки. Как написать отличный интерфейс командной строки (1 час)
Рекомендации Zalando по RESTful API — Как разрабатывать RESTful API (1 день)
Poetry Cookiecutter — Как создать современную среду разработки на основе Poetry для пакетов и приложений Python (30 минут)
Семь правил хорошего сообщения о коммите Git. Как писать отличные сообщения о коммитах Git (15 минут)
Изучите ветвление Git — практикуйте Git от новичка до продвинутого уровня (1 час)
Ведение журнала изменений: как вести журнал изменений для ваших приложений и пакетов (30 минут)
Обычные коммиты: как добавлять префикс к сообщениям о коммитах для автоматизации семантического управления версиями и ведения журнала изменений (15 минут)
Тестирование приложений Python с помощью Pytest. Как правильно протестировать пакет с помощью pytest (30 минут)
Успешная модель ветвления Git. Как выпускать программное обеспечение с помощью Git (15 минут)
Рекомендации по проверке кода. На что следует обращать внимание при проверке запроса на включение (30 минут)
Здоровье кода: уважительные обзоры == Полезные обзоры. Как уважительно передавать комментарии по обзору кода (15 минут)
Пирамида проверки кода: на что обращать внимание и что автоматизировать при проверке запроса на включение (15 минут)
Плагин рабочей области Poetry — как создать монорепозиторий на основе Poetry и управлять им (15 минут)
PEP20 «Дзен Python» — Как написать идиоматический Python (15 минут)
Полное руководство по операторам импорта Python. Как писать операторы импорта (30 минут)
Понимание модуля журналирования Python. Как эффективно использовать модуль logging
(30 минут)
Не запускайте код во время импорта. Почему не следует запускать код во время импорта
Пожалуйста, исправьте свои декораторы. Почему вам, вероятно, следует использовать wrapt
для написания своих декораторов (30 минут)
Не вести журнал. Что следует делать вместо ведения журнала (30 минут)
Маленькая книга антипаттернов Python — коллекция антипаттернов Python (X часов)
Эффективный Python — сборник идиом Python (X часов)
Шаблоны проектирования Python — коллекция шаблонов архитектуры программного обеспечения (1 час)
SOLID — стандартный набор шаблонов архитектуры программного обеспечения (1 час)
Какой к черту Питон! - Как освоить Python, понимая его крайние случаи (1 день)
Полное руководство по mypy. Как писать аннотации типов на Python (1 час)
Обзор Pydantic. Как писать аннотации типов для сложных типов вместо бессмысленного Dict[str, Any]
(1 час)
Магическое число. Почему магические значения являются антипаттерном (15 минут)
Enums. Как написать Enum
на Python вместо небезопасных по типу магических значений (15 минут)
Обобщенные типы Mypy. Как использовать TypeVar
для написания универсальных типов, таких как List[T]
(30 мин.)
Протоколы Mypy. Как использовать Protocol
для определения интерфейсов, таких как Iterable
(30 минут)
cookiecutter — быстро формируйте новые пакеты или приложения Python с помощью шаблона Cookiecutter.
cruft — обновить базовую структуру Cookiecutter пакета Python.
commitizen — проверьте, что сообщения о фиксации соответствуют обычным коммитам, автоматизируйте семантическое управление версиями и ведите журнал изменений.
поэзия — управляйте упаковкой и зависимостями вашего проекта Python.
poe — определение и выполнение задач в проекте Poetry с помощью Poe the Poet.
поэтическое рабочее пространство-плагин — Управляйте монорепозиторием Python с помощью этого плагина Poetry.
черный — автоматическое форматирование кода
isort — автоматическая сортировка операторов импорта.
pre-commit — автоматически запускать проверки качества кода при фиксации.
бандит - Найдите общие проблемы безопасности
дарглинт — убедитесь, что строки документации соответствуют сигнатуре вашей функции.
flake8 — проверьте свой код на наличие ошибок и соответствие стиля кода PEP8.
Расширения flake8 — потрясающий список расширений Flake8.
mypy — проверьте правильность типа вашего кода.
перехватчики предварительной фиксации — набор перехватчиков предварительной фиксации, которые проверяют качество файла.
pydocstyle — убедитесь, что ваш код задокументирован.
pygrep перехваты — набор перехватчиков перед фиксацией, которые проверяют распространенные запахи кода Python.
pytest-recording — Записывайте и воспроизводите HTTP-запросы в ваших тестах pytest.
? pyupgrade — убедитесь, что ваш код написан с использованием новейших функций языка Python.
? безопасность. Убедитесь, что в ваших зависимостях нет известных уязвимостей безопасности.
? Shellcheck — проверьте качество ваших сценариев оболочки.
? Coverage.py — проверьте покрытие вашего кода тестами.
? Гипотеза. Пишите тесты, которые автоматически ищут крайние случаи, которые нарушают ваш код.
? гипотеза-авто — автоматизирует создание тестов гипотез на основе аннотаций типов вашего кода.
? fastapi — создание RESTful API на основе аннотаций типов.
? typer — создание интерфейсов командной строки на основе аннотаций типов.
? streamlit — создание веб-приложений с помощью одного файла Python
? Bump2version — Выпустить новую версию вашего пакета.
? colorlogs — улучшите читаемость ваших журналов с помощью цвета.
? hvplot — создание интерактивных графиков из фреймов данных pandas.
? mkdocs — создайте документацию для разработчиков для вашего проекта.
? pdoc — создание документации API для вашего кода.
? Birdseye — графическая отладка вашего кода Python
? Scalene — профилируйте использование процессора и памяти вашего кода построчно.
? viztracer — Визуализируйте производительность вашего кода с помощью Flamegraph.
? tqdm — легко добавлять индикаторы выполнения к долго выполняющимся заданиям.
? Компромисс смещения и дисперсии. Как общая ошибка модели представляет собой сумму смещения и дисперсии (30 минут)
? Два разных применения перекрестной проверки. Как использовать вложенную перекрестную проверку для объединения двух разных способов перекрестной проверки (30 минут)
? Режимы, медианы и средние значения: объединяющая перспектива: почему минимизация средней абсолютной ошибки (MAE) более надежна, чем минимизация среднеквадратической ошибки (MSE) (30 мин)
? Обратное распространение ошибки — это цепное правило для вычисления градиента. Как обратное распространение ошибки — это алгоритм вычисления градиента целевой функции (30 минут)
? Сложенное обобщение. Как складывать модели (30 минут)
? Мы использовали неправильную инициализацию для t-SNE и UMAP. Как правильно инициализировать t-SNE и UMAP (15 минут)
? От классических полносвязных сетей к трансформерам. Как нейронные сети эволюционировали от полносвязных сетей к трансформерам (30 минут)
? Что такое правило .632+? - Как измерить эффективность обобщения с помощью начальной загрузки (30 минут)
? Стратегии штабелирования с утечками и без них. Различные стратегии штабелирования моделей (30 минут).
? Сдвиги в распределении данных и мониторинг: как обнаружить и устранить различные типы сдвига данных (1 час)
? Обратное распространение — это не просто цепное правило. Как обратное распространение связано с множителями Лагранжа (30 минут)
? Почему алгоритмы машинного обучения трудно настроить. Оптимизация нескольких целей, когда фронт Парето вогнутый (30 минут).
? Сжатие моделей глубокого обучения. Как можно использовать квантование, сокращение и дистилляцию для сжатия моделей (30 минут)
? SHAP: Аддитивные пояснения Шепли. Как объяснить выходные данные модели с помощью значений Шепли (30 минут)
? Введение в Шепли и SHAP. Как значения Шепли аппроксимируются с помощью SHAP (30 минут)
? UMAP: аппроксимация и проекция равномерного многообразия — как уменьшить размерность для визуализации и моделирования (30 минут)
? PyNNDescent — Как найти ближайших соседей в огромных наборах данных (15 минут)
? Точность и полнота. Как точность и полнота измеряют производительность классификатора (30 минут)
? Калибровка вероятности. Как и для каких типов моделей следует калибровать выходные показатели модели по вероятностям (30 минут)
? Вы все неправильно рассчитываете отток клиентов. Правильно определите, что такое отток (30 минут).
? Гауссовские процессы - С нуля - Как построить модели вероятностной регрессии с помощью гауссовских процессов (1 час)
? Microsoft Document Image Transformer — предварительно обученная модель с самоконтролем, которая обеспечивает производительность SotA в PubLayNet и может использоваться для различных последующих задач (30 минут).
? Awesome Sentence Embedding — тщательно подобранный список предварительно обученных моделей внедрения предложений и слов (15 минут).
? Модель Пророка. Как модель Пророка Меты разлагает временной ряд на компоненты тренда, сезонности и праздников (30 минут)
? Дартс — временные ряды в Python — как создавать модели прогнозирования с помощью darts
(1 час)
? Microsoft Recommenders – сравнение моделей рекомендательных систем (30 минут)
? Что бы я хотел, чтобы кто-нибудь рассказал мне о библиотеках тензорных вычислений: чем отличаются JAX, PyTorch, TensorFlow и Theano (30 минут)
? Серия «Современные панды» (Части 1–7) — Напишите идиоматические панды (1 час)
? Awesome Pandas — потрясающий список ресурсов Pandas (1 час)
? Использование конвейеров scikit-learn и FeatureUnions. Как использовать Pipeline
для создания комплексных моделей (30 минут)
? Преобразование цели в регрессию. Как преобразовать цель для создания более надежных моделей (15 минут)
? ColumnTransformer для гетерогенных данных. Как использовать ColumnTransformer
для обработки DataFrames pandas в sklearn Pipeline
(30 минут)
? Пользовательские оценщики. Создайте свой собственный Estimator
(30 минут).
? Оптимизация гиперпараметров с последовательным сокращением пополам. Как оптимизировать гиперпараметры с помощью наиболее эффективного в вычислительном отношении метода (30 минут)
? Doccano — инструмент для разметки текста (30 мин)
? CVAT: Инструмент аннотаций компьютерного зрения — инструмент для маркировки изображений (30 минут)
? Awesome Data Labeling – потрясающий список инструментов для маркировки данных (30 минут)
? Invoke — Как реализовать типичные задачи, которые вы выполняете в своем проекте, через CLI (30 минут)
? poe — Как реализовать типичные задачи, которые вы выполняете в своем проекте, через CLI (30 минут)
? Введение в упаковку и управление зависимостями для Python с помощью Poetry. Как управлять зависимостями и средой вашего пакета Python (30 минут)
? Введение в Pyenv для машинного обучения. Как использовать pyenv для управления интерпретатором Python (30 минут)
? Современные среды Python. Управление зависимостями и рабочим пространством. Сравнение pyenv, venv + pip, venv + pip-tools, поэзии, Pipenv и Conda (30 минут)
? Конда: мифы и заблуждения — распространенные заблуждения о Конде (15 минут)
? Учебный план Docker — Как использовать Docker (4 часа)
? Кэширование слоев Docker. Как написать файлы Dockerfile, чтобы получить выгоду от кэширования слоев (30 минут)
? Лучшие практики Dockerfile. Как писать хорошие Dockerfiles (1 час)
? Настройка Gunicorn для Docker. Как лучше всего настроить Gunicorn для образа Docker (30 минут)
? Ускорьте Docker с помощью нового кэширования BuildKit. Как ускорить сборку Docker с помощью кэша сборки (30 минут)
? Безопасное создание секретов в Docker и Compose. Как использовать секреты в сборке Docker (15 минут)
? Сканеры безопасности для Python и Docker. Как сканировать образ Docker на предмет проблем безопасности с вашим кодом и образом Docker (30 минут)
? Сканер безопасности, который кричал волком. Как сканировать образ Docker на наличие проблем с безопасностью без ложных срабатываний (15 минут)
? Awesome Docker – потрясающий список ресурсов Docker (30 минут)
? Большие надежды. Как тестировать и документировать данные и конвейеры данных (30 минут)
? Лучшие практики Cron. Как лучше всего использовать cron для планирования задач (30 минут)
? Визуальное руководство по туннелям SSH. Как перенаправлять порты и создавать туннели с помощью SSH (30 минут)
? Безопасные способы выполнения задач в bash. Как писать безопасные и надежные сценарии оболочки (1 час)
? Ваш терминал не является терминалом: Введение в потоки. Как ваш терминал является инструментом для управления потоками (30 минут)
? Bash Heredoc. Как передавать многострочные аргументы командам с помощью heredoc (30 минут)
? Пожалуйста, перестаньте писать сценарии оболочки. Почему не следует писать сценарии оболочки для образов CI/CD или Docker (30 минут)
? Введение в Terraform – Как использовать Terraform (1 час)
? Лучшие практики Terraform — Лучшие практики Terraform (1 час)
? Коллекция перехватчиков перед фиксацией Terraform — как автоматизировать проверку качества кода Terraform с помощью предварительной фиксации (1 час)
? Awesome Terraform – потрясающий список ресурсов Terraform (30 минут)
? Учебное пособие по Terraform — Как начать работу с Terraform (1 час)
? Использование хранилища Redis в памяти для приложений Python. Как использовать Redis в качестве кэша в памяти для приложения Python (30 минут)
? Потребители Kafka в Python: хотя бы один раз, максимум один раз, ровно один раз. Как написать различные типы потребителей Kafka на Python (30 минут)
? Kafka Exactly-Once-Semantics — Как создавать и использовать сообщения ровно один раз (1 час)
? RabbitMQ: библиотека очередей сообщений с постоянством. RabbitMQ — это система обмена сообщениями с брокером сообщений (4 часа).
? ZeroMQ: библиотека сокетов с примитивами очереди сообщений. ZeroMQ — это облегченная система обмена сообщениями без брокера сообщений (8 часов).
Superlinear — бельгийская компания по машинному обучению.
Мы изобретаем, проектируем и разрабатываем программное обеспечение на базе искусственного интеллекта. Вместе с нашими клиентами мы определяем, какие проблемы внутри организаций можно решить с помощью ИИ, демонстрируя ценность искусственного интеллекта для каждой проблемы.
Наша команда постоянно ищет новые и более эффективные решения, и мы бросаем вызов друг другу, предлагая лучшие идеи для наших клиентов и нашей компании.
Вот несколько примеров того, что мы делаем с машинным обучением, технологией, лежащей в основе искусственного интеллекта:
Помогите соискателям найти отличную работу, соответствующую их ожиданиям. На веб-сайте Бельгийской государственной службы занятости вы можете найти наши рекомендации по работе, основанные только на вашем резюме.
Помогите больницам сэкономить время. Мы извлекаем диагноз из писем о выписке пациентов.
Помогите издателям оценить свое влияние, обнаруживая подражательные статьи.
Мы много работаем и весело проводим время вместе. Мы развиваем культуру сотрудничества, где каждый член команды чувствует поддержку, когда решает задачу, и доверие, когда берет на себя ответственность.