Удивительные инструменты и проекты с открытым исходным кодом машинного обучения за прошедший год (версия 2019 г.)
За последний год мы сравнили около 22 000 инструментов и проектов машинного обучения с открытым исходным кодом и выбрали 49 лучших (вероятность 0,22%).
Инструменты и проекты разбиты на 6 категорий.
Компьютерное зрение (1~5)
Обучение с подкреплением (6~13)
НЛП (14~20)
ГАН (21~26)
Нейронная сеть (27~35)
Инструментарий (36~49)
Это чрезвычайно конкурентный список, в котором тщательно отбираются лучшие проекты машинного обучения с открытым исходным кодом, опубликованные в период с января по декабрь 2018 года. Mybridge AI оценивает качество, учитывая популярность, вовлеченность и новизну. Чтобы вы имели представление о качестве, среднее количество Github ️ составляет 3566.
Подпишитесь на «Ежемесячник машинного обучения»: ссылка
Оригинальная статья на Medium: Ссылка
А) Новичок: машинное обучение, наука о данных и глубокое обучение с помощью Python. TensorFlow и нейронные сети: 84 632 рекомендации, 4,5/5 звезд
Б) Продвинутый уровень: глубокое обучение с подкреплением на Python. 20 396 рекомендаций, 4,6/5 звезд
Detectron: исследовательская платформа FAIR для исследования обнаружения объектов, реализующая популярные алгоритмы, такие как Mask R-CNN и RetinaNet. ★18910
Openpose: библиотека обнаружения ключевых точек нескольких человек в режиме реального времени для оценки тела, лица и рук ★11048
DensePose: метод в реальном времени для сопоставления всех пикселей 2D RGB-изображений человека с трехмерной моделью тела на основе поверхности ★4165
Maskrcnn-benchmark: Быстрая модульная эталонная реализация алгоритмов семантической сегментации и обнаружения объектов в PyTorch. ★3888
СНАЙПЕР — эффективный многомасштабный алгоритм обнаружения объектов ★1963 г.
Psychlab: Экспериментальные парадигмы, реализованные с использованием платформы Psychlab (3D-платформа для агентного искусственного интеллекта) ★5594
ELF: Обширная, легкая и гибкая платформа для исследования игр. Мы использовали его для создания нашего бота для игры в го, ELF OpenGo, который установил рекорд 14-0 против четырех игроков из топ-30 мира ★2406
TRFL: библиотека полезных строительных блоков для написания агентов обучения с подкреплением (RL) в TensorFlow ★2312
Horizon: первая платформа обучения с подкреплением с открытым исходным кодом для крупномасштабных продуктов и услуг ★1702
Chess-alpha-zero: Обучение шахматам с подкреплением методами AlphaGo Zero. ★1307
Dm_control: Пакет управления и пакет управления DeepMind ★1231
MAMEToolkit: Библиотека Python для обучения аркадным играм ★437
Reaver: Reaver: модульная платформа глубокого обучения с подкреплением. Ориентирован на StarCraft II. Поддерживает Gym, Atari и MuJoCo. Соответствует эталонным результатам. ★355
Берт: код TensorFlow и предварительно обученные модели для BERT ★11691.
Pytext: среда моделирования естественного языка на основе PyTorch ★4466.
Bert-as-service: модель НЛП, разработанная Google для предварительного обучения языковым представлениям. Он использует огромное количество текстовых данных, общедоступных в Интернете, и обучается без присмотра. ★2053
UnsupervisedMT: машинный перевод на основе фраз и нейронных сетей без присмотра — исследование Facebook ★1066
DecaNLP: Десятиборье естественного языка: многозадачный вызов НЛП - Salesforce ★1647
Nlp-архитектор: NLP Architect от Intel AI Lab: библиотека Python для изучения новейших топологий и методов глубокого обучения для НЛП ★1751
Глюон-НЛП: НЛП стало проще ★1262
DeOldify: проект на основе глубокого обучения для раскрашивания и восстановления старых изображений ★5059
Progressive_growing_of_gans: Прогрессивное выращивание GAN для улучшения качества, стабильности и разнообразия ★4046
MUNIT: Мультимодальный неконтролируемый перевод изображений в изображения ★1339
Transparent_latent_gan: используйте контролируемое обучение для освещения скрытого пространства GAN для контролируемой генерации и редактирования ★1337
Gandisect: инструменты на основе Pytorch для визуализации и понимания нейронов GAN. ★1064
GANimation: анатомическая анимация лица из одного изображения ★869
Фастай: упрощает обучение быстрых и точных нейронных сетей с использованием лучших современных практик ★11594
DeepCreamPy: децензурирование хентая с помощью глубоких нейронных сетей ★7045
Augmentor v0.2: библиотека расширения изображений на Python для машинного обучения. ★2805
Graph_nets: создание графовых сетей в Tensorflow ★2722
Textgenrnn: модуль Python для простой генерации текста с использованием предварительно обученной символьной рекуррентной нейронной сети. ★1900
Блокировщик людей: автоматически «блокирует» людей на изображениях (например, «Черное зеркало») с помощью предварительно обученной нейронной сети. ★1806
Deepvariant: DeepVariant — это конвейер анализа, который использует глубокую нейронную сеть для вызова генетических вариантов из данных секвенирования ДНК следующего поколения. ★1502
Video-nonlocal-net: нелокальные нейронные сети для классификации видео ★1048
Ann-визуализатор: библиотека Python для визуализации искусственных нейронных сетей (ИНС) ★922
Tfjs: браузерная библиотека JavaScript с ускорением WebGL для обучения и развертывания моделей машинного обучения. ★10265
Дофамин: исследовательская основа для быстрого прототипирования алгоритмов обучения с подкреплением - Google ★7139
Лайм: объяснение предсказаний любого классификатора машинного обучения ★5173
Autokeras: библиотека программного обеспечения с открытым исходным кодом для автоматизированного машинного обучения (AutoML) ★4517
Шап: объясните результаты любой модели машинного обучения, используя ожидания и значения Шепли. ★3492
MMdnn: набор инструментов, помогающих пользователям взаимодействовать между различными платформами глубокого обучения. Например, преобразование модели и визуализация. Преобразование моделей между Caffe, Keras, MXNet, Tensorflow ★3020
Mlflow: платформа с открытым исходным кодом для жизненного цикла машинного обучения ★3011
Mace: платформа вывода глубокого обучения, оптимизированная для мобильных гетерогенных вычислительных платформ. ★2978
PySyft: библиотека Python для безопасного и конфиденциального глубокого обучения. PySyft отделяет частные данные от обучения модели, используя многосторонние вычисления (MPC) в PyTorch ★2594
Adanet: быстрый и гибкий AutoML с гарантиями обучения. ★2291
Tencent-ml-images: крупнейшая база данных изображений с несколькими метками; модель ResNet-101; 80,73% в топ-1 рейтинга ImageNet ★2094
Donkeycar: аппаратная и программная платформа с открытым исходным кодом для создания небольшого беспилотного автомобиля. ★1207
PocketFlow: платформа автоматического сжатия моделей (AutoMC) для разработки небольших и быстрых приложений искусственного интеллекта. ★1674
DALI: библиотека, содержащая как высокооптимизированные строительные блоки, так и механизм выполнения для предварительной обработки данных в приложениях глубокого обучения ★1012