Кафе-HRT
Caffe-HRT — это проект, поддерживаемый OPEN AI LAB. Он использует структуру гетерогенной вычислительной инфраструктуры для ускорения Caffe и предоставляет утилиты для отладки, профилирования и настройки производительности приложений.
Версия выпуска — 0.5.0, основана на платформе Rockchip RK3399, целевая ОС — Ubuntu 16.04. Можно скачать исходный код с OAID/Caffe-HRT.
- Библиотека компьютерного зрения и машинного обучения ARM представляет собой набор функций, оптимизированных как для процессоров ARM, так и для графических процессоров с использованием технологий SIMD. См. также Библиотеку вычислений Arm.
- Caffe — это быстрая открытая среда для глубокого обучения. См. также Кафе.
Документы
- Инструкции по установке
- Руководства пользователя PDF
- Отчет о производительности PDF
- Отчет о точности PDF
Проблемы совместимости библиотеки Arm Compute:
Существуют некоторые проблемы совместимости между ACL и слоями Caffe, мы обходим их исходным классом слоев Caffe в качестве обходного решения для следующих проблем.
- Проблема нормализации внутри канала
- Проблема Таня
- Softmax поддерживает многомерную проблему
- Групповая проблема
Производительность должна быть улучшена в будущем
История выпусков
Версия на основе Caffe — 793bd96351749cb8df16f1581baf3e7d8036ac37.
Версия 0.5.0 — 31 января 2018 г.
Поддержка вычислительной библиотеки Arm версии 17.12
Версия 0.4.1 — 23 ноября 2017 г.
Поддержка вычислительной библиотеки Arm версии 17.10
Версия 0.4.0 — 11 октября 2017 г.
Поддержка вычислительной библиотеки Arm версии 17.09
Версия 0.3.0 — 26 августа 2017 г.
Поддержка библиотеки Arm Compute Library версии 17.06 с добавлением 4 новых слоев.
- Уровень пакетной нормализации
- Слой прямой свертки
- Слой локального подключения
- Объединить слой
Версия 0.2.0 — 2 июля 2017 г.
Исправьте проблемы:
- Совместимость с библиотекой вычислений Arm версии 17.06.
- При сбое инициализации OpenCL, даже если Caffe использует режим ЦП, он не работает должным образом.
Версия 0.1.0 — 2 июня 2017 г.
Первоначальная версия поддерживает 10 слоев, ускоренных с помощью библиотеки Arm Compute Library версии 17.05:
- Слой свертки
- Слой пула
- ЛРН-слой
- Слой ReLU
- Сигмовидный слой
- Слой Софтмакс
- Слой TanH
- Слой АбсВал
- Слой БНЛЛ
- Внутренний слой продукта
Отчет о проблеме
При возникновении каких-либо проблем сообщите об этом в отчете. Отчет о проблеме должен содержать следующую информацию:
- Точное описание действий, необходимых для воспроизведения проблемы.
- Точное описание того, что происходит и что вы считаете неправильным