Caffe-HRT
Caffe-HRT ist ein Projekt, das von OPEN AI LAB verwaltet wird. Es nutzt ein heterogenes Computing-Infrastruktur-Framework, um Caffe zu beschleunigen und Dienstprogramme zum Debuggen, Profilieren und Optimieren der Anwendungsleistung bereitzustellen.
Die Release-Version ist 0.5.0, basiert auf der Rockchip RK3399-Plattform, Zielbetriebssystem ist Ubuntu 16.04. Der Quellcode kann von OAID/Caffe-HRT heruntergeladen werden
- Die ARM-Bibliothek für Computer Vision und maschinelles Lernen besteht aus einer Reihe von Funktionen, die mithilfe von SIMD-Technologien sowohl für ARM-CPUs als auch für GPUs optimiert sind. Siehe auch Arm Compute Library.
- Caffe ist ein schnelles offenes Framework für Deep Learning. Siehe auch Caffe.
Unterlagen
- Installationsanleitung
- Benutzerhandbücher im PDF-Format
- Leistungsbericht PDF
- Genauigkeitsbericht PDF
Kompatibilitätsprobleme der Arm Compute-Bibliothek:
Es gibt einige Kompatibilitätsprobleme zwischen ACL und Caffe Layers. Wir gehen auf die ursprüngliche Layer-Klasse von Caffe um, um die folgenden Probleme zu umgehen
- Problem mit der Normalisierung im Kanal
- Tanh-Problem
- Softmax unterstützt mehrdimensionale Probleme
- Gruppenproblem
Die Leistung muss in Zukunft in Ordnung gebracht werden
Veröffentlichungsverlauf
Die auf Caffe basierende Version ist 793bd96351749cb8df16f1581baf3e7d8036ac37.
Version 0.5.0 – 31. Januar 2018
Support Arm Compute Library Version 17.12
Version 0.4.1 – 23. November 2017
Support Arm Compute Library Version 17.10
Version 0.4.0 – 11. Oktober 2017
Support Arm Compute Library Version 17.09
Version 0.3.0 – 26. August 2017
Support Arm Compute Library Version 17.06 mit 4 neuen Ebenen hinzugefügt
- Batch-Normalisierungsschicht
- Direkte Faltungsschicht
- Lokale Verbindungsschicht
- Ebene verketten
Version 0.2.0 – 2. Juli 2017
Beheben Sie die Probleme:
- Kompatibel mit Arm Compute Library Version 17.06
- Wenn die OpenCL-Initialisierung fehlschlägt, funktioniert Caffe nicht richtig, selbst wenn sie den CPU-Modus verwendet.
Version 0.1.0 – 2. Juni 2017
Die erste Version unterstützt 10 Schichten, beschleunigt durch Arm Compute Library Version 17.05:
- Faltungsschicht
- Pooling-Schicht
- LRN-Schicht
- ReLU-Schicht
- Sigmoidschicht
- Softmax-Schicht
- TanH-Schicht
- AbsVal-Ebene
- BNLL-Schicht
- InnerProduct-Schicht
Problembericht
Wenn Sie auf ein Problem stoßen, melden Sie es bitte im Problembericht. Der Problembericht sollte die folgenden Informationen enthalten:
- Die genaue Beschreibung der Schritte, die zur Reproduktion des Problems erforderlich sind
- Die genaue Beschreibung dessen, was passiert und was Ihrer Meinung nach falsch ist