inna1.0 ist eine FPGA-basierte adaptive CNN-Mapping-Technologie.
Ein Deep-Learning-Beschleuniger wird auf der Grundlage des FPGA-Boards entwickelt und optimiert. Es wird erwartet, dass er hinsichtlich Gesamtleistung und Stromverbrauch das branchenführende Niveau erreicht. Die Mapping-Technologie nutzt das Look-Aside Acceleration-Framework von Makroanweisungen, um eins zu erreichen. Klicken Sie auf schnelle Bereitstellung, kollaborative Optimierung von Software und Hardware, unterstützt eine Vielzahl von Faltungen und der Ausführungsprozess erfordert kein Eingreifen des Hosts.
Dieses Projekt ist die Softwareseite der Mapping-Technologie. Es plant die Implementierung eines CNN-Mapping-Compilers und eines CNN-Quantisierers. Zunächst wird die von TensorFlow generierte Modelldatei analysiert, um ein CNN-Berechnungsdiagrammmodell zu erstellen Diagramm und vorhandene CNN-Beschleunigungsbibliothekseinheit, wählen Sie die entsprechende CNN-Bibliothekseinheit aus, generieren Sie die entsprechende Hardwarestruktur und entsprechende Durch die Konfigurationsparameter des Schedulers kann ein Gleichgewicht zwischen Berechnung, On-Chip-Speicherung, On-Chip-Bandbreite und Off-Chip-Bandbreite erreicht werden, um eine optimale Rechenleistung zu erzielen. Der CNN-Quantisierer kann eine 8-Bit-Festkomma-Quantisierung auf jeder Datenschicht durchführen auf der Gewichtungsdatei des Modells, um die DSP-Berechnung des FPGA zu erleichtern und so den Speicheraufwand zu reduzieren, die Verarbeitungsgeschwindigkeit zu verbessern, den Stromverbrauch zu senken und gleichzeitig die Genauigkeit sicherzustellen.