inna映射技术 v1.0
1.0
inna1.0是一个基于FPGA的CNN自适应映射技术。
基于FPGA板卡设计深度学习加速器并进行优化,在整体性能和功耗方面拟达到业界领先水平,映射技术采用宏指令的Look-Aside Acceleration框架,实现了一键式快速部署、软硬件协同优化、支持多种卷积、执行过程无需主机干预。
本项目为映射技术的软件端,拟实现CNN映射编译器和CNN量化器,首先由TensorFlow产生的模型文件解析产生CNN的计算图模型,CNN映射编译器会根据解析的计算图和现有的CNN加速库单元,选择相应的CNN库单元,生成相应的硬件结构和相应的调度器的配置参数,以达到计算、片上存储、片上带宽和片外带宽的均衡,从而达到最优的计算性能;CNN量化器可根据模型的权重文件,对各层数据进行8位定点量化,以便于FPGA的DSP计算,从而在保证精度的前提下降低存储开销,提高处理速度,降低功耗。