logo好方法网

图像识别层间并行流水线型二值化卷积神经网络阵列架构


技术摘要:
本发明公开了一种图像识别层间并行流水线型二值化卷积神经网络阵列架构,包括:依次设置的M1层、M2层、M3层、M4层及M5层五个计算层,并构成层间流水线,其中:M1层、M2层及M3层各自包含两个卷积层的计算,层内各自构成二级流水线,各层末端还有最大值池化层完成池化计  全部
背景技术:
生物学中认为生物的大脑神经元和突触组成网络,可用于产生生物意识,帮助生 物产生思考和行动。基于此,研究人工神经网络的科学家从中抽象出数学模型,从信息处理 角度对人脑神经元进行抽象,建立简单的数学模型,按照不同的连接方式构成网络。目前, 人工神经网络应用广泛,在语音识别领域、图像识别领域、目标检测领域等都有应用。在人 工神经网络研究过程中,科学家提出卷积神经网络的概念,它是一类包含深度结构的人工 神经网络,由前馈神经网络和负反馈神经网络组成,在识别时只进行前馈神经网络计算,训 练时则需要进行负反馈神经网络计算。卷积神经网络研究受视觉细胞研究启发,发现初级 视觉皮层中的神经元会响应视觉环境中的简单特征,视觉皮层存在简单细胞和复杂细胞, 简单细胞对特定空间位置和偏好方向有强烈反应,通过对简单细胞的输入进行池化可以实 现复杂空间上的不变性。由此可知,在卷积神经网络中,基础计算为卷积计算和池化计算。 卷积计算是使用特定大小的卷积核来提取某个特定区域内的特征,主要是乘累加的计算过 程。池化计算则是下采样的过程,下采样可以去除不重要的特征元素,降低特征图规模,减 少计算参数,同时能保留特征图的重要特征,使其不影响后续计算。 随着研究的深入,卷积神经网络网络规模逐渐增大,这导致卷积神经网络需要更 多存储资源,计算资源消耗也持续增大。因此,研究减少卷积神经网络存储需求和计算需求 成了卷积神经网络研究的一个热点。目前,降低卷积神经网络存储需求和计算需求的主流 方法有剪枝、奇异值分解、量化、脉冲神经网络等几种方式。剪枝可以在训练时找到相邻两 层之间相对不重要的连接并将其权重置0,即相当于剪断连接,因此在计算过程中减少了权 重参数存储和计算次数;奇异值分解一般应用在全连接层中,通过奇异值分解的方式可以 将两个大规模的矩阵相乘转化为三个较小规模的矩阵相乘,从而也能降低存储需求和计算 需求;量化神经网络则是使用较少比特数来表示原浮点数值,一般可用11bit、8bit、5bit、 3bit、2bit、1bit等,采用1bit即使用 1和-1两种状态完成计算的网络又叫做二值化卷积神 经网络;脉冲神经网络更接近生物神经网络的工作模式,在计算中如果某个突触前神经元 的膜电位超过了预设的电压阈值则向后发射一个脉冲,否则对应的突触后神经元因为没有 输入脉冲均保持非工作状态,在硬件加速中没有脉冲即无动态功耗,仅存在静态功耗,从而 也能降低总功耗。 为了达到图片实时性处理效果,科研工作者一般采用GPU、FPGA和ASIC设计加速 器。但是,受限于卷积神经网络存储需求和计算需求大,图像识别消耗资源多,很多硬件难 以满足存储需求,计算并行度低,无法实现高能效,因此,基于二值化卷积神经网络,设计一 种层间并行流水线型阵列架构用于图像识别是非常重要的。 4 CN 111582451 A 说 明 书 2/6 页
技术实现要素:
本发明的目的是提供一种图像识别层间并行流水线型二值化卷积神经网络阵列 架构,能够提高图像识别计算并行度,降低权重存储需求,同时有效避免乘法计算,降低功 耗,提高能效。 本发明的目的是通过以下技术方案实现的: 一种图像识别层间并行流水线型二值化卷积神经网络阵列架构,包括:依次设置 的M1层、M2层、M3层、M4层及M5层五个计算层,并构成层间流水线,其中: M1层、M2层及M3层各自包含两个卷积层的计算,层内各自构成二级流水线,各层末 端还有最大值池化层完成池化计算;M4层与M5层各自包含1个与两个全连接层的计算;每一 卷积层及每一全连接层内都设有连接全局控制器的控制单元,以及用于存储权重参数和二 值编码参数的存储器。 由上述本发明提供的技术方案可以看出,图像识别二值化卷积神经网络硬件加速 计算可以降低硬件存储需求,避免乘法计算,降低能耗,提高并行度,从而提高识别速度和 能效。 附图说明 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本 领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 附图。 图1为本发明实施例提供的一种图像识别层间并行流水线型二值化卷积神经网络 阵列架构的示意图; 图2为本发明实施例提供的层间并行流水线计算示意图; 图3为本发明实施例提供的PE单元的卷积计算部分的第一类C结构示意图; 图4为本发明实施例提供的PE单元的卷积计算部分的第二类C结构示意图; 图5为本发明实施例提供的二值化乘累加计算转换为同或累加计算示意图; 图6为本发明实施例提供的一个3*3大小的卷积核的PE单元示意图。
下载此资料需消耗2积分,
分享到:
收藏