logo好方法网

信息处理方法、装置及设备


技术摘要:
公开了一种信息处理方法、装置及设备。所述方法包括:获取原始卷积神经网络模型的拓扑信息,所述拓扑信息包括所述原始卷积神经网络模型的多个网络层的层信息以及所述多个网络层之间的连接信息;基于所述拓扑信息,从所述原始卷积神经网络模型中确定满足层融合条件的至  全部
背景技术:
在神经网络模型中,网络层(layer)是基本计算单元。通过网络层对神经网络模 型,尤其是卷积神经网络进行描述,在软件层面上易于模块化地实现代码。然而,在硬件层 面上,由于在执行各个网络层的操作时计算是分离的,较高的存储和访问次数限制了卷积 神经网络模型的执行速度。
技术实现要素:
本公开提供一种信息处理方案。 根据本公开的一方面,提供一种信息处理方法。所述方法包括:获取原始卷积神经 网络模型的拓扑信息,所述拓扑信息包括所述原始卷积神经网络模型的多个网络层的层信 息以及所述多个网络层之间的连接信息;基于所述拓扑信息,从所述原始卷积神经网络模 型中确定满足层融合条件的至少两个目标网络层;对所述至少两个目标网络层进行合并, 得到目标卷积神经网络模型。 结合本公开提供的任一实施方式,所述获取原始卷积神经网络模型的拓扑信息, 包括:获取所述原始卷积神经网络模型的描述信息;基于所述描述信息,构建表示所述原始 卷积神经网络的拓扑结构的第一拓扑图。 结合本公开提供的任一实施方式,所述层融合条件包括纵向融合条件和横向融合 条件中的至少一项;其中,所述纵向融合条件包括:连续的多个网络层中每个网络层具有单 个输入和单个输出;所述横向融合条件包括:多个网络层分支的输出指向同一个网络层。 结合本公开提供的任一实施方式,所述对所述至少两个目标网络层进行合并,得 到目标卷积神经网络模型,包括:根据所述至少两个目标网络层的类型以及所述至少两个 目标网络层之间的连接关系,对所述至少两个目标网络层进行合并,得到融合网络层;根据 所述融合网络层,得到目标卷积神经网络模型。 结合本公开提供的任一实施方式,所述对所述至少两个目标网络层进行合并,得 到融合网络层,包括:响应于所述至少两个目标网络层的输出指向同一个网络层且所述至 少两个目标网络层具有相同的输入和相同的卷积核参数,将所述至少两个目标网络层按照 通道进行合并,得到融合网络层。 结合本公开提供的任一实施方式,所述对所述至少两个目标网络层进行合并,得 到融合网络层,包括:将所述至少两个目标网络层的权重参数按照通道进行拼接,得到所述 融合网络层的权重参数,其中,所述融合网络层的输出按照与所述至少两个目标网络层对 应的通道被拆分成至少两个输出,所述至少两个输出分别存储在所述至少两个目标网络层 对应的输出存储位置。 结合本公开提供的任一实施方式,所述对所述至少两个目标网络层进行合并,得 5 CN 111553466 A 说 明 书 2/17 页 到融合网络层,包括:响应于所述至少两个目标网络层包括拼接层和输出端与所述拼接层 的输入端连接的至少两个第一网络层,将所述至少两个第一网络层中每个第一网络层与所 述拼接层合并,得到至少两个融合网络层。 结合本公开提供的任一实施方式,所述至少两个第一网络层中每个第一网络层的 输出作为对应的融合网络层的输出被存储在同一存储块中,并且每个融合网络层的输出具 有基于所述拼接层的拼接操作确定的存储地址偏移值。 结合本公开提供的任一实施方式,所述对所述至少两个目标网络层进行合并,得 到融合网络层,包括:响应于所述至少两个目标网络层包括按元素操作层以及与所述按元 素操作层的输入端连接的第二网络层,将所述第二网络层与所述按元素操作层进行合并, 得到融合网络层,其中,所述按元素操作层的输入端还与第三网络层的输出端连接。 结合本公开提供的任一实施方式,所述将所述第二网络层与所述按元素操作层进 行合并,得到融合网络层,包括:将所述按元素操作层的按元素操作融合到所述第二网络 层,得到融合网络层,其中,所述第三网络层的输出端与所述融合网络层的输入端连接。 结合本公开提供的任一实施方式,所述基于所述拓扑信息,从所述原始卷积神经 网络模型中确定满足层融合条件的至少两个目标网络层,包括:获得指示所述层融合条件 的融合模板,其中,所述融合模板包括横向融合模板和纵向融合模板中的至少一种;基于所 述拓扑信息,获得与所述融合模板匹配的至少两个第一目标网络层。 结合本公开提供的任一实施方式,所述对所述至少两个目标网络层进行合并,得 到目标卷积神经网络模型,包括:基于所述拓扑信息,确定所述原始卷积神经网络模型中满 足纵向层融合条件的至少两个第一目标网络层;对所述满足纵向层融合条件的至少两个第 一目标网络层进行合并,得到中间卷积神经网络模型;确定所述中间卷积神经网络模型中 满足横向融合条件的至少两个第二目标网络层;对所述至少两个第二网络层进行合并,得 到所述目标卷积神经网络模型。 结合本公开提供的任一实施方式,所述拓扑信息包括第一拓扑图;所述对所述至 少两个目标网络层进行合并,得到目标卷积神经网络模型,包括:基于所述至少两个目标网 络层,对所述第一拓扑图进行更新,得到用于表示所述目标卷积神经网络模型的第二拓扑 图。 结合本公开提供的任一实施方式,所述方法还包括:将所述目标卷积神经网络模 型进行编译处理,得到设备可执行代码。 根据本公开的一方面,提供一种信息处理方法。所述方法包括:接收设备可执行代 码,其中,所述设备可执行代码是通过本公开提供的任一实施方式所述的信息处理方法得 到的目标卷积神经网络模型进行编译处理得到的;基于所述设备可执行代码,对输入数据 进行处理,得到数据处理结果;将所述数据处理结果进行返回或者存储。 根据本公开的一方面,提供一种信息处理装置。所述装置包括:获取单元,用于获 取原始卷积神经网络模型的拓扑信息,所述拓扑信息包括所述原始卷积神经网络模型的多 个网络层的层信息以及所述多个网络层之间的连接信息;确定单元,用于基于所述拓扑信 息,从所述原始卷积神经网络模型中确定满足层融合条件的至少两个目标网络层;合并单 元,用于对所述至少两个目标网络层进行合并,得到目标卷积神经网络模型。 结合本公开提供的任一实施方式,所述获取单元具体用于:获取所述原始卷积神 6 CN 111553466 A 说 明 书 3/17 页 经网络模型的描述信息;基于所述描述信息,构建表示所述原始卷积神经网络的拓扑结构 的第一拓扑图。 结合本公开提供的任一实施方式,所述层融合条件包括纵向融合条件和横向融合 条件中的至少一项;其中,所述纵向融合条件包括:连续的多个网络层中每个网络层具有单 个输入和单个输出;所述横向融合条件包括:多个网络层分支的输出指向同一个网络层。 结合本公开提供的任一实施方式,所述合并单元具体用于:根据所述至少两个目 标网络层的类型以及所述至少两个目标网络层之间的连接关系,对所述至少两个目标网络 层进行合并,得到融合网络层;根据所述融合网络层,得到目标卷积神经网络模型。 结合本公开提供的任一实施方式,所述合并单元具体用于:响应于所述至少两个 目标网络层的输出指向同一个网络层且所述至少两个目标网络层具有相同的输入和相同 的卷积核参数,将所述至少两个目标网络层按照通道进行合并,得到融合网络层。 结合本公开提供的任一实施方式,所述合并单元具体用于:将所述至少两个目标 网络层的权重参数按照通道进行拼接,得到所述融合网络层的权重参数,其中,所述融合网 络层的输出按照与所述至少两个目标网络层对应的通道被拆分成至少两个输出,所述至少 两个输出分别存储在所述至少两个第一目标网络层对应的输出存储位置。 结合本公开提供的任一实施方式,所述合并单元具体用于:响应于所述至少两个 目标网络层包括拼接层和输出端与所述拼接层的输入端连接的至少两个第一网络层,将所 述至少两个第一网络层中每个第一网络层与所述拼接层合并,得到至少两个融合网络层。 结合本公开提供的任一实施方式,所述至少两个第一网络层中每个第一网络层的 输出作为对应的融合网络层的输出被存储在同一存储块中,并且每个融合网络层的输出具 有基于所述拼接层的拼接操作确定的存储地址偏移值。 结合本公开提供的任一实施方式,所述合并单元具体用于:响应于所述至少两个 目标网络层包括按元素操作层以及与所述按元素操作层的输入端连接的第二网络层,将所 述第二网络层与所述按元素操作层进行合并,得到融合网络层,其中,所述按元素操作层的 输入端还与第三网络层的输出端连接。 结合本公开提供的任一实施方式,所述合并单元在用于将所述第二网络层与所述 按元素操作层进行合并,得到融合网络层时,具体用于:将所述按元素操作层的按元素操作 融合到所述第二网络层,得到融合网络层,其中,所述第三网络层的输出端与所述融合网络 层的输入端连接。 结合本公开提供的任一实施方式,所述确定单元具体用于:获得指示所述层融合 条件的融合模板,其中,所述融合模板包括横向融合模板和纵向融合模板中的至少一种;基 于所述拓扑信息,获得与所述融合模板匹配的至少两个第一目标网络层。 结合本公开提供的任一实施方式,所述合并单元具体用于:基于所述拓扑信息,确 定所述原始卷积神经网络模型中满足纵向层融合条件的至少两个第一目标网络层;对所述 满足纵向层融合条件的至少两个第一目标网络层进行合并,得到中间卷积神经网络模型; 确定所述中间卷积神经网络模型中满足横向融合条件的至少两个第二目标网络层;对所述 至少两个第二网络层进行合并,得到所述目标卷积神经网络模型。 结合本公开提供的任一实施方式,所述拓扑信息包括第一拓扑图;所述合并单元 具体用于:基于所述至少两个目标网络层,对所述第一拓扑图进行更新,得到用于表示所述 7 CN 111553466 A 说 明 书 4/17 页 目标卷积神经网络模型的第二拓扑图。 结合本公开提供的任一实施方式,所述装置还包括执行单元,用于将所述目标卷 积神经网络模型进行编译处理,得到设备可执行代码。 根据本公开的一方面,提供一种信息处理装置。所述装置包括:接收单元,用于接 收设备可执行代码,其中,所述设备可执行代码是通过对本公开任一实施方式所述的信息 处理方法得到的目标卷积神经网络模型进行编译处理得到的;第一处理单元,用于基于所 述设备可执行代码,对输入数据进行处理,得到数据处理结果;第二处理单元,用于将所述 数据处理结果进行返回或者存储。 根据本公开的一方面,提供一种电子设备,包括存储器、处理器,所述存储器用于 存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时实现本公 开任一实施方式所述的信息处理方法。 根据本公开的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所 述程序被处理器执行时实现本公开任一实施方式所述的信息处理方法。 本公开任一实施方式所提出的信息处理方法、装置及设备,通过获取原始卷积神 经网络模型的拓扑信息,并基于所述拓扑信息确定满足融合条件的至少两个目标网络层, 通过对所述至少两个目标网络层进行合并,得到目标卷积神经网络模型,能够在未修改框 架底层实现的情况下,实现网络层之间的融合;利用本公开任一实施方式的信息处理方法 得到的目标卷积神经网络进行编译获得设备可执行代码,避免了大量增改代码,减少冗余 计算,基于所述设备可执行代码进行数据处理,提高了进行推理计算的速度。 附图说明 为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将 对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来 讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 图1为本公开至少一个实施例提供的一种信息处理方法的流程图; 图2A和图2B为本公开至少一个实施例提供的纵向层间融合过程的示意图; 图3A和图3B为本公开至少一个实施例提供的横向层间融合过程的示意图; 图4为本公开至少一个实施例提供的信息处理方法中数据存储的示意图; 图5A和图5B为本公开至少一个实施例提供的拼接层融合过程的示意图; 图6A和图6B为本公开至少一个实施例提供的按元素操作层融合过程的示意图; 图7为本公开至少一个实施例提供的另一种信息处理方法的流程图; 图8为本公开至少一个实施例提供的一种信息处理装置的结构示意图; 图9为本公开至少一个实施例提供的另一种信息处理装置的结构示意图; 图10为本公开至少一个实施例提供的一种电子设备的结构图。
下载此资料需消耗2积分,
分享到:
收藏