技术摘要:
本公开的实施例公开了用于生成网络模型信息的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对预先训练的初始超网络进行以下剪枝步骤:根据该初始超网络对应的帕累托曲线,确定该初始超网络各层的算子概率分布;基于该算子概率分布,对该初始超 全部
背景技术:
包括:对预先训练的初 始超网络进行以下剪枝步骤:根据该初始超网络 对应的帕累托曲线,确定该初始超网络各层的算 子概率分布;基于该算子概率分布,对该初始超 网络的各层的算子进行剪枝,得到子超网络;对 该子超网络进行训练;响应于剪枝次数小于该预 先设定的数目,将训练结束后的该子超网络作为 新的初始超网络,继续执行该剪枝步骤。该实施 方式通过对超网络进行剪枝,减轻了超网络中的 权重耦合,对后续确定特定时延的高准确度的网 络模型提供了方便。 CN 111582456 A CN 111582456 A 权 利 要 求 书 1/2 页 1.一种用于生成网络模型信息的方法,包括: 对预先训练的初始超网络进行以下剪枝步骤: 根据所述初始超网络对应的帕累托曲线,确定所述初始超网络各层的算子概率分布; 基于所述算子概率分布,对所述初始超网络的各层的算子进行剪枝,得到子超网络; 对所述子超网络进行训练; 响应于剪枝次数小于所述预先设定的数目,将训练结束后的所述子超网络作为新的初 始超网络,继续执行所述剪枝步骤。 2.根据权利要求1所述的方法,其中,所述方法还包括: 基于所述剪枝后的超网络和演化算法,确定与目标时延相对应的网络模型; 对所确定的网络模型进行训练,得到训练结束后的网络模型。 3.根据权利要求2所述的方法,其中,所述方法还包括: 响应于所述训练结束后的网络模型包括目标检测网络,利用所述训练结束后的网络模 型进行人脸识别。 4.根据权利要求1所述的方法,其中,所述对预先训练的初始超网络进行以下剪枝步骤 还包括: 响应于剪枝次数等于预先设定的数目,将训练结束后的所述子超网络确定为剪枝后的 超网络。 5.根据权利要求1所述的方法,其中,所述根据所述初始超网络对应的帕累托曲线,确 定所述初始超网络各层的算子概率分布,包括: 对所述初始超网络进行多次采样,得到第一网络模型集合; 基于所述第一网络模型集合和演化算法,生成第二网络模型集合,其中,所述演化算法 的演化过程中加入时延约束以使所述第二网络模型集合中的网络模型的时延满足预先设 定的范围; 基于所述第二网络模型集合中各个网络模型的时延和准确度,确定帕累托曲线; 基于所述帕累托曲线,确定所述初始超网络各层的算子概率分布。 6.根据权利要求5所述的方法,其中,所述基于所述帕累托曲线,确定所述初始超网络 各层的算子概率分布,包括: 抽取所述帕累托曲线上预定数目个点; 基于所述预定数目个点,确定相应的第三网络模型集合; 基于所述第三网络模型集合,确定所述初始超网络各层的算子概率分布。 7.根据权利要求5所述的方法,其中,所述网络模型的时延通过查询时延预测表得到。 8.根据权利要求5所述的方法,其中,所述基于所述第一网络模型集合和演化算法,生 成第二网络模型集合,包括: 对所述第一网络模型集合进行编码,以及将所述编码后的结果确定为演化算法的初始 父代种群; 基于对所述初始父代种群进行演化,生成子代种群; 将所述子代种群确定为第二网络模型集合。 9.根据权利要求8所述的方法,其中,所述基于对所述初始父代种群进行演化,生成子 代种群,包括: 2 CN 111582456 A 权 利 要 求 书 2/2 页 对所述初始父代种群执行以下演化步骤: 对所述初始父代种群选取时延符合预设条件的网络,得到选取结果; 基于所述预先训练的超网络的权重,确定选取结果中各个子网络的权重; 基于所述权重,确定所述选取结果中各个网络的准确度; 基于所述准确度,对所述选取结果进行排序,得到网络序列; 对排序结果进行演化,得到初始子代种群; 响应于演化次数等于预先设定的数目,生成子代种群; 响应于演化次数小于预先设定的数目,将初始子代种群和所述排序结果作为新的初始 父代种群,继续执行所述演化步骤。 10.一种用于生成网络模型信息的装置,包括: 剪枝单元,被配置成对预先训练的初始超网络进行以下剪枝步骤: 根据所述初始超网络对应的帕累托曲线,确定所述初始超网络各层的算子概率分布; 基于所述算子概率分布,对所述初始超网络的各层的算子进行剪枝,得到子超网络; 对所述子超网络进行训练; 执行单元,被配置成响应于剪枝次数小于所述预先设定的数目,将所述子超网络作为 新的初始超网络,继续执行所述剪枝步骤。 11.一种电子设备,包括: 一个或多个处理器; 存储装置,用于存储一个或多个程序; 当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器 实现如权利要求1-9中任一所述的方法。 12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其中,所述程序被处理 器执行时实现如权利要求1-9中任一所述的方法。 3 CN 111582456 A 说 明 书 1/12 页 用于生成网络模型信息的方法、装置、设备和介质 技术领域 本公开的实施例涉及计算机技术领域,具体涉及用于生成网络模型信息的方法、 装置、设备和计算机可读介质。
技术实现要素:
目前,在神经网络搜索过程中,超网络的某些层对于某些算子很少选择,原因在于 包括这些多余算子的网络违背了时延限制,或者在验证数据集的效果很差。因此,需求一种 对超网络进行剪枝的方法来去除上述超网络中每层的多余算子。