logo好方法网

用于确定模型结构的方法和装置


技术摘要:
本申请公开了用于确定模型结构的方法和装置,涉及计算机视觉技术领域。具体实施方式包括:获取训练相关脚本,该训练相关脚本包括用于训练模型的脚本;确定包含多个候选模型结构的搜索空间;将该训练相关脚本确定为第一组件,并调用该第一组件,在该搜索空间中搜索一个  全部
背景技术:
包括:获取训练相关脚本,该训练相关脚本包括 用于训练模型的脚本;确定包含多个候选模型结 构的搜索空间;将该训练相关脚本确定为第一组 件,并调用该第一组件,在该搜索空间中搜索一 个候选模型结构作为目标模型结构。本申请可以 对训练相关脚本进行组件化,从而在不修改训练 相关脚本的情况下,实现自动化搜索模型结构, 避免了在训练相关脚本中硬编码搜索脚本带来 的高耦合度,同时提高了搜索模型结构的灵活 性。 CN 111582478 A CN 111582478 A 权 利 要 求 书 1/2 页 1.一种用于确定模型结构的方法,所述方法包括: 获取训练相关脚本,所述训练相关脚本包括用于训练模型的脚本; 确定包含多个候选模型结构的搜索空间; 将所述训练相关脚本确定为第一组件,并调用所述第一组件,在所述搜索空间中搜索 一个候选模型结构作为目标模型结构。 2.根据权利要求1所述的方法,其中,所述确定包含多个候选模型结构的搜索空间,包 括: 将目标网络的各种结构作为多个候选模型结构,确定包括所述多个候选模型结构的搜 索空间,其中,所述目标网络包括主干网络和/或定位网络,所述定位网络为检测网络或分 割网络。 3.根据权利要求2所述的方法,其中,所述目标网络通过以下步骤得到: 在多种候选网络中,确定耗时符合目标耗时的候选网络作为目标网络。 4.根据权利要求1所述的方法,其中,所述方法还包括: 获取预设配置信息,并将所述预设配置信息作为第二组件,其中,所述预设配置信息指 示是否调用组件搜索模型结构;以及 所述确定包含多个候选模型结构的搜索空间,包括: 响应于调用所述第二组件,确定所获取的预设配置信息指示调用组件搜索模型结构, 确定包含多个候选模型结构的搜索空间。 5.根据权利要求1所述的方法,其中,所述方法还包括: 判断所述训练相关脚本中是否还包括所述第一组件的调用接口; 若所述训练相关脚本中不包括所述调用接口,则输出提示信息;以及 所述确定包含多个候选模型结构的搜索空间,包括: 若所述训练相关脚本中包括所述调用接口,则确定包含多个候选模型结构的搜索空 间。 6.根据权利要求1所述的方法,其中,所述在所述搜索空间中搜索一个候选模型结构作 为目标模型结构,包括: 获取自动搜索算法,以及采用所述自动搜索算法,在所述搜索空间中搜索一个候选模 型结构作为目标模型结构,其中,所述搜索在指定数量的电子设备上以分布式的方式进行。 7.一种用于确定模型结构的装置,所述装置包括: 第一获取单元,被配置成获取训练相关脚本,所述训练相关脚本包括用于训练模型的 脚本; 确定单元,被配置成确定包含多个候选模型结构的搜索空间; 调用单元,被配置成将所述训练相关脚本确定为第一组件,并调用所述第一组件,在所 述搜索空间中搜索一个候选模型结构作为目标模型结构。 8.根据权利要求7所述的装置,其中,确定单元,进一步被配置成按照如下方式执行所 述确定包含多个候选模型结构的搜索空间: 将目标网络的各种结构作为多个候选模型结构,确定包括所述多个候选模型结构的搜 索空间,其中,所述目标网络包括主干网络和/或定位网络,所述定位网络为检测网络或分 割网络。 2 CN 111582478 A 权 利 要 求 书 2/2 页 9.根据权利要求8所述的装置,其中,所述目标网络通过以下步骤得到: 在多种候选网络中,确定耗时符合目标耗时的候选网络作为目标网络。 10.根据权利要求7所述的装置,其中,所述装置还包括: 第二获取单元,被配置成获取预设配置信息,并将所述预设配置信息作为第二组件,其 中,所述预设配置信息指示是否调用组件搜索模型结构;以及 确定单元,进一步被配置成按照如下方式执行所述确定包含多个候选模型结构的搜索 空间: 响应于调用所述第二组件,确定所获取的预设配置信息指示调用组件搜索模型结构, 确定包含多个候选模型结构的搜索空间。 11.根据权利要求7所述的装置,其中,所述装置还包括: 判断单元,被配置成判断所述训练相关脚本中是否还包括所述第一组件的调用接口; 输出单元,被配置成若所述训练相关脚本中不包括所述调用接口,则输出提示信息;以 及 确定单元,进一步被配置成按照如下方式执行所述确定包含多个候选模型结构的搜索 空间: 若所述训练相关脚本中包括所述调用接口,则确定包含多个候选模型结构的搜索空 间。 12.根据权利要求7所述的装置,其中,所述调用单元,进一步被配置成按照如下方式执 行所述在所述搜索空间中搜索一个候选模型结构作为目标模型结构: 获取自动搜索算法,以及采用所述自动搜索算法,在所述搜索空间中搜索一个候选模 型结构作为目标模型结构,其中,所述搜索在指定数量的电子设备上以分布式的方式进行。 13.一种电子设备,包括: 一个或多个处理器; 存储装置,用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实 现如权利要求1-6中任一所述的方法。 14.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时 实现如权利要求1-6中任一所述的方法。 3 CN 111582478 A 说 明 书 1/9 页 用于确定模型结构的方法和装置 技术领域 本申请实施例涉及计算机技术领域,具体涉及计算机视觉技术领域,尤其涉及用 于确定模型结构的方法和装置。
技术实现要素:
深度学习技术在很多方向上都取得了巨大的成功,在深度学习技术中,神经网络 结构的好坏对模型的效果有非常重要的影响。手工设计神经网络的拓扑结构需要非常丰富 的经验和诸多尝试。 神经网络架构搜索技术(Neural  Architecture  Search,NAS)逐渐成为研究热点。 这种可以进行模型结构搜索的技术非常重要,通过NAS既可以在模型速度不下降的情况下 提升模型的精度,也可以在模型精度不下降的情况下提升模型的速度。
下载此资料需消耗2积分,
分享到:
收藏