
技术摘要:
本发明涉及一种基于自动化轻量级神经网络的数据处理方法及装置,包括:获取待处理数据;将所述待处理数据输入至预先建立的自动化轻量级神经网络,获取所述预先建立的自动化轻量级神经网络输出的待处理数据的处理结果;本发明提供的技术方案中的自动化轻量级神经网络具 全部
背景技术:
大型深度神经网络的构建通常需要很强的专家知识,一般会耗费研究人员大量的 时间和精力,尤其在遥感图像处理领域。同时这些人工设计的网络通常计算复杂度高、内存 开销大,也给在边缘计算设备上的部署提出了极大的挑战。神经结构搜索(Neural Architecture Search,NAS),是一种专门针对深度神经网络的自动化设计方法,该方法可 以有效降低人工参与程度,在机器视角下对深度神经网络进行自动化搭建。 目前的NAS研究主要使用强化学习(Reinforcement Learning,RL)作为优化算法, 对搜索空间(search space)中神经网络结构的优劣进行选择。基于强化学习的NAS通常以 一个长短期记忆网络(Long Short Term Memory,LSTM)作为控制器(Controller),控制器 将搜索空间中的各个结构进行组合,将组合完毕后的模型的性能作为奖励(Reward),反馈 给控制器。由于该过程不连续,所以一般通过策略梯度(Policy Gradient)对这个过程进行 优化,PG算法收敛后,最终的神经网络模型结构便可被控制器导出,之后再对该网络进行微 调。 然而,基于RL的NAS导出的网络拓扑连接形式相对较为单一,并且模型的计算复杂 度较高,不适合大尺寸、多尺度的遥感图像。同时,RL的优化代价也十分巨大,通常该做法需 要在数百计算机图形处理单元(GPU)上并行运算四周左右的时间,而且搜索过程也存在着 不稳定等问题。
技术实现要素:
针对现有技术的不足,本发明的目的是提供一种适用于尺度变化较大的物体或场 景的识别、检测和分割的处理方法。 本发明的目的是采用下述技术方案实现的: 一种基于自动化轻量级神经网络的数据处理方法,其改进之处在于,所述方法包 括: 获取待处理数据; 将所述待处理数据输入至预先建立的自动化轻量级神经网络,获取所述预先建立 的自动化轻量级神经网络输出的待处理数据的处理结果。 优选的,所述待处理数据为遥感数据。 优选的,所述处理结果包括:数据识别结果、数据检测结果和数据分割结果。 优选的,所述预先建立的自动化轻量级神经网络的建立过程包括: 步骤1.获取待处理数据对应的训练集数据和验证集数据; 步骤2.设定所述预先建立的自动化轻量级神经网络的Block数目M,并对Block进 4 CN 111582475 A 说 明 书 2/7 页 行编号,其中,第1个Block为茎干层; 步骤3.将第2至第M个Block中各Block的神经元数目设置为N,并对第2至第M个 Block中各Block中的神经元从1至N进行编号; 步骤4.选取第2至第M个Block中各Block所依赖的随机图; 步骤5.基于第2至第M个Block所依赖的随机图生成第2至第M个Block中各Block的 神经元之间的拓扑关系,其中,第2至第M个Block中各Block的神经元之间满足由序号较小 神经元指向序号较大神经元的条件; 步骤6.设置第2至第M个Block中各Block的神经元的搜索空间; 步骤7.将第1至第M个Block按照编号从小到大进行堆叠,将第2至第M-1个Block之 后均插入一个池化层,并在第M个Block之后引入处理方法对应的头网络,最终组成自动化 轻量级神经网络初始模型; 步骤8.将所述训练数据以minibatch的形式送入到所述自动化轻量级神经网络初 始模型中,通过有监督方式进行学习; 步骤9.设置验证总次数,每经过T次训练后,利用所述验证数据验证训练后的自动 化轻量级神经网络初始模型的性能指标,选择性能指标最大的自动化轻量级神经网络初始 模型作为所述预先建立的自动化轻量级神经网络。 进一步的,所述步骤4包括: 所述第2至第M个Block中每个Block均在BA随机图、ER随机图和WS随机图中随机选 取一个随机图作为其自身所依赖的随机图,其中,所述BA随机图、ER随机图和WS随机图被选 取的概率均相同。 进一步的,所述步骤6包括: 所述第2至第M个Block中每个Block中的神经元均在{3×3DWConv,5×5DWConv,7 ×7DWConv,9×9DWConv}选择属于其自身的映射函数,其中,采样3×3DWConv、5×5DWConv、 7×7DWConv和9×9DWConv的概率均相同,DWConv为深度可分离卷积。 进一步的,当所述处理方法为数据识别方法时,所述自动化轻量级神经网络初始 模型的性能指标为OA性能指标,当所述处理方法为数据检测方法时,所述自动化轻量级神 经网络初始模型的性能指标为mAP性能指标,当所述处理方法为数据分割方法时,所述自动 化轻量级神经网络初始模型的性能指标为mF1性能指标。 基于同一发明构思,本发明还提供了一种基于自动化轻量级神经网络的数据处理 装置,其改进之处在于,所述装置包括: 获取模块,用于获取待处理数据; 处理模块,用于将所述待处理数据输入至预先建立的自动化轻量级神经网络,获 取所述预先建立的自动化轻量级神经网络输出的待处理数据的处理结果。 与最接近的现有技术相比,本发明具有的有益效果: 本发明提供的技术方案,首先获取待处理数据,进而将所述待处理数据输入至预 先建立的自动化轻量级神经网络,获取所述预先建立的自动化轻量级神经网络输出的待处 理数据的处理结果,能够适用于尺度变化较大的物体或场景的识别、检测和分割; 进一步的,本发明的自动化轻量级神经网络基于随机图方法搜索Block的拓扑关 系,有助于提升自动化搜索到的模型的多样性,丰富Block内部的连接形式,而Block内的节 5 CN 111582475 A 说 明 书 3/7 页 点数目可以调节,更使得模型在边缘计算设备上进行部署时,具有一定的可控性,并且在深 度可分离卷积构成的搜索空间,对每个神经元的映射函数进行采样,不仅可以令模型更加 轻量化,而且多种尺寸的卷积核搭配使用也让神经网络的感受野更加灵活,有利于对遥感 图像中尺度变化较大的物体或场景的识别,同时对带有拓扑和映射的Block进行堆叠,能够 加深模型的深度,提升模型最终的性能。 附图说明 图1是本发明一种基于自动化轻量级神经网络的数据处理方法流程图; 图2是本发明实施例中自动化轻量级神经网络设计流程示意图; 图3是本发明实施例中BA随机图模型拓扑连接关系示意图; 图4是本发明实施例中ER随机图模型拓扑连接关系示意图; 图5是本发明实施例中WS随机图模型拓扑连接关系示意图; 图6是本发明实施例中深度可分离卷积的运算过程示意图; 图7是本发明一种基于自动化轻量级神经网络的数据处理装置结构示意图;