用于使用神经网络进行对象辨识的系统和方法-好方法网

技术摘要：
用于使用人工神经网络提供对象辨识的系统和方法。该方法包括利用与通信网络上的边缘节点相关联的相机捕捉多个基准图像。基准图像被通信网络上的集中式服务器接收。利用集中式服务器的父神经网络分析基准图像以确定基准图像中由父神经网络识别的对象子集。从父神经网络全部
背景技术：
针对所捕捉图像和视频的对象分类或辨识正在成为各种智能系统日益重要的能力。现有技术中针对计算辅助对象辨识的图像和视频处理使用深度学习人工神经网络（ANN）来实施。特别地，卷积神经网络（CNN）已经表现出在计算机辅助的对象辨识应用中的巨大应用前景。根据对象辨识系统的当前现有技术，使用卷积层（即，CNN）构建的深度学习模型能够以近乎完美的准确性辨识出大约一千或更多的不同对象类别。尽管在准确执行上述技术的方面表现突出，但是要可行地实现这样的性能水平要求数量庞大的计算资源。出于该原因，在性能（在速度和准确性方面）不作出大幅妥协的情况下，就无法使得CNN和其它神经网络能够扩展至资源受限的计算设备。因此，本领域始终都需要一种能够使用较少计算资源准确地对对象分类的图像处理计算机系统。
技术实现要素：
本公开涉及一种发明性系统和方法，用于尤其是在通信网络中资源受限的边缘节点上经由使用经修剪神经网络的对象辨识而提升行人安全和/或执行监控。该经修剪神经网络由通信网络的集中式服务器所创建以便针对该服务器上边缘节点的每一个进行定制。该经修剪神经网络的创建包括识别父（parent）神经网络的对象（或类别）的主题并且选择对那些对象作出高度响应的滤波器。对象的子集通过分析在每个边缘节点处实际捕捉的基准图像而被确定，使得该经修剪神经网络专门针对每个特定边缘节点进行定制。此外，基准图像的分析由父神经网络来进行，所述父神经网络是未经修剪、经完全训练而且综合性的。最终，这使得能够根据该父神经网络的结果逐个滤波器地创建较小的神经网络。由于该父神经网络被用来针对基准图像中的对象提供图像辨识和使得能够滤波器选择，经修剪神经网络的准确性下降最小，但是在推演速度和计算要求下降方面增收益显著。通过针对每个边缘节点部署仅包括与每个具体边缘节点相关的对象子集的经修剪神经网络，能力弱或资源受限的计算设备（例如，消费者电子器件）可以利用最少资源快速地以非常高的准确性检测某些相关对象。总体上，在一个方面，提供了一种用于使用神经网络辨识对象的方法。该方法包括步骤：利用与通信网络上的边缘节点相关联的相机捕捉多个基准图像；利用该通信网络上的集中式服务器接收该基准图像；利用该集中式服务器的父神经网络分析该基准图像以确定该基准图像中由该父神经网络识别的对象子集；在该父神经网络中选择对该对象子集作出响应的一个或多个滤波器；根据该选择步骤所产生的一个或多个滤波器创建经修剪神经 4 CN 111587436 A 说　明　书 2/10 页网络；将该经修剪神经网络部署到该边缘节点；利用该边缘节点的相机捕捉实时图像；并且利用该经修剪神经网络识别该实时图像中的对象。根据一个实施例，该方法针对各自连接至该通信网络的多个边缘节点中的每一个被执行。根据一个实施例，第一边缘节点和第二边缘节点的相机被配置为观察共同的地理区域，该方法进一步包括将该对象子集划分为第一部分和第二部分，使得该第一边缘节点的经修剪神经网络根据对应于第一部分的那些滤波器创建，并且该第二边缘节点的经修剪神经网络根据对应于第二部分的那些滤波器创建。根据一个实施例，边缘节点的每一个包括连网照明系统的发光器。根据另外的实施例，该连网照明系统包括一个或多个灯柱、街灯或交通灯，并且其中该方法被用来提升行人安全。根据一个实施例，该父神经网络和经修剪神经网络是卷积神经网络（CNN）。根据一个实施例，该选择步骤包括利用该父神经网络分析多个已知训练图像（68）。根据一个实施例，选择一个或多个滤波器包括选择对已知训练图像展现出最大响应的滤波器。根据一个实施例，其中该多个基准图像由一个或多个视频所形成。根据一个实施例，该分析包括通过对每个对象类别被该父神经网络识别的次数进行计数而创建频率图（62），和根据频率图确定对象子集。总体上，在一个方面，提供了一种用于具有多个边缘节点的通信网络的对象辨识系统。该系统包括用于该通信网络的集中式服务器，该集中式服务器具有：父神经网络，其被配置为分析该集中式服务器从边缘节点中的每一个接收的基准图像以确定对应于边缘节点中的每一个的基准图像中的对象子集；和修剪应用，其被配置为选择该父神经网络中对于对象的每个子集作出响应的一个或多个滤波器，并且针对每个边缘节点根据对应于每个特定边缘节点的一个或多个滤波器创建经修剪神经网络。根据一个实施例，该边缘节点包括一个或多个发光器。根据一个实施例，该一个或多个发光器包括一个或多个灯柱、街灯或交通灯。根据一个实施例，该系统被实施以提升行人安全。根据一个实施例，该集中式服务器包括存储器和处理器，并且该父神经网络和该修剪应用被安装在该存储器中并且由该处理器执行。借助于“边缘节点”意指并非网络的集中式基础设施的一部分但是连接至该网络并且可能会或可能不会对网络的功能性有所辅助的设备。边缘节点的示例包括智能电话、膝上计算机、消费者电子器件或电器，诸如用于照明、恒温器、安保或其它电器的智能/连网管理系统，支持蜂窝或网络的汽车等，或者用于随它们一起使用的配件。如本文所使用的“人工神经网络”、“ANN”或简单地“神经网络”包括计算机系统，与以特定于任务的方式编程的软件应用相反，所述计算机系统包括根据给予神经网络学习能力（基于已知示例的输入逐步改善的性能）的任何已知或已发现范例的软件和/或硬件组件。ANN通常被布置为“神经元”的互连群组，其在总体上仿真人脑的部署形式和工作方式。 “神经元”被布置于各个分层中，所述分层包括根据输入至每个神经元的数据而作出不同响应的滤波器。ANN的训练可以通过将ANN输入已知示例来完成，这使得ANN能够调节不同神经元的权重从而更紧密地对应于已知示例。以这种方式，ANN能够通过基于作出响应的滤波器比较未知输入与哪些已知示例最为相似而准确地处理未知输入。卷积神经网络（CNN）是在随本文所公开实施例一起使用时表现出特定前景的一种 5 CN 111587436 A 说　明　书 3/10 页类型的ANN。CNN通常被构建为不同分层的叠层，其最终将输入（例如，图像）变换为输出（例如，CNN在图像中所识别的（多个）对象的类别）。卷积层是CNN的核心构造模块并且包括可学习滤波器的集合。在被呈现以图像时，这些滤波器中的不同滤波器将响应于图像中的不同模式而激活，所述模式进而对应于不同的对象。在这样的神经网络中所作出的决策的基础由被激活分层的响应——也就是哪些滤波器激活——所衡量。基于滤波器的响应，CNN的分类分层通常指派分数，所述分数对应于图像中的（多个）对象属于哪个（哪些）类别的概率可能性。Softmax函数是可以被CNN的分类层所使用的函数的一个示例，其中来自该函数的较大结果关联于图像中的（多个）对象已经被正确分类的增加的可能性。诸如CNN之类的一些ANN的一种有利属性在于它们学习与对象的所感知表示相关联的滤波器权重的能力，该信息可以被送至ANN中更高级的分层（更接近输出）以细化ANN对于该对象的理解。ANN学习对象的抽象表示形式的能力可以通过增加附加滤波器和分层而被进一步改善。然而，增加滤波器和分层导致计算复杂度有所提高以及相对应的性能（例如，分析图像所需的时间和/或识别/分类对象的准确性）下降。包括一个或多个指定处理器——诸如图形处理单元（GPU）——的强力机器通常被用来实施CNN所需的处理。基于边缘的计算系统的边缘节点是可能并不包括GPU和/或具有相对低的计算资源量的设备，并且因此无法可行地被用来提供综合CNN的处理需求。在本文所公开的各个实施例中，边缘节点包括具有在通信网络中连接在一起的多个发光设施或发光器的连网照明系统。术语“发光设施”或“发光器”在本文被用来指代特定外形尺寸、组装或封装的一个或多个发光单元的实施方式或布置。术语“发光单元”在本文被用来指代包括相同或不同类型的一个或多个光源的装置。给定发光单元可以具有针对（多个）光源、壳体/外壳布置和形状和/或电气和机械连接配置的各种安装布置中的任何一种。此外，给定发光单元可选地可以与涉及（多个）光源的操作的各种其它组件（例如，控制电路）相关联（例如，包括、与之耦合和/或与之封装在一起）。术语“光源”应当被理解为是指任意一个或多个的各种辐射源，包括但并不局限于基于LED的源（包括一个或多个如以上所定义的LED）、白炽源（例如，灯丝灯、卤素灯）、荧光源、磷光源、高强度放电源（例如，钠蒸气、水银蒸气和金属卤化物灯）、激光、其它类型的电致发光源、火致发光源（例如，火焰）、烛光发光源（例如，汽灯罩、碳弧辐射源）、光致发光源（例如，气体放电源）、使用电子饱和的阴极发光源、电流发光源、晶体发光源、显像管发光源、热发光源、摩擦发光源、声致发光源、辐射发光源和发光聚合体，但并不局限于此。如这里所使用的术语“网络”是指促进耦合至网络的任意两个或更多设备之间和/ 或多个设备之间的信息传输（例如，用于设备控制、数据存储、数据交换等）的两个或更多设备（包括控制器或处理器）的任意互连。如应当很容易意识到的是，适于将多个设备进行互连的网络的各种实施方式可以包括任意的各种网络拓扑并且采用任意的各种通信协议。此外，在根据本公开的各种网络中，两个设备之间的任意一个连接可以表示两个系统之间的专用连接，或者可替换地表示非专用连接。除了承载意在用于两个设备的信息之外，这样的非专用连接可以承载并非必然意在用于两个设备中的任一个的信息（例如，开放式网络连接）。此外，应当很容易意识到的是，如这里所讨论的各种设备网络可以采用一个或多个无线、有线/线缆和/或光纤链路来促进贯穿网络的信息传输。在各种实施方式中，处理器或控制器可以与一个或多个存储媒体（在这里一般被 6 CN 111587436 A 说　明　书 4/10 页称作“存储器”，例如易失性和非易失性计算机存储器，诸如RAM、PROM、EPROM和EEPROM、软盘、紧致盘、光盘、磁带等）相关联。在一些实施方式中，存储媒体可以利用一个或多个程序进行编码，当在一个或多个处理器和/或控制器上执行时，该程序实施这里所讨论的至少一些功能。各种存储媒体可以固定在处理器或控制器之内或者可以是可转移的，以使得其中所存储的一个或多个程序能够被加载到处理器或控制器中以便实施这里所讨论的本发明的各个方面。术语“程序”或“计算机程序”在这里以一般含义被用来指代能够被用来对一个或多个处理器或控制器进行编程的任意类型的计算机代码（例如，软件或微代码）。应当意识到的是，以上概念和以下更为详细地讨论的附加概念（假设这样的概念并不互相矛盾）的所有组合形式被构想为这里所公开的发明主题的一部分。特别地，在本公开结尾处出现的请求保护的主题的所有组合被构想为这里所公开的发明主题的一部分。还应当意识到的是，这里明确采用的、也可以出现在通过引用而结合的任意公开中所出现的术语应当赋予与这里所公开的特定概念最为一致的含义。附图说明在附图中，同样的附图标记通常贯穿不同视图而指代相同的部分。而且，附图并不必然依比例绘制，而是一般强调图示出本发明的原理。图1示意性图示了根据本文所公开的一个实施例的对象辨识系统。图2示意性图示了根据本文所公开的一个实施例的在示例场景中布置的对象辨识系统。图3是训练和操作诸如图1的系统的对象辨识系统的方法的流程图。图4是进一步描述根据本文所公开的一个实施例的用于创建经修剪神经网络的修剪例程的流程图。

相关推荐