logo好方法网

面向哑语体系的头部动作语义识别系统与方法


技术摘要:
本发明涉及了一种面向哑语体系的头部动作语义识别系统与方法。其系统由摄像头单元、处理器单元和显示单元组成;其方法的操作步骤由处理器单元检测识别头部动作语义流程体现。采用本发明,不仅可以识别哑语使用者的整体头部动作,更可以识别其眼睛、嘴部等五官的细节动  全部
背景技术:
视频语义识别一直是学术界和工业界所关注的研究热点,对于人机交互领域具有 重大价值。21世纪以来,视频语义识别技术已成为我国政府政策部署的着力点和关键点。活 动语义识别是视频语义识别的一个重要分支,其可在众多领域落地应用。面向哑语体系的 头部动作语义识别就是活动语义识别的一个重要应用领域,其可识别哑语使用者的头部动 作语义,丰富哑语识别体系。 现有的哑语识别体系较为同质且单一,大都仅通过检测、识别哑语使用者的手势, 从而判断其表达的哑语语义。但是在现实生活中,哑语使用者也会通过头部动作表达丰富 的语义,结合手势传递更为多样的综合语义。因此,在哑语体系中,识别头部动作语义就变 得尤为重要。然而,当前成熟的哑语识别体系并不具备检测、识别头部动作语义的功能,因 此实际应用中的效果不佳。 本发明提出了一种面向哑语体系的头部动作语义识别系统与方法。本发明的系统 背景:使用摄像头单元捕获哑语使用者的视频数据,利用处理器单元检测、识别其头部动作 语义,通过显示单元输出处理结果。采用本发明,不仅可以识别哑语使用者的整体头部动 作,更可以识别其眼睛、嘴部等五官的细节动作,实现更完备的语义识别。 由于哑语使用者的身体姿态较为固定,所处环境的光照变化较小,因此使用摄像 头单元捕获视频数据,并与处理器单元通信,如USB、RS-485、WiFi、蓝牙等方式,进而识别头 部动作语义,是完全可行的,实际应用环境具有普适性。
技术实现要素:
本发明的目的在于,针对目前哑语识别体系在实际应用中存在的局限性,提出一 种面向哑语体系的头部动作语义识别系统与方法。本发明其系统简洁直观,其方法表现优 异,且应用的哑语识别场景具有普适性。 为达上述目的,本发明采用下述技术方案: 一种面向哑语体系的头部动作语义识别系统与方法,不仅可以识别哑语使用者的 整体头部动作,更可以识别其眼睛、嘴部等五官的细节动作,实现更完备的语义识别。其系 统主要由摄像头单元、处理器单元和显示单元组成,其特征在于:所述摄像头单元以有线或 无线方式与处理器单元连接,摄像头单元数量n至少为1;所述处理器单元以有线或无线方 式与显示单元连接,显示单元数量m至少为1。 上述摄像头单元的数量n,根据系统规模的大小可变化,但至少为1。 上述处理器单元的结构:由数据接收模块、滤波降噪模块、头部动作检测模块、数 据裁剪模块、头部动作识别模块、五官动作识别模块、语义生成模块、数据发送模块组成。其 3 CN 111611868 A 说 明 书 2/4 页 中,数据接收模块以有线方式与滤波降噪模块连接、滤波降噪模块以有线方式与头部动作 检测模块连接、头部动作检测模块以有线方式与数据裁剪模块连接、数据裁剪模块以有线 方式与头部动作识别模块连接、数据裁剪模块以有线方式与五官动作识别模块连接、头部 动作识别模块以有线方式与语义生成模块连接、五官动作识别模块以有线方式与语义生成 模块连接、语义生成模块以有线方式与数据发送模块连接、头部动作检测模块以有线方式 与数据发送模块连接。 上述显示单元的数量m,根据系统规模的大小可变化,但至少为1。 上述面向哑语体系的头部动作语义识别系统,能够高效、精确地识别哑语使用者 的头部动作语义。 一种面向哑语体系的头部动作语义识别方法,采用上述系统进行操作,其特征在 于:头部动作语义识别流程由处理器单元检测识别头部动作语义流程体现。 上述处理器单元检测识别头部动作语义流程: 1)使用数据接收模块接收摄像头单元传来的视频数据,并向滤波降噪模块发送; 2)滤波降噪模块滤除视频数据中的噪声,提升数据的可靠性; 3)头部动作检测模块检测并判断视频中是否包含头部动作,如果没有,则直接通 过数据发送模块发送“未识别”结果至显示单元;如果有,则将视频发送至数据裁剪模块; 4)数据裁剪模块对数据进行预处理,挑选视频中的关键帧,提升系统的运行处理 速度; 5)头部动作识别模块识别视频中的整体头部动作,并进行分类;五官动作识别模 块识别视频中头部的五官细节动作,并进行分类; 6)语义生成模块将已分类的整体头部动作和五官细节动作转换为具有实际意义 的头部语义,并生成对应的语义描述; 7)数据发送模块将最终的语义描述结果发送至显示单元,实现头部动作语义识 别。 本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点: 本发明的系统由摄像头单元、处理器单元和显示单元组成;其方法包括处理器单 元检测识别头部动作语义流程。本发明不仅可以识别哑语使用者的整体头部动作,更可以 识别其眼睛、嘴部等五官的细节动作,实现更完备的语义识别。由于哑语使用者的身体姿态 较为固定,所处环境的光照变化较小,因此使用摄像头单元捕获视频数据,并与处理器单元 通信,如USB、RS-485、WiFi、蓝牙等方式,进而识别头部动作语义,是完全可行的,实际应用 环境具有普适性。 附图说明 图1是本发明实施例一的面向哑语体系的头部动作语义识别系统结构示意图。 图2是本发明实施例二的实现面向哑语体系的头部动作语义识别的处理器单元框 图。 图3是本发明实施例三的实现处理器单元检测识别头部动作语义的工作流程图。 4 CN 111611868 A 说 明 书 3/4 页
分享到:
收藏