机器人听觉隐私信息监听处理方法-好方法网

技术摘要：
本发明公开了一种机器人听觉隐私信息监听处理方法，工作流程步骤如下：（1）获取听觉设备监听的语音数据S；（2）在机器人信息处理模块加载由基于卷积神经网络的听觉隐私信息分类算法获得的隐私特征模型W，（3）利用语音模块将语音数据S转化为文本数据T；（4）利用隐私全部
背景技术：
随着人口老龄化趋势加快，越来越多的独居老人需要被照顾，人们对助老机器人的需求也越来越明显。为辅助老年人日常生活，目前，薛同来等研究了基于激光SLAM的助老机器人，其拥有自主构建室内地图以及自主导航的功能，可以定位目标物体，并使用机械臂对物体进行抓取与移动。为解决老年人心理健康问题，刘策等构建了具有语音识别、手势识别、人脸识别和远程控制功能的多模式友好交互系统，实现了注册与验证、移动控制、新闻点播、日程提醒及语音对话5种功能。与此同时，为给老年人提供科学合理的饮食建议，苏志东等提出了基于服务机器人听觉的个体膳食构成自主感知算法，实现了对用户膳食构成的智能感知，为用户医疗诊断、饮食干预和机器人的主动服务等提供决策依据。为了应对老年人记忆力衰退的情况，Ahn Ho等提出了一种基于家庭服务机器人的大脑训练方法，将记忆训练部署到机器人上，以增强机器人功能性。为增强老年人的体质，降低老年人摔倒的风险， Foukarakis等提出了一种利用机器人视觉系统来识别和跟踪用户行为的方法，可以提供相关的练习和反馈来激励用户的训练。然而，智能家居系统和服务机器人广泛使用语音监听设备，这存在用户隐私泄露的风险，对语音数据的隐私识别和分类效果也不好。
技术实现要素：
本发明的目的在于克服上述缺点而提出了一种能判别语音数据的隐私类别、且具有很好的识别和分类效果的机器人听觉隐私信息监听处理方法。本发明的一种机器人听觉隐私信息监听处理方法，包括机器人的听觉设备、信息处理模块、语音模块，具体工作流程步骤如下： (1)获取机器人听觉设备监听的语音数据S； (2)在机器人信息处理模块加载隐私特征模型W，所述隐私特征模型W由基于卷积神经网络的听觉隐私信息分类算法获得； (3)利用语音模块将语音数据S转化为文本数据T； (4)利用隐私特征模型W对文本数据T进行鉴定，判断所监听的语音信息中是否具有所关注的隐私信息； (5)如果存在隐私信息，输出隐私类别，采用听觉隐私保护决策方法对隐私信息进行消除，转至步骤7； (6)如果不存在隐私信息，通过关键字匹配机制判断用户的行为意图，如果属于对机器人执行操作的指令范围，则调用执行模块；否则转至步骤7； (7)如果监听结束，则卸载隐私特征模型W；否则转步骤(1)循环监听；所述在步骤(2)中的基于卷积神经网络的听觉隐私信息分类算法： 4 CN 111597580 A 说　明　书 2/14 页输入：训练数据集I；输出：隐私特征模型M；步骤1.对训练数据集I进行数据预处理，生成批量训练数据集；步骤2.输入批量数据集，经过Embedding层，利用word2vec生成相同维度的字向量，使每条文本数据的尺寸为(600,64)；步骤3.经过卷积层，进行一维卷积，通过256个尺寸为(5，64)的卷积核，获得256个 (596，1)的一维特征向量；步骤4.经过最大池化层，得到256个最大特征向量值；步骤5.经过第一个全连接层，后面接Dropout及Relu激活函数，防止过拟合同时增加神经网络模型的非线性。步骤6.经过第二个全连接层，通过softmax函数计算出文本数据的预测概率分布及其相应的损失值；步骤7.执行误差反向传播操作，用Adam算法优化更新特征模型，满足设置条件后输出隐私特征模型。上述机器人听觉隐私信息监听处理方法，其中：所述基于卷积神经网络的听觉隐私信息分类算法的步骤1中，进行数据预处理时，在打开文本训练数据集时，把文本的格式编码成UTF-8格式，在处理文本时解码为Unicode格式，具体按以下步骤进行：1)读取训练数据集I，构建列表contents，列表中的每个元素即为一条文本数据中的字和符号；同时构建列表labels，列表中的每个元素即为对应文本数据的隐私类别；并构建字列表words，列表中的元素即为训练集中的字和符号；2)读取字列表words，由此构建{字：数字id}的字典D1； 3)读取分类目录，构建{隐私类别：数字id}的字典D2；4)根据字典D1，将列表contents中每个元素包含的字与符号进行编码，即为列表date_id；根据字典D2，将列表labels中的每个元素进行编码，即为label_id；5)经过padding把列表date_id中的每一个元素填充为固定长度600，同时对标签进行独热(one-hot)编码；6)生成批量训练数据集。上述机器人听觉隐私信息监听处理方法，其中：所述步骤(5)中的听觉隐私保护决策方法，首先对监听到的语音信息进行隐私信息判断时，若输出的数据类型为隐私数据类型，代表监听到的数据为隐私信息；然后对包含隐私信息的语句进行中文分析、词性分析和依存句法分析；最后采用决策模型，对隐私信息进行消除；所述隐私数据类型为六种类型： 1)第1类隐私数据：对话内容涉及家庭人员出行计划的场景，其对话内容中包含： a)未来出行计划的时间名词；b)未来出行计划的地理名词； 2)第2类隐私数据：对话内容涉及家庭人员联系方式的场景，其对话内容中包含： a)联系方式的相关表达；b)有关联系方式的数字； 3)第3类隐私数据：对话内容涉及支付密码的场景，其对话内容中包含：a)支付密码的相关表达；b)有关支付密码的数字和字母； 4)第4类隐私数据：对话内容涉及宗教的场景，其对话内容中包含：a)某人是某宗教成员；b)某人表达愿意加入某宗教；b)某人喜欢、尊崇、信仰某宗教； 5)第5类隐私数据：对话内容涉及贵重物存放处的场景，其对话内容中包含：a)贵重物品的名称；b)对应贵重物品的存放地点； 5 CN 111597580 A 说　明　书 3/14 页 6)第6类隐私数据：对话内容涉及言语批评朋友或者言语攻击双方父母的场景，其对话内容中包含批评或谩骂的朋友或父母的词汇。所述决策模型： (a)当输出的隐私数据类型为1类时，遍历整个语句，其中语句表示为sentence＝ {word1，word2，...，wordi，...，wordN}，包含N个经过中文分词获得的基础中文词汇语言单位而构成的集合，其中i大于等于1小于等于N且为正整数，N为单个隐私语句中语言单位的个数，wordi为语句经过分词后第i个词语，当词性POS(wordi)为代词r、人名nh、时间名词nt、地名ns、地理名词nl、方向名词nd或一般名词n时，利用正则表达式re.sub( )函数过滤掉 wordi即可； (b)当输出的隐私数据类型为2类时，遍历整个语句，当词性POS(wordi)为数字m 时，利用正则表达式re.sub( )函数过滤掉wordi即可； (c)当输出的隐私数据类型为3类时，考虑到决策模型的简易性，直接使用正则表达式re.sub('[a-zA-Z0-9'！"#$％&\'( )* ,-./:；<＝>？@，？★、…【】《》？“”‘'！[\\]^_`{|} ～\s] '，“”，语句)过滤掉语句中的数字、字母和特殊符号； (d)当输出的隐私数据类型为4类时，遍历整个语句，当词性POS(wordi)为一般名词n或组织名nz时，使用正则表达式中的re.sub( )函数过滤掉wordi即可； (e)当输出的隐私数据类型为5类时，遍历整个语句，当词性POS(wordi)为一般名词n或方向名词nd时，使用正则表达式中的re.sub( )函数过滤掉wordi即可； (f)当输出的隐私数据类型为6类时，遍历整个语句，当词性POS(wordi)的为一般名词n、形容词a、人名nh或成语i时，使用正则表达式中的re.sub( )函数过滤掉wordi即可。本发明与现有技术的相比，具有明显的有益效果，由以上方案可知，机器人监听用户日常的对话信息，产生大量的语音数据，通过调用科大讯飞的语音识别API接口将语音信息转化为文本，然后根据事先定义的隐私场景对文本内容进行理解。若存在隐私，则对隐私信息进行消除，如果不存在隐私信息，则根据关键字匹配机制对用户的意图进行分析。因此，本发明能针对用户语音数据的监听处理，在去除隐私的同时理解用户的指令需求并执行相应的动作。此外，基于卷积神经网络的听觉隐私信息分类算法，其卷积神经网络模型由1层 Embedding层作为输入层，1层卷积层，一个最大池化层与2层全连接层，1个softmax分类器组成。在卷积层中，使用256个尺寸为(5，64)的卷积核对输入数据进行卷积操作。最大池化层主要用来提取每张特征图中最具有说服力的局部最优特征，而两个全连接层的作用是对经过卷积的数据进行分析计算，最终通过softmax函数计算输入数据所属类别的概率，能有效的判定语音数据的隐私类别，具有很好的识别和分类效果。总之，本发明能针对机器人所监听到的语音数据，判定语音数据的隐私类别，并对识别的隐私信息进行消除操作，防止隐私数据泄露，对隐私数据的保护，同时使机器人能够在消除隐私信息的同时保证服务的有效性，提升机器人智能化水平。以下通过

相关推荐