logo好方法网

一种命令词定制识别方法及系统


技术摘要:
本发明提供了一种命令词定制识别方法及系统,其中,方法包括:步骤1:接收输入的项目需求,基于项目需求解析项目命令词表,生成项目数据采集任务;步骤2:通过在线任务平台发布训练数据采集任务;步骤3:基于测试数据采集任务,通过录音设备在预设场景中采集测试数据;  全部
背景技术:
目前,离线命令词检测系统,通常是为了解决固定有限命令词的语音识别问题。命 令词检测系统通用模型由于用户年龄、口音等问题,通常很难达到很好的性能。针对用户年 龄、口音等问题,对于不同项目,需要采用模型定制方法。 而传统的模型定制不仅需要采集大量的真实场景的语音和标注,而且模型定制发 布过程需要大量人工参与,进行参数调优,不仅导致项目周期长,并且消耗的人力成本、物 力成本都大大增加。
技术实现要素:
本发明提供一种命令词定制识别方法,通过在线任务平台采集训练数据(语音), 进行数据模拟的方法,大大降低了数据采集的成本和周期,并且保障了命令词识别的性能。 本发明实施例提供一种命令词定制识别方法,包括: 步骤1:接收输入的项目需求,基于项目需求解析项目命令词表,生成项目数据采 集任务;项目数据采集任务包括训练数据采集任务和测试数据采集任务; 步骤2:通过在线任务平台发布训练数据采集任务,并通过在线任务平台接收基于 训练数据采集任务上传的训练数据; 步骤3:基于测试数据采集任务,通过录音设备在预设场景中采集测试数据; 步骤4:基于自动化模型训练平台,根据项目命令词表、训练数据和测试数据生成 命令词语音识别模型; 步骤5:将命令词语音识别模型加入版本管理工具中,通过Jenkins构建引擎。 优选的,根据项目命令词表、训练数据和测试数据生成命令词语音识别模型,具体 包括: 根据预设的第一规则将训练数据配置为多个训练组; 将测试数据配置为测试组; 采用数据增强的方法对训练组进行数据模拟和扩充; 依次采用数据增强后的多个训练组的其中一个,通过调节参数配置对深度神经网 络模型进行训练,获得多个初始模型;训练组与初始模型一一对应; 采用测试组对各个初始模型进行模型评估并生成评估报告,评估报告包括初始模 型的参考识别率; 从多个初始模型模型中选择参考识别率最高的模型作为命令词语音识别模型; 输出命令词语音识别模型和发布评估报告。 优选的,数据增强的方法包括载入噪声、增加混响、提高或降低语速中一种或多种 结合。 4 CN 111599350 A 说 明 书 2/5 页 优选的,预设场景包括:商场、电影院、停车场、学校和菜场中其中一种或多种结 合。 优选的,训练数据包括无背景噪声的近讲安静语音。 本发明还提供一种命令词定制识别系统,包括: 任务生成模块,用于接收输入的项目需求,基于项目需求解析项目命令词表,生成 项目数据采集任务;项目数据采集任务包括训练数据采集任务和测试数据采集任务; 训练数据采集模块,用于通过在线任务平台发布训练数据采集任务,并通过在线 任务平台接收基于训练数据采集任务上传的训练数据; 测试数据采集模块,用于基于测试数据采集任务,通过录音设备在预设场景中采 集测试数据; 模型生成模块,用于基于自动化模型训练平台,根据项目命令词表、训练数据和测 试数据生成命令词语音识别模型; 引擎生成模块,用于将命令词语音识别模型加入版本管理工具中,通过Jenkins构 建引擎。 优选的,模型生成模块具体操作包括: 根据预设的第一规则将训练数据配置为多个训练组; 将测试数据配置为测试组; 采用数据增强的方法对训练组进行数据模拟和扩充; 依次采用数据增强后的多个训练组的其中一个,通过调节参数配置对深度神经网 络模型进行训练,获得多个初始模型;训练组与初始模型一一对应; 采用测试组依次对各个初始模型进行模型评估并生成评估报告,评估报告包括初 始模型的参考识别率; 从多个初始模型模型中选择参考识别率最高的模型作为命令词语音识别模型; 输出命令词语音识别模型和发布评估报告。 优选的,数据增强的方法包括载入噪声、增加混响、提高或降低语速中一种或多种 结合。 优选的,预设场景包括:商场、电影院、停车场、学校和菜场中其中一种或多种结 合。 优选的,训练数据包括无背景噪声的近讲安静语音。 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 附图说明 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实 施例一起用于解释本发明,并不构成对本发明的限制。在附图中: 图1为本发明实施例中一种命令词定制识别方法的示意图。 5 CN 111599350 A 说 明 书 3/5 页
下载此资料需消耗2积分,
分享到:
收藏