logo好方法网

语言翻译模型的训练方法及装置


技术摘要:
本发明是关于语言翻译模型的训练方法及装置。该方法包括:步骤A1,获取互为双语语料的源语料S1和目标语料T1,并根据源语料S1和目标语料T1构建二分类翻译网络M1,其中,二分类翻译网络M1具备判断任意源语句和目标语句是否互为翻译的能力;步骤A2,利用源语料P1,对初始  全部
背景技术:
目前,在翻译任务上,现有的主流的数据增强算法多半通过引入噪声(单词插入、 删除、重排序等)的方法来扩充语料或者通过Back-Translation的方法来利用大量目标单 语生成平行伪双语来扩充语料,得到双语数据后来进行语言翻译模型的训练,但无论采用 哪种方式获得的语料数据进行语言翻译模型的训练,训练后的语言翻译模型的翻译精度和 质量都不够高。
技术实现要素:
本发明实施例提供了语言翻译模型的训练方法及装置。所述技术方案如下: 根据本发明实施例的第一方面,提供一种语言翻译模型的训练方法,包括: 步骤A1,获取互为双语语料的源语料S1和目标语料T1,并根据所述源语料S1和目 标语料T1构建二分类翻译网络M1,其中,所述二分类翻译网络M1具备判断任意源语句和目 标语句是否互为翻译的能力; 步骤A2,利用源语料P1,对初始源语言训练模型进行训练,获得目标源语言训练模 型M2; 步骤A3,根据所述二分类翻译网络M1、所述目标源语言训练模型M2和所述源语料 S1,获得源语料S3和所述源语料S3对应的目标语料T2; 步骤A4,根据所述源语料S1、目标语料T1、所述源语料S3和所述目标语料T2,获得 所述语言翻译模型。 在一个实施例中,所述步骤A3包括: 根据所述目标源语言训练模型M2对所述源语料S1进行扩充,获得候选源语料的 S2; 使用所述二分类翻译网络M1对所述候选源语料S2和所述目标语料T1进行筛选,获 得源语料S3和所述目标语料T2。 在一个实施例中,所述使用所述二分类翻译网络M1对所述候选源语料S2和所述目 标语料T1进行筛选,获得源语料S3和所述目标语料T2,包括: 获取预先设置的互为翻译语料的语料概率阈值; 将所述候选源语料S2和所述目标语料T1输入至所述二分类翻译网络M1中,以利用 所述二分类翻译网络M1和所述语料概率阈值,筛选出所述源语料S3和所述目标语料T2。 在一个实施例中,所述方法还包括: 将所述源语料S3和所述源语料S3对应的目标语料T2分别重新作为所述目标语料 T1和所述源语料S1,并执行步骤A2和步骤A3,从而得到目标语料T3和所述目标语料T3对应 的源语料S4; 4 CN 111597824 A 说 明 书 2/6 页 所述步骤A4包括: 根据所述源语料S1、目标语料T1、所述源语料S3、所述目标语料T2、所述目标语料 T3和所述源语料S4,获得所述语言翻译模型。 在一个实施例中,所述方法还包括: 获取预设数目的目标单语; 利用所述语言翻译模型翻译出所述目标单语对应的源语料P2; 根据所述源语料P2和所述目标单语,对所述语言翻译模型重新进行训练。 根据本发明实施例的第二方面,提供一种语言翻译模型的训练装置,包括: 第一处理模块,用于获取互为双语语料的源语料S1和目标语料T1,并根据所述源 语料S1和目标语料T1构建二分类翻译网络M1,其中,所述二分类翻译网络M1具备判断任意 源语句和目标语句是否互为翻译的能力; 训练模块,用于利用源语料P1,对初始源语言训练模型进行训练,获得目标源语言 训练模型M2; 第一获取模块,用于根据所述二分类翻译网络M1、所述目标源语言训练模型M2和 所述源语料S1,获得源语料S3和所述源语料S3对应的目标语料T2; 第二获取模块,用于根据所述源语料S1、目标语料T1、所述源语料S3和所述目标语 料T2,获得所述语言翻译模型。 在一个实施例中,所述第一获取模块包括: 扩充子模块,用于根据所述目标源语言训练模型M2对所述源语料S1进行扩充,获 得候选源语料的S2; 筛选子模块,用于使用所述二分类翻译网络M1对所述候选源语料S2和所述目标语 料T1进行筛选,获得源语料S3和所述目标语料T2。 在一个实施例中,所述筛选子模块具体用于: 获取预先设置的互为翻译语料的语料概率阈值; 将所述候选源语料S2和所述目标语料T1输入至所述二分类翻译网络M1中,以利用 所述二分类翻译网络M1和所述语料概率阈值,筛选出所述源语料S3和所述目标语料T2。 在一个实施例中,所述装置还包括: 第二处理模块,用于将所述源语料S3和所述源语料S3对应的目标语料T2分别重新 作为所述目标语料T1和所述源语料S1,并执行所述训练模块和所述第一获取模块的步骤, 从而得到目标语料T3和所述目标语料T3对应的源语料S4; 所述第二获取模块包括: 获取子模块,用于根据所述源语料S1、目标语料T1、所述源语料S3、所述目标语料 T2、所述目标语料T3和所述源语料S4,获得所述语言翻译模型。 在一个实施例中,所述装置还包括: 第三获取模块,用于获取预设数目的目标单语; 翻译模块,用于利用所述语言翻译模型翻译出所述目标单语对应的源语料P2; 训练模块,用于根据所述源语料P2和所述目标单语,对所述语言翻译模型重新进 行训练。 本发明的实施例提供的技术方案可以包括以下有益效果: 5 CN 111597824 A 说 明 书 3/6 页 通过低资源(即少量资源和/或简单)的源语料S1和目标语料T1,可构建出初始的 二分类翻译网络M1,然后利用源语料P1可对初始源语言训练模型,从而获得准确度较高的 目标源语言训练模型M2,进而利用二分类翻译网络M1、所述目标源语言训练模型M2可对源 语料S1进行扩充,从而得到资源丰富的互为双译的源语料S3和所述源语料S3对应的目标语 料T2,进而利用丰富的语料(即上述源语料S1、目标语料T1、所述源语料S3和所述目标语料 T2),即可获得翻译精度和准确度以及质量较高的语言翻译模型。 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本发明。 附图说明 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。 图1是根据一示例性实施例示出的一种语言翻译模型的训练方法的流程图。 图2是根据一示例性实施例示出的一种语言翻译模型的训练装置的框图。
分享到:
收藏