logo好方法网

翻译方法和装置、存储介质和电子设备


技术摘要:
本发明公开了一种翻译方法和装置、存储介质和电子设备,包括:在预先训练好的第一目标翻译模型中获取待翻译的第一语种的N个词,N为自然数,第一目标翻译模型用于将第一语种的词翻译成第二语种的词;通过第一目标翻译模型确定N个词的对应的第一目标过去特征向量和第一目  全部
背景技术:
目前,在机器翻译过程中,需要对过去部分和未来部分进行建模,相关技术中,一 般采用的直觉性目标函数存在准确率地的问题,而且在这种建模中缺少对文本上下文信息 的利用。另外,对已翻译部分和未翻译部分的建模主要有两点功能,一是准确地发现已翻译 部分和未翻译部分,二是利用这些信息来帮助未来的模型预测。但是,相关技术中,混淆了 这两种功能。 因此,相关技术中,在对文本进行机器翻译时,存在无法准确确定已翻译部分文本 和未翻译部分文本的问题,尚未提出有效的解决方案。
技术实现要素:
本发明实施例提供了一种翻译方法和装置、存储介质和电子设备,以至少解决在 对文本进行机器翻译时,存在无法准确确定已翻译部分文本和未翻译部分文本的技术问 题。 根据本发明实施例的一个方面,提供了一种翻译方法,包括:在预先训练好的第一 目标翻译模型中获取待翻译的第一语种的N个词,其中,N为自然数,上述第一目标翻译模型 用于将上述第一语种的词翻译成第二语种的词;通过上述第一目标翻译模型确定上述N个 词的对应的第一目标过去特征向量和第一目标未来特征向量,并将上述第一目标过去特征 向量和上述第一目标未来特征向量与上述N个词对应的M个第一解码向量进行拼接,得到M 个第一目标拼接向量,其中,上述第一目标过去特征向量和上述第一目标未来特征向量是 根据上述N个词对应的N个第一编码向量确定得到的向量,上述M个第一解码向量是将上述N 个第一编码向量解码得到的,M为自然数;使用上述M个第一目标拼接向量确定上述第二语 种的M个词,其中,上述第二语种的M个词是上述第一目标翻译模型对上述第一语种的N个词 进行翻译得到的上述第二语种的词。 根据本发明实施例的另一方面,还提供了一种翻译装置,包括:第一获取单元,用 于在预先训练好的第一目标翻译模型中获取待翻译的第一语种的N个词,其中,N为自然数, 上述第一目标翻译模型用于将上述第一语种的词翻译成第二语种的词;第一处理单元,用 于通过上述第一目标翻译模型确定上述N个词的对应的第一目标过去特征向量和第一目标 未来特征向量,并将上述第一目标过去特征向量和上述第一目标未来特征向量与上述N个 词对应的M个第一解码向量进行拼接,得到M个第一目标拼接向量,其中,上述第一目标过去 特征向量和上述第一目标未来特征向量是根据上述N个词对应的N个第一编码向量确定得 到的向量,上述M个第一解码向量是将上述N个第一编码向量解码得到的,M为自然数;第一 确定单元,用于使用上述M个第一目标拼接向量确定上述第二语种的M个词,其中,上述第二 6 CN 111597829 A 说 明 书 2/24 页 语种的M个词是上述第一目标翻译模型对上述第一语种的N个词进行翻译得到的上述第二 语种的词。 根据本发明实施例的一个方面,提供了一种翻译方法,包括:在对第一训练翻译模 型进行第t次迭代时,使用第一训练翻译模型中的第一训练编码器对第一语种的第Nt个词 进行编码,得到第Nt个第一训练编码向量,其中,上述第Nt个第一训练编码向量用于表示上 述第一语种的上述第Nt个词,Nt为自然数,上述第一训练翻译模型用于将上述第一语种的词 翻译成第二语种的词;根据上述第Nt个第一训练编码向量,确定出第一过去特征向量和第 一未来特征向量;使用第二训练翻译模型中的第二训练编码器对上述第二语种的Nt1个词进 行编码,得到Nt1个第二训练编码向量,并根据Nt1个第二训练编码向量,确定出第二过去特 征向量,其中,上述第二语种的Nt1个词为上述第t次迭代之前已通过上述第一训练翻译模型 翻译得到的上述第二语种的词;使用上述第二训练编码器对上述第二语种的Nt2个词进行编 码,得到Nt2个第二训练编码向量,并根据Nt2个第二训练编码向量,确定出第二未来特征向 量,其中,上述第二语种的Nt2个词为上述第t次迭代之后待通过上述第一训练翻译模型翻译 的上述第一语种的词对应的上述第二语种的词;根据上述第一过去特征向量和上述第一未 来特征向量与上述第二过去特征向量和上述第二未来特征向量,确定第t次迭代的第一损 失值;在上述第t次迭代的第一损失值不满足第一预设条件的情况下,更新上述第一训练翻 译模型中的参数,并对上述第一训练翻译模型执行第t 1次迭代。 根据本发明实施例的另一方面,还提供了一种翻译装置,包括:第一编码单元,用 于在对第一训练翻译模型进行第t次迭代时,使用第一训练翻译模型中的第一训练编码器 对第一语种的第Nt个词进行编码,得到第Nt个第一训练编码向量,其中,上述第Nt个第一训 练编码向量用于表示上述第一语种的上述第Nt个词,Nt为自然数,上述第一训练翻译模型用 于将上述第一语种的词翻译成第二语种的词;第二确定单元,用于根据上述第Nt个第一训 练编码向量,确定出第一过去特征向量和第一未来特征向量;第二处理单元,用于使用第二 训练翻译模型中的第二训练编码器对上述第二语种的Nt1个词进行编码,得到Nt1个第二训 练编码向量,并根据Nt1个第二训练编码向量,确定出第二过去特征向量,其中,上述第二语 种的Nt1个词为上述第t次迭代之前已通过上述第一训练翻译模型翻译得到的上述第二语种 的词;第三处理单元,用于使用上述第二训练编码器对上述第二语种的Nt2个词进行编码,得 到Nt2个第二训练编码向量,并根据Nt2个第二训练编码向量,确定出第二未来特征向量,其 中,上述第二语种的Nt2个词为上述第t次迭代之后待通过上述第一训练翻译模型翻译的上 述第一语种的词对应的上述第二语种的词;第三确定单元,用于根据上述第一过去特征向 量和上述第一未来特征向量与上述第二过去特征向量和上述第二未来特征向量,确定第t 次迭代的第一损失值;第四处理单元,用于在上述第t次迭代的第一损失值不满足第一预设 条件的情况下,更新上述第一训练翻译模型中的参数,并对上述第一训练翻译模型执行第t 1次迭代。 根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机 可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述翻译 方法。 根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存 储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行 7 CN 111597829 A 说 明 书 3/24 页 上述翻译方法。 在本发明实施例中,在预先训练好的第一目标翻译模型(用于将第一语种的词翻 译成第二语种的词)中获取待翻译的第一语种的N个词,然后通过第一目标翻译模型确定N 个词的对应的第一目标过去特征向量和第一目标未来特征向量,然后,根据N个词对应的N 个第一编码向量可以确定得到第一目标过去特征向量和第一目标未来特征向量,将上述N 个第一编码向量解码可以得到M个第一解码向量,将第一目标过去特征向量和第一目标未 来特征向量与M个第一解码向量进行拼接,可以得到M个第一目标拼接向量,最后,使用M个 第一目标拼接向量可以确定第二语种的M个词,其中,第二语种的M个词是第一目标翻译模 型对第一语种的N个词进行翻译得到的第二语种的词,通过上述过程,可以通过预先训练好 的第一目标翻译模型准确的确定出已经翻译部分的词对应的第一目标过去特征向量和未 翻译部分的词对应的第一目标未来特征向量,并将第一目标过去特征向量和第一目标未来 特征向量与M个第一解码向量进行拼接,得到M个第一目标拼接向量,最终通过M个第一目标 拼接向量确定待翻译的N个词对应的M个词,通过这种拼接过去特征向量和未来特征向量的 方式,使翻译模型的翻译得到的词更加精确,从而达到通过已翻译部分的词和未翻译部分 的词的信息提升翻译模型的忠实度的效果,提高了翻译模型的准确率。 附图说明 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 图1是根据本发明实施例的一种翻译方法的应用环境的示意图; 图2是根据本发明实施例的一种可选的翻译方法的流程示意图; 图3是根据本发明实施例的一种可选的翻译模型的结构示意图; 图4是根据本发明实施例的另一种可选的翻译方法的流程示意图; 图5是根据本发明实施例的又一种可选的翻译方法的流程示意图; 图6是根据本发明实施例的一种可选的翻译装置的结构示意图; 图7是根据本发明实施例的另一种可选的翻译装置的结构示意图; 图8是根据本发明实施例的一种可选的电子设备的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏