logo好方法网

一种辅助翻译中处理术语的方法


技术摘要:
本说明书实施例提供一种辅助翻译中处理术语的方法。该方法包括:获取第一文本中的一个第一术语;获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预设值的连续的词的组合;获取所述第一术语与每一个所述候选词组的相似度,确定作为第二术语的候选词组;对  全部
背景技术:
在翻译项目中,技术资料的翻译经常会涉及到大量的专业术语。使用机器翻译技 术虽然速度快、效率高,但是当源语言文件存在某一领域专业术语时,机器翻译的结果可能 存在不准确的情况,还是需要通过人工进行进一步检查并替换为准确的译文。同时,在源语 言文件中,同一个专业术语对应同一个特定的技术概念或者专有名词,然而,由于上下文语 境等原因,同一个专业术语在译文中可能存在不同的翻译,需要人工检查并替换为统一的 术语对应的翻译。 因此,期望提供一种辅助翻译中处理术语的方法,以保证专业术语译文的一致性, 从而提高翻译效率。
技术实现要素:
本说明书实施例之一提供一种辅助翻译中处理术语的方法。所述辅助翻译中处理 对应术语的方法包括:获取第一文本中的一个第一术语;获取第二文本中的多个候选词组, 每一个所述候选词组为个数小于预设值的连续的词的组合;获取所述第一术语与每一个所 述候选词组的相似度,确定作为第二术语的候选词组;对所述第二术语进行以下操作的一 种或多种:显示所述第二术语,标识所述第二术语,用第三术语替换第二术语。 在一些实施例中,所述方法还包括:在多个源文本单元中查找所述第一术语,其 中,所述源文本单元使用与第一文本对应的语言,且包含不同于所述第一文本的内容;对包 含所述第一术语的每一个所述源文本单元,将其对应的目标文本单元作为所述第二文本, 获取所述目标文本单元中的第二术语,所述目标文本单元使用与所述第二文本对应的语 言;如果对多个所述目标文本单元中的所述第二术语进行替换,所使用的所述第三术语相 同。 在一些实施例中,所述相似度的获取方法包括:基于所述第一术语通过自动翻译 模型获取第四术语,所述第四术语所用语言为所述第二文本所对应的语言;基于所述第四 术语和所述候选词组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量;基于 所述源术语向量与每一个所述候选词组向量的向量距离确定相似度。 在一些实施例中,所述相似度的获取方法包括:基于所述第一术语和所述候选词 组,分别通过文本嵌入模型获取源术语向量和多个候选词组向量确定相似度;基于所述源 术语向量与每一个所述候选词组向量,通过相似度模型确定相似度;其中,所述相似度模型 为机器学习模型。 在一些实施例中,所述确定作为第二术语的候选词组包括:将所述相似度符合预 设条件的一个或多个所述候选词组作为候选术语,获取用户输入确定所述第二术语。 本说明书实施例之一提供一种辅助翻译中处理术语的系统,该系统包括:用于存 5 CN 111597826 A 说 明 书 2/11 页 储计算机指令的至少一个存储器;与所述存储器通讯的至少一个处理器,其中当所述至少 一个处理器执行所述计算机指令时,所述至少一个处理器使所述系统执行:获取第一文本 中的一个第一术语;获取第二文本中的多个候选词组,每一个所述候选词组为个数小于预 设值的连续的词的组合;获取所述第一术语与每一个所述候选词组的相似度,确定作为第 二术语的候选词组;对所述第二术语进行以下操作的一种或多种:显示所述第二术语,标识 所述第二术语,用第三术语替换第二术语。 在一些实施例中,所述至少一个处理器使所述系统进一步执行:在多个源文本单 元中查找所述第一术语,其中,所述源文本单元使用与第一文本对应的语言,且包含不同于 所述第一文本的内容;对包含所述第一术语的每一个所述源文本单元,将其对应的目标文 本单元作为所述第二文本,获取所述目标文本单元中的第二术语,所述目标文本单元使用 与所述第二文本对应的语言;如果对多个所述目标文本单元中的所述第二术语进行替换, 所使用的所述第三术语相同。 在一些实施例中,为获取所述第一术语与每一个所述候选词组的相似度,所述处 理器使所述系统进一步执行:基于所述第一术语通过自动翻译模型获取第四术语,所述第 四术语所用语言为所述第二文本所对应的语言;基于所述第四术语和所述候选词组,分别 通过文本嵌入模型获取源术语向量和多个候选词组向量;基于所述源术语向量与每一个所 述候选词组向量的向量距离确定相似度。 在一些实施例中,为获取所述第一术语与每一个所述候选词组的相似度,所述处 理器使所述系统进一步执行:基于所述第一术语和所述候选词组,分别通过文本嵌入模型 获取源术语向量和多个候选词组向量;基于所述源术语向量与每一个所述候选词组向量, 通过相似度模型确定相似度;其中,所述相似度模型为机器学习模型。 在一些实施例中,为确定作为第二术语的候选词组,所述处理器使所述系统进一 步执行:将所述相似度符合预设条件的一个或多个所述候选词组作为候选术语,获取用户 输入确定所述第二术语。 本说明书实施例之一提供一种辅助翻译中处理术语的系统,包括:第一获取模块, 用于获取第一文本中的一个第一术语;第二获取模块,用于获取第二文本中的多个候选词 组,每一个所述候选词组为个数小于预设值的连续的词的组合;计算模块,用于获取所述第 一术语与每一个所述候选词组的相似度;确定模块,用于确定作为第二术语的候选词组;处 理模块,用于对所述第二术语进行以下操作的一种或多种:显示所述第二术语,标识所述第 二术语,用第三术语替换第二术语。 本说明书实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指 令,当计算机读取存储介质中的计算机指令后,计算机执行本申请中任一实施例所述的辅 助翻译中处理术语的方法。 附图说明 本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进 行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其 中: 图1是根据本说明书一些实施例所示的文本辅助处理系统的应用场景图; 6 CN 111597826 A 说 明 书 3/11 页 图2是根据本说明书一些实施例所示的一种辅助翻译中处理术语的方法的示例性 流程图; 图3是根据本说明书一些实施例所示的确定源文本文件中第二术语的方法的示例 性流程图; 图4是根据本说明书一些实施例所示的相似度获取方法的示例性流程图; 图5是根据本说明书又一实施例所示的相似度获取方法的示例性流程图; 图6是根据本说明书一些实施例所示的一种辅助翻译中处理术语的系统的模块 图。
下载此资料需消耗2积分,
分享到:
收藏