logo好方法网

实体名词标注方法和装置、计算设备和可读存储介质


技术摘要:
公开了实体名词标注方法和装置、计算设备和计算机可读存储介质。该实体名词标注方法,包括:展示待标注的文本,待标注的文本包括第一语种文本和与第一语种文本相关联的第二语种文本;响应于分别对第一语种文本和第二语种文本的名词标注操作,将名词标注操作对应的第一  全部
背景技术:
目前,人们交流日益频繁,所交流的内容同时也会更加广泛。因此,对基于计算机 的自然语言处理的需求也与日俱增。例如,对于不同语种之间的机器翻译存在较大的需求。 现有技术中,仍然存在一些不足和缺口,例如,翻译内容不够准确,可选择的翻译平台较少。 方便、快捷、准确的机器翻译是期望的。
技术实现要素:
本公开提供了一种可以缓解、减轻或甚至消除上述问题中的一个或多个的实体名 词标注方法和装置、计算设备和计算机可读存储介质。 根据本发明的一方面,提供了一种实体名词标注方法,包括:展示待标注的文本, 待标注的文本包括第一语种文本和与第一语种文本相关联的第二语种文本;响应于分别对 第一语种文本和第二语种文本的名词标注操作,将名词标注操作对应的第一语种实体名词 和第二语种实体名词添加到实体名词标注区域;根据实体名词标注区域中对应显示的第一 语种实体名词和第二语种实体名词,生成名词标注结果。 在一些实施例中,根据实体名词标注区域中对应显示的第一语种实体名词和第二 语种实体名词,生成名词标注结果包括:分别在第一语种文本和第二语种文本中,确定第一 语种实体名词和第二语种实体名词,第一语种实体名词和第二语种实体名词在实体名词标 注区域对应显示;以及在第一语种文本和第二语种文本中,分别对第一语种实体名词和第 二语种实体名词添加相应的标注标签。 在一些实施例中,在第一语种文本和第二语种文本中,分别对第一语种实体名词 和第二语种实体名词添加相应的标注标签,包括:在实体名词标注区域中,确定对应显示第 一语种实体名词和第二语种实体名词的标注子区域的名词类型;根据名词类型确定标注标 签;以及在第一语种文本和第二语种文本中,分别对第一语种实体名词和第二语种实体名 词添加标注标签。 在一些实施例中,根据名词类型确定标注标签,包括:获取第一语种实体名词和第 二语种实体名词在实体名词标注子区域中对应显示的位置标识;以及根据名词类型和位置 标识生成标注标签。 在一些实施例中,响应于分别对第一语种文本和第二语种文本的名词标注操作, 将名词标注操作对应的第一语种实体名词和第二语种实体名词添加到实体名词标注区域, 包括:响应于对待标注文本的文本选择操作,对文本选择操作对应的实体名词突出显示;实 体名词包括第一语种实体名词和第二语种实体名词中的至少一种;以及响应于对实体名词 的名词分类操作,将实体名词添加到名词分类操作对应的标注子区域。 4 CN 111738024 A 说 明 书 2/14 页 在一些实施例中,响应于对实体名词的名词分类操作,将实体名词添加到名词分 类操作对应的标注子区域,包括:当检测到输入设备的组合键输入指令时,确定与组合键输 入指令对应的名词分类操作;以及将实体名词添加到名词分类操作对应的标注子区域。 在一些实施例中,在响应于对实体名词的名词分类操作,将实体名词添加到名词 分类操作对应的标注子区域之后,还包括:当检测到实体名词标注区域中的名词删除操作 时,确定名词删除操作对应的实体名词;以及将实体名词从标注子区域中删除。 在一些实施例中,在响应于对实体名词的名词分类操作,将实体名词添加到名词 分类操作对应的标注子区域之后,还包括:当检测到实体名词标注区域中的名词位置调整 指令时,根据名词位置调整指令对标注子区域中实体名词的位置进行调整。 根据本发明的另一方面,提供了一种实体名词标注装置,该装置包括:展示模块, 配置成展示待标注的文本,待标注的文本包括第一语种文本和与第一语种文本相关联的第 二语种文本;实体名词标注区域添加模块,配置成响应于分别对第一语种文本和第二语种 文本的名词标注操作,将名词标注操作对应的第一语种实体名词和第二语种实体名词添加 到实体名词标注区域;以及名词标注结果生成模块,配置成根据实体名词标注区域中对应 显示的第一语种实体名词和第二语种实体名词,生成名词标注结果。 根据本发明的另一方面,提供了一种计算设备,包括:处理器;以及存储器,其上存 储有指令,指令当在处理器上执行时促使处理器执行上面的实体名词标注方法中的任一 个。 根据本发明的另一方面,提供了一种计算机可读存储介质,其上存储有计算机可 读指令,计算机可读指令在被执行时实现上面的实体名词标注方法中的任一个。 通过本文提供的实施例,可以对两种文本进行标注并且对两种文本的标注结果进 行配对,实现了两种文本的标注结果的对应关系,从而生成了具有配对关系的资源库。这种 资源库可以作为训练机器翻译等模型训练的重要基础。另外,可以同时对多个实体名词同 时进行标注分类,提升了标注的效率。利用本发明提供的实施例,提升了对实体名词的标注 的自动化程度和人机交互的效率,例如标签录入效率提升,自动将标注的标签还原至原文 本,标注结果的自动配对等。同时,本发明提供的实施例中的标注实体名词的方法可视化程 度高,例如可以提供可视化的标签和实体名词标注区域。另外,本发明提供的实施例降低了 带宽和计算资源的闲置、浪费,改进了标注的效率和准确度,并且最终改进了计算机对自然 语言处理的效率和准确度。 附图说明 在下面结合附图对于示例性实施例的描述中,本发明的更多细节、特征和优点被 公开。附图仅用于示出实施方式的目的,而并不认为是对本公开的限制。而且在整个附图 中,用相同的附图标记表示相同或相似的要素。在附图中: 图1示出了根据本公开的一些实施例的实体名词标注方法的应用场景; 图2示出了根据本公开的一些实施例的实体名词标注方法的流程示意图; 图3-5示出了根据本公开的一些实施例的实体名词标注方法的用户界面的局部示意 图; 图6a示出了根据一些实施例的图2中所示出的步骤S220的一些子步骤; 5 CN 111738024 A 说 明 书 3/14 页 图6b示出了根据一些实施例的图2中所示出的步骤S220的一些子步骤; 图7a-7b示出了包括多种语言的文本; 图8从人机交互的角度示出了根据本公开的一些实施例的实体名词标注方法的流程 图; 图9示出了根据本公开的一些实施例的实体名词标注方法的部分过程的流程图; 图10示出了根据本公开的一些实施例的实体名词标注方法的部分过程的流程图; 图11示出了根据本发明实施例的实体名词标注装置的示意框图;以及 图12示出了能够实现根据本发明的一些实施例的实体名词标注方法的计算系统的示 意框图。
分享到:
收藏