logo好方法网

一种数据处理的方法、装置、可读存储介质和电子设备


技术摘要:
本发明实施例公开了一种数据处理的方法、装置、可读存储介质和电子设备。本发明实施例通过至少一个处理器生成标签组合,其中,所述标签组合包括多个标签,所述标签用于标识地址关键词类型;所述至少一个处理器获取多个所述地址关键词;所述至少一个处理器根据所述标签  全部
背景技术:
随着互联网技术的发展,智能终端的不断普及,在很多应用中,对智能终端的定位 的准确性的要求越来越高,例如,在一些应用中,需要准确的获取用户的定位,在获取用户 的定位过程中,需要对用户输入的中文地址进行标注,以便后续处理。 在现有技术中,通过条件随机场算法(conditional  random  field  algorithm, CRF)模型对用户输入的中文地址进行标注,具体的,通过CRF模型为所述中文地址打标签, 首先需要对CRF模型进行训练,在训练CRF模型时所使用的数据库中包括多个标注后的中文 地址,上述标注后的中文地址通过人工进行打标签,数据库中标注后的中文地址数量很大, 即人工进行打标签时工作量大,但由于人工进行打标签出错率较高,因此通过该数据库训 练出的CRF模型准确性较低。
技术实现要素:
有鉴于此,本发明实施例提供了一种数据处理的方法、装置、可读存储介质和电子 设备,能够提高训练出的条件随机域模型的准确性。 第一方面,本发明实施例提供了一种数据处理的方法,该方法包括:接收来自于程 序调用接口的信息处理请求;通过至少一个处理器生成标签组合,其中,所述标签组合包括 多个标签,所述标签用于标识地址关键词类型;所述至少一个处理器获取多个所述地址关 键词;所述至少一个处理器根据所述标签组合以及多个所述地址关键词,按照所述标签组 合生成携带标签标注的多个地址信息;所述至少一个处理器将所述携带标签标注的多个地 址信息保存至数据库;所述至少一个处理器根据所述数据库训练条件随机域模型。 优选的,该方法还包括:接收到新的地址信息;通过所述随机域模型为所述新的地 址信息标注标签。 优选地,所述通过至少一个处理器生成标签组合,具体包括:通过至少一个处理器 生成标签组合,其中,所述标签组合中包括的多个标签为至少设定数量,且所述设定数量的 所述多个标签的顺序符合地域层级的递进关系排序。 优选地,所述至少一个处理器获取多个所述地址关键词,具体包括:所述至少一个 处理器通过历史数据获取多个所述地址关键词,其中,所述历史数据包括行政区域划分数 据、行业数据以及随机生成数据。 优选地,所述按照所述标签组合生成携带标签标注的多个地址信息,具体包括:按 照所述标签组合中每个标签对应的地址关键词类型所对应的所述地址关键词,生成携带标 签标注的多个地址信息。 第二方面,本发明实施例提供了一种数据处理的装置,该装置包括:接收单元,用 4 CN 111581311 A 说 明 书 2/10 页 于接收来自于程序调用接口的信息处理请求;生成单元,用于通过至少一个处理器生成标 签组合,其中,所述标签组合包括多个标签,所述标签用于标识地址关键词类型;获取单元, 用于所述至少一个处理器获取多个所述地址关键词;所述生成单元还用于,所述至少一个 处理器根据所述标签组合以及多个所述地址关键词,按照所述标签组合生成携带标签标注 的多个地址信息;保存单元,用于所述至少一个处理器将所述携带标签标注的多个地址信 息保存至数据库;训练单元,用于所述至少一个处理器根据所述数据库训练条件随机域模 型。 第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储计算机程序 指令,所述计算机程序指令在被处理器执行时实现如第一方面或第一方面任一种可能中任 一项所述的方法。 第四方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器 用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理 器执行以实现如下步骤:接收来自于程序调用接口的信息处理请求;通过至少一个处理器 生成标签组合,其中,所述标签组合包括多个标签,所述标签用于标识地址关键词类型;所 述至少一个处理器获取多个所述地址关键词;所述至少一个处理器根据所述标签组合以及 多个所述地址关键词,按照所述标签组合生成携带标签标注的多个地址信息;所述至少一 个处理器将所述携带标签标注的多个地址信息保存至数据库;所述至少一个处理器根据所 述数据库训练条件随机域CRF模型。 优选地,所述处理器还执行如下步骤:接收到新的地址信息;通过所述随机域模型 为所述新的地址信息标注标签。 优选地,所述处理器具体执行如下步骤:通过至少一个处理器生成标签组合,其 中,所述标签组合中包括的多个标签为至少设定数量,且所述设定数量的所述多个标签的 顺序符合地域层级的递进关系排序。 优选地,所述处理器具体执行如下步骤:所述至少一个处理器通过历史数据获取 多个所述地址关键词,其中,所述历史数据包括行政区域划分数据、行业数据以及随机生成 数据。 优选地,所述处理器具体执行如下步骤:按照所述标签组合中每个标签对应的地 址关键词类型所对应的所述地址关键词,生成携带标签标注的多个地址信息。 本发明实施例通过至少一个处理器生成标签组合,其中,所述标签组合包括多个 标签,所述标签用于标识地址关键词类型,所述至少一个处理器获取多个所述地址关键词, 所述至少一个处理器根据所述标签组合以及所述多个所述地址关键词,按照所述标签组合 生成携带标签标注的多个地址信息;所述至少一个处理器将所述携带标签标注的多个地址 信息保存至数据库;所述至少一个处理器根据所述数据库训练条件随机域模型。通过上述 方法,可以准确的确定出数据库中包括的多个地址信息所携带标签,进而提高训练出的条 件随机域模型的准确性。 附图说明 通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和 优点将更为清楚,在附图中: 5 CN 111581311 A 说 明 书 3/10 页 图1是本发明第一实施例的数据处理的方法流程图; 图2是本发明第二实施例的数据处理的方法流程图; 图3是本发明第三实施例的应用场景图; 图4是本发明第四实施例的数据处理的装置示意图; 图5是本发明第五实施例的电子设备的示意图。
下载此资料需消耗2积分,
分享到:
收藏