logo好方法网

一种数据融合方法及装置


技术摘要:
本发明公开了一种数据融合方法及装置,涉及交通信息服务技术领域,解决了单个渠道获取的POI地址信息存在覆盖范围不全、数据质量不高的问题。具体方案包括:数据融合装置获取至少两种POI数据源中每种POI数据源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于  全部
背景技术:
兴趣点(point  of  interest,POI)地址信息是对具体的地理实体的标注,代表着 该地理实体的特定地理位置。实际应用中,POI地址信息与经济社会活动和人民群众日常生 活密切相关,涉及经济生活、社会交往、城市建设和治安管理等诸多方面。 在相关技术中,一个地理实体的POI地址信息可以从不同的渠道获取,例如,可以 从公安网、互联网应用等获取。但是,单个渠道获取的POI地址信息均存在覆盖范围不全、数 据质量不高的问题。
技术实现要素:
本发明提供一种数据融合方法及装置,解决了单个渠道获取的POI地址信息存在 覆盖范围不全、数据质量不高的问题。 为达到上述目的,本发明采用如下技术方案: 第一方面,本发明提供一种数据融合方法,该方法包括:数据融合装置获取至少两 种POI数据源中每种POI数据源的POI地址信息,得到初始POI地址信息集合,POI地址信息用 于表示地理实体的位置信息;对初始POI地址信息集合包括的POI地址信息进行融合,得到 目标POI地址信息集合,目标POI地址信息集合包括多条有效的目标POI地址信息;将目标 POI地址信息集合包括的目标POI地址信息加载入地址信息数据库。 结合第一方面,在一种可能的实现方式中,对初始POI地址信息集合包括的POI地 址信息进行融合,得到目标POI地址信息集合,具体可以包括:对初始POI地址信息集合包括 的POI地址信息进行清洗和加工,得到候选POI地址信息集合;将候选POI地址信息集合包括 的每条POI地址信息按照预设地址结构进行转换,得到目标POI地址信息集合。 结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对初始POI地 址信息集合包括的POI地址信息进行清洗和加工,得到候选POI地址信息集合,具体可以包 括:将初始POI地址信息集合按照行政区划等级进行分类,去除每类POI地址信息中的异常 POI地址信息,得到第一POI地址信息集合;将第一POI地址信息集合包括的每条POI地址信 息进行切分,得到多个切片信息;确定多个切片信息中的异常切片信息,去除第一POI地址 信息集合中包含异常切片信息的POI地址信息,得到第二POI地址信息集合;对第二POI地址 信息集合进行清洗和加工,得到候选POI地址信息集合。 结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对第二POI地 址信息集合进行清洗和加工,得到候选POI地址信息集合,具体可以包括:从去除异常切片 信息后的切片信息中获取地理实体的名称,并将第二POI地址信息集合中,包含相同名称的 所有POI地址信息进行清洗和加工,得到候选POI地址信息集合。 结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对第二POI地 5 CN 111723172 A 说 明 书 2/11 页 址信息集合进行清洗和加工,得到候选POI地址信息集合,具体可以包括:在去除异常切片 信息后的切片信息中,将表示同一地理实体的切片信息合并为分词,并将包含分词的POI地 址信息进行合并;确定分词的类型,并根据分词的类型,对合并后的POI地址信息进行清洗 和加工,得到候选POI地址信息集合。 结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,还包括:响应 于用户的输入操作,在地址信息数据库中按照预设地址结构,增加POI地址信息。 结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,还包括:按照 预设规则对地址信息数据库包括的目标POI地址信息集合进行检测,确定问题POI地址信 息;输出提示信息,提示信息用于提示用户对问题POI地址信息进行核查。 结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,还包括:确定 问题POI地址信息对应的修改信息;输出修改信息;响应于用户对修改信息的确认操作,按 照修改信息修改地址信息数据库中的问题POI地址信息。 第二方面,本发明提供一种数据融合装置,数据融合装置包括:获取单元、融合单 元和存储单元。其中,获取单元,用于获取至少两种POI数据源中每种POI数据源的POI地址 信息,得到初始POI地址信息集合,POI地址信息用于表示地理实体的位置信息。融合单元, 用于对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,目 标POI地址信息集合包括多条有效的目标POI地址信息。存储单元,用于将目标POI地址信息 集合包括的目标POI地址信息加载入地址信息数据库。 结合第二方面,在一种可能的实现方式中,融合单元,具体用于:对初始POI地址信 息集合包括的POI地址信息进行清洗和加工,得到候选POI地址信息集合;将候选POI地址信 息集合包括的每条POI地址信息按照预设地址结构进行转换,得到目标POI地址信息集合。 结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,融合单元,具 体用于:将初始POI地址信息集合按照行政区划等级进行分类,去除每类POI地址信息中的 异常POI地址信息,得到第一POI地址信息集合;将第一POI地址信息集合包括的每条POI地 址信息进行切分,得到多个切片信息;确定多个切片信息中的异常切片信息,去除第一POI 地址信息集合中包含异常切片信息的POI地址信息,得到第二POI地址信息集合;对第二POI 地址信息集合进行清洗和加工,得到候选POI地址信息集合。 结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,融合单元,具 体用于:从去除异常切片信息后的切片信息中获取地理实体的名称,并将第二POI地址信息 集合中,包含相同名称的所有POI地址信息进行清洗和加工,得到候选POI地址信息集合。 结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,融合单元,具 体用于:在去除异常切片信息后的切片信息中,将表示同一地理实体的切片信息合并为分 词,并将包含分词的POI地址信息进行合并;确定分词的类型,并根据分词的类型,对合并后 的POI地址信息进行清洗和加工,得到候选POI地址信息集合。 结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,数据融合装 置还包括:处理单元。处理单元,用于响应于用户的输入操作,在地址信息数据库中按照预 设地址结构,增加POI地址信息。 结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,数据融合装 置还包括:检测单元和输出单元;检测单元,用于按照预设规则对地址信息数据库包括的目 6 CN 111723172 A 说 明 书 3/11 页 标POI地址信息集合进行检测,确定问题POI地址信息;输出单元,用于输出提示信息,提示 信息用于提示用户对问题POI地址信息进行核查。 结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,数据融合装 置还包括:确定单元和修改单元。确定单元,用于确定问题POI地址信息对应的修改信息。输 出单元,还用于输出修改信息。修改单元,用于响应于用户对修改信息的确认操作,按照修 改信息修改地址信息数据库中的问题POI地址信息。 第三方面,本发明提供一种数据融合装置,该数据融合装置包括:处理器和存储 器。存储器用于存储计算机执行指令,当数据融合装置运行时,处理器执行存储器存储的计 算机执行指令,以使数据融合装置执行如第一方面或第一方面的可能的实现方式中任意一 项的数据融合方法。 第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机执行指令,当 计算机执行指令在数据融合装置上运行时,使得数据融合装置执行如第一方面或第一方面 的可能的实现方式中任意一项的数据融合方法。 本发明提供的数据融合方法,能够获取至少两种POI数据源中每种POI数据源的 POI地址信息,得到初始POI地址信息集合,并对初始POI地址信息集合包括的POI地址信息 进行融合,得到目标POI地址信息集合,将目标POI地址信息集合包括的目标POI地址信息加 载入地址信息数据库。这样,通过将至少两种POI数据源的POI地址信息进行融合,来得到有 效的目标POI地址信息集合,由于结合多种POI数据源得到的目标POI地址信息与相关技术 中单个数据源的POI地址信息相比,更加能准确、全面的表示地理实体的位置信息,解决了 单个渠道获取的POI地址信息存在覆盖范围不全、数据质量不高的问题。 附图说明 图1为本发明实施例提供的一种数据融合系统的结构示意图; 图2为本发明实施例提供的一种计算装置的组成示意图; 图3为本发明实施例提供的一种数据融合方法的流程图; 图4为本发明实施例提供的一种数据融合装置的组成示意图; 图5为本发明实施例提供的另一种数据融合装置的组成示意图。
分享到:
收藏