
技术摘要:
本发明公开了一种信息确定方法和装置、存储介质及电子装置。该方法包括:获取一组待识别的源数据,并识别一组待识别的源数据的一组数据实体;根据一组数据实体的实体类型确定与一组数据实体对应的一组实体规则映射表,一组实体规则映射表为预先配置的不同的实体类型和 全部
背景技术:
对于结构化数据来说,也称作行数据,是由二维表结构来逻辑表达和实现的数据, 严格地遵循数据格式与长度规范,具有固定数目的列。例如,一张名称为“人员信息”的表中 可能有人员编号、姓名、性别、住址等字段。不同的表承载着不同的信息。例如,“人员信息” 表中是人的基本信息,“住宿信息”表中是人住宿的轨迹信息。另外,表中的各个列所承载信 息的维度、权重等也各不相同。在结构化数据的检索中,数据所直观呈现的维度越多,越有 利于全文检索,其检索结果表达的信息也越丰富。 然而,在一些情况下,原始数据表中所直接呈现的信息并不够。例如大多数人员信 息表中有身份证号码、姓名字段,但没有出生地、出生日期、性别、姓名拼音等信息;轨迹表 中经常含有各种编码信息,旅店编码、车站编码或机场编码等,但没有对应的旅店名称、车 站名称或机场名称的信息。如果直接对元数据进行索引,人员表中可以对身份证号码、姓名 等已有字段进行查询,如果使用姓名拼音、出生地等信息进行检索,则不会得到任何结果; 同理,轨迹表中使用对应的名称信息检索,也不会得到任何结果。也就是说,原始数据表所 直接呈现的信息存在信息量不足的问题。 因此,针对相关技术中,原始数据表所直接呈现的信息存在信息量不足的问题,尚 未提出有效的技术方案。
技术实现要素:
本发明实施例提供了一种信息确定方法和装置、存储介质及电子装置,以至少解 决相关技术中,原始数据表所直接呈现的信息存在信息量不足的技术问题。 根据本发明实施例的一个方面,提供了一种信息确定方法,包括:获取一组待识别 的源数据,并识别所述一组待识别的源数据的一组数据实体,其中,所述一组待识别的源数 据包括:所述一组数据实体,所述一组待识别的源数据与所述一组数据实体一一对应;根据 所述一组数据实体的实体类型确定与所述一组数据实体对应的一组实体规则映射表,其 中,所述一组实体规则映射表为预先配置的不同的实体类型和不同的规则之间的映射表, 所述一组实体规则映射表中的一个实体规则映射表用于识别一种实体类型的相关信息;根 据所述一组数据实体、所述一组实体规则映射表确定所述一组待识别的源数据的一组原始 数据信息和所述一组待识别的源数据的一组隐藏数据信息,其中,所述一组原始数据信息 用于表示所述一组待识别的源数据的数据本身的实际含义,所述一组隐藏数据信息用于表 示与所述一组待识别的源数据具有相关关系的信息。 根据本发明实施例的另一方面,还提供了一种信息确定装置,包括:获取单元,用 于获取一组待识别的源数据,并识别所述一组待识别的源数据的一组数据实体,其中,所述 4 CN 111597162 A 说 明 书 2/13 页 一组待识别的源数据包括:所述一组数据实体,所述一组待识别的源数据与所述一组数据 实体一一对应;第一确定单元,用于根据所述一组数据实体的实体类型确定与所述一组数 据实体对应的一组实体规则映射表,其中,所述一组实体规则映射表为预先配置的不同的 实体类型和不同的规则之间的映射表,所述一组实体规则映射表中的一个实体规则映射表 用于识别一种实体类型的相关信息;第二确定单元,用于根据所述一组数据实体、所述一组 实体规则映射表确定所述一组待识别的源数据的一组原始数据信息和所述一组待识别的 源数据的一组隐藏数据信息,其中,所述一组原始数据信息用于表示所述一组待识别的源 数据的数据本身的实际含义,所述一组隐藏数据信息用于表示与所述一组待识别的源数据 具有相关关系的信息。 根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机 可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述信息 确定方法。 根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存 储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行 上述的信息确定方法。 在本发明实施例中,获取一组待识别的源数据,并识别所述一组待识别的源数据 的一组数据实体,其中,所述一组待识别的源数据包括:所述一组数据实体,所述一组待识 别的源数据与所述一组数据实体一一对应;根据所述一组数据实体的实体类型确定与所述 一组数据实体对应的一组实体规则映射表,其中,所述一组实体规则映射表为预先配置的 不同的实体类型和不同的规则之间的映射表,所述一组实体规则映射表中的一个实体规则 映射表用于识别一种实体类型的相关信息;根据所述一组数据实体、所述一组实体规则映 射表确定所述一组待识别的源数据的一组原始数据信息和所述一组待识别的源数据的一 组隐藏数据信息,其中,所述一组原始数据信息用于表示所述一组待识别的源数据的数据 本身的实际含义,所述一组隐藏数据信息用于表示与所述一组待识别的源数据具有相关关 系的信息,通过上述方式,可以获取到一组待识别源数据的一组原始数据信息和一组隐藏 数据信息,通过一组隐藏数据信息可以获得更加丰富的信息,解决了相关技术中,原始数据 表所直接呈现的信息存在信息量不足的问题。 附图说明 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 图1是根据本发明实施例的一种信息确定方法的应用环境的示意图; 图2是根据本发明实施例的一种可选的信息确定方法的流程示意图; 图3是根据本发明实施例的一种可选的信息确定装置的结构示意图; 图4是根据本发明实施例的一种可选的电子装置的结构示意图。