logo好方法网

一种基于关系属性的搜索方法及系统


技术摘要:
本发明公开了一种基于关系属性的搜索方法及系统,通过成套系统制造商提供的零件目录,提取和归纳出从属性和相邻性数据关系链,并据此构建零件号索引数据库,在用户以关系属性为日常表达习惯使用搜索时,先通过系统检索和确认产品的零件号,再通过零件号精准匹配到能满  全部
背景技术:
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在 对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。本 申请涉及到的搜索方法,是介于垂直搜索引擎和目录搜索引擎之间,依赖于对目录搜索数 据的预处理,来支持对相应专业垂直领域的数据进行快速检索的一种专业搜索方式。 随着互联网快速向细分领域发展,传统搜索引擎基于统计学的排名技术已不能满 足专业垂直领域的搜索需求。在专业垂直领域成套系统(如机械设备、机动车辆等)的售后 市场,为维持成套系统的正常运转,需要对成套系统进行例行保养和维护,而保养维护所用 的零部件需要与原组装所用的零部件之间须具有可替代性或可互换性。因此,用户搜索是 为了检索到能满足可替代性或可互换性需求的零部件。如果以产品的外观、安装尺寸、连接 尺寸、技术参数和性能参数等专业数据来判断搜索结果是否满足可替代性或可互换性的需 求,需要用户掌握多技术领域、非常艰深的专业知识,但用户往往缺乏相应的知识和技能, 无法直接从传统搜索引擎的搜索结果中判断哪个结果能满足可替代性或可互换性的需求。 在专业垂直领域售后市场的线下交易场景,用户是通过检索成套系统制造商提供 的零件目录,通过目录检索查到对应的产品零件号(产品唯一识别代码),并依据零件号来 查找对应产品。在成套系统制造商提供的零件目录中,为便于使用者查询,零件目录会按品 牌、型号(版本号)、系统、子系统、总成及零部件等严格的层级关系呈现,同时对不同零部件 之间的替代性和互换性关系,会以零件号为唯一识别特征做明确的记载。因此,专业人员通 过传统零件目录的检索,能保证做到满足可替代性或可互换性的需求,并据此最终完成交 易。 在长期的生产实践中,用户形成了以直观的关系属性即从属关系和相邻关系来表 达对产品可替代性或可互换性需求的习惯。一旦某一产品作为零部件被组装进入某一专业 垂直领域的成套系统,就客观上与该成套系统的品牌、型号、系统、总成等之间形成从属关 系,并与邻近组装的零部件构成相邻关系,通过关系属性能准确表达可替代性或可互换性 的需求。在用户与商家的线下需求沟通过程中,用户习惯凭直觉以上述关系属性来表达需 求,即以“**品牌、**型号、**(零件名称)”来描述所需的零部件,所以,这种表达习惯很自然 地被带到线上交易场景。 但现有搜索技术没有对成套系统制造商提供的零件目录中的数据进行预处理,未 能提取、归纳和预置零部件从属关系和相邻关系的零件号索引数据库,因而无法获取和精 准解读出以关系属性表达所对应的产品零件号,因此无法准确的匹配和输出满足用户可替 代性或可互换性需求的搜索结果,从而导致线上交易无法完成。 以电子商务为例,用户希望通过搜索获得所需产品的相关信息并完成交易。从计 4 CN 111597219 A 说 明 书 2/8 页 算机数据处理的过程来看,通常包括以下过程:计算机针对用户搜索需求给出产品反馈信 息,用户查看产品相关信息并确定交易,计算机依据用户指示完成交易(上述过程可能涉及 到一些线下过程)。 上述数据处理过程中,当用户缺乏艰深的专业知识,无法从搜索输出产品信息的 结果排序中,判断和选择满足可替代性或可互换性需求的结果,仍需要借助于人工客服。由 于一个垂直专业领域往往涉及机械、电子、液压、气动、制冷等不同技术领域,因而人工客服 不可能同时具备这些技术领域的专业知识和技能,从而造成交易的中断和商机的流失。 迫切需要本领域专业技术人员解决的问题是:如何根据用户使用搜索时的表达习 惯,依据用户所表达的关系属性,模拟线下交易场景的思维和解决方式,先通过搜索系统检 索和确认产品的零件号,再通过零件号来实现精准匹配,推荐能满足可替代性或可互换性 需求的结果,以帮助线上交易的达成。
技术实现要素:
本发明目的就是为了弥补已有技术的缺陷,提供一种基于关系属性的搜索方法及 系统,通过成套系统制造商提供的零件目录,提取和归纳出从属性和相邻性数据关系链,并 据此构建零件号索引数据库,在用户以关系属性为日常表达习惯使用搜索时,先通过系统 检索和确认产品的零件号,再通过零件号精准匹配到能满足用户可替代性或可互换性需求 的结果;而无需用户具备艰深的专业知识和技能,以解决现有技术中由于关系属性数据的 缺失,搜索只能推荐以置信度为依据的可能性结果,导致用户不得不在缺乏专业知识的情 况下,面对无从选择的尴尬局面,进而造成无法达成交易的后果。 本发明是通过以下技术方案实现的: 一种基于关系属性的搜索方法,具体包括以下步骤: 基于零部件之间的关系属性,构建能反映零部件从属关系与相邻关系的零件号索引数 据库; 根据用户可能错误录入的同音字、词,笔误、俗称、别称以及错别字等,以及品牌特有产 品序列代码建立关联词典,其作用是保证即使在用户输入包含专名的搜索字符串时输入别 名或出现笔误的情况下,也可以得出准确的输出结果; 将零部件的品牌、型号、系统名称、总成名称、零件名称和零件号等数据提取出来,按层 级收录,构建形成专名词典; 收录商户逐个上传或批量上传的商品数据,建立商品数据库,或对接商户库存管理软 件中包含零件号的产品数据; 将用户输入的查询词串根据预置词典进行分词处理; 将处理结果与零件号索引数据库进行检索匹配; 对匹配结果进行处理并输出包含零件号的结果; 通过输出结果中的零件号这个零部件唯一标识查询商品数据库或商户库存管理软件 中包含零件号的产品数据; 输出与搜索所得零件号匹配一致的商品; 具体的搜索过程包括: 接收用户端的查询词串; 5 CN 111597219 A 说 明 书 3/8 页 对所述查询词串根据预置词典进行分词处理; 将处理结果与零件号索引数据库进行检索匹配; 对匹配结果进行处理并输出包含零件号的结果,供用户选择和确认; 根据用户选择和确认的结果所对应的零件号来匹配商品库中商品; 输出与搜索所得零件号匹配一致的商品。 所述的查询词串是用户以关系属性为日常表达习惯,即以“**品牌、**型号、**(零 件名称)”,来表述须能适配于“**品牌、**型号”成套系统的“**(零件名称)”,并满足可替代 性和可互换性的搜索需求;所述的关系属性是针对专业垂直领域售后市场,在某一产品作 为零部件被组装进入专业垂直领域的成套系统后,与该成套系统的品牌、型号、系统名称、 总成名称、零件名称和零件号之间形成从属关系,并与邻近组装的零部件构成相邻关系;通 过关系属性来表达可替代性或可互换性的需求;基于零部件之间的关系属性,构建反映零 部件从属关系与相邻关系的零件号索引数据库。 所述的预置词典包括专名词典和关联词典,其中专名词典是将零部件的品牌、型 号、系统名称、总成名称、零件名称和零件号数据提取出来,按层级收录,构建形成所述的专 名词典;关联词典是根据用户输入包含专名的搜索字符串时可能错误录入的同音字、词、笔 误、俗称、别称、错别字以及品牌特有产品序列代码建立,保证即使在用户输入别名或出现 笔误的情况下,也可以得出准确的输出结果。 收录商户逐个上传或批量上传的商品数据,建立所述的商品数据库,或对接商户 库存管理软件中包含零件号的产品数据。 所述输出包含零件号的结果,是结果输出的首次输出,展示的是零部件关系属性 信息以及零部件对应的零件号,其中零件号是某一产品作为零部件被组装进入专业垂直领 域的成套系统后,由成套系统制造商根据一定的编码规则给该产品设定的唯一识别代码, 输出包含零件号的结果,是供用户确认可替代性和可互换性需求是否得到满足。 所述根据对应的零件号来匹配商品数据库或商户库存管理软件中包含零件号的 产品数据,是在首次输出包含零件号的结果并经用户确认后的最终结果输出,输出的是满 足可替代性和可互换性的商品列表,展示信息为商品属性信息,以供用户做最终交易决策。 所述根据零件号来匹配商品数据库或商户库存管理软件中包含零件号的产品数据,是在用 户直接输入零件号进行搜索时,直接输出是满足可替代性和可互换性的商品列表。 一种基于关系属性的搜索系统,包括: 搜索数据初始化模块,用于对原数据进行清洗处理,构建零件号索引数据库,完成基础 数据的导入; 搜索词串获取模块,用于接收用户端文字、语音输入得到的字串; 搜索词串处理模块,用于对搜索字串进行纠错及中文分词处理; 搜索匹配模块,用于将分词处理得到的结果与零件号索引数据库做检索匹配,再与商 品数据库或商户库存管理软件中包含零件号的产品数据做检索匹配,匹配过程分两个环节 执行,先将分词处理得到的结果与零件号索引数据库做检索匹配,得到包含零件号的结果, 再将用户选择和确认的零部件结果所对应的零件号来与商品数据库或商户库存管理软件 中包含零件号的产品数据做检索匹配; 搜索结果处理模块,用于将上述符合输出标准的数据进行去重、排序处理; 6 CN 111597219 A 说 明 书 4/8 页 搜索结果输出模块用于展示零部件关系属性和产品匹配结果,分为一次输出和二次输 出两种情况:一次输出是当用户直接输入零件号进行搜索,直接输出满足可替代性和可互 换性的商品列表,展示信息为商品属性信息;二次输出是当用户以关系属性表达时,首先输 出满足可替代性和可互换性的零件列表,展示的是零部件关系属性信息以及零部件对应的 零件号,以供用户确认可替代性和可互换性需求是否得到满足,在用户确认后再输出商品 列表,展示信息为商品属性信息,以供用户做最终交易决策。 上述搜索结果输出过程中,前后两次结果的关系是通过零件号这个零部件唯一标 识,检索商品数据库或商户库存管理软件中包含零件号的产品数据,最终输出与搜索需求 对应、前后零件号一致、且满足可替换性或可互换性的商品列表。 本发明的优点是: 本发明引入了该成套系统制造商已客观形成的品牌、型号、版本号、系统、总成及零件 名称等纵向从属性关系链,以及零部件邻近安装组合形成的相邻关系链,从而在用户根据 日常表达习惯来搜索时得到的产品结果数据,能保证任何一个结果都能满足可替代性或可 互换性的需求,而无需用户依据产品的外观、安装尺寸、连接尺寸、技术参数和性能参数等 专业数据来判断搜索结果是否满足可替代性或可互换性的需求。 为了保证搜索时得到产品结果能满足用户可替代性或可互换性的需求,搜索时须 先检索零件号索引数据库,找出满足搜索词串表述的从属关系和相邻关系的零部件名称以 及所对应的零件号,再根据零件号这一产品唯一识别代码去匹配产品。 为了简化搜索流程,当用户直接输入零件号进行搜索时,可直接输出满足可替代 性或可互换性的商品列表,能保证任何一个结果都能满足用户需求。 由于零件号是产品唯一标识,通过零件号来匹配和识别产品,无须借助产品外观、 安装尺寸、连接尺寸、技术参数和性能参数等来判断是否能满足可替代性或可互换性需求, 因此商户可按系统提供的Excel表格模板批量上传商品数据,或提供数据接口授权系统调 取商户存货管理软件中可公开向用户展示、包含零件号的产品数据,而无需经过繁琐的商 品逐个上架的过程。 附图说明 图  1 是本发明方法的流程示意图; 图  2 是本发明系统的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏