logo好方法网

搜索意图识别方法、装置、电子设备和存储介质


技术摘要:
本申请公开了搜索意图识别方法、装置、电子设备和存储介质。所述方法包括:基于二分类模型识别出搜索请求的第一搜索意图集合;基于多分类模型识别出搜索请求的第二搜索意图集合,第二搜索意图集合中的搜索意图具有意图强弱值;将第一搜索意图集合与第二搜索意图集合求  全部
背景技术:
搜索意图识别在搜索场景中至关重要,只有准确识别出用户的搜索意图,才能召 回更好的搜索结果来满足用户。其中,搜索意图通常指搜索行为背后体现的用户真实需求, 例如,搜索“羽毛球”,可能是因为用户想购买羽毛球器械,也可能是寻找羽毛球场馆,亦可 能是学习羽毛球规则,等等。在这个例子中,“购买器械”、“寻找场馆”以及“学习规则”就是 与“羽毛球”这个搜索关键词相关的三类不同搜索意图。 用户在某一时刻、某一地点和某一场景下的搜索意图可能是唯一的,也可能是多 个,目前通常将搜索意图的识别作为一个分类问题来解决,也就是预设多类搜索意图,来判 断搜索请求对应于哪些类搜索意图。 常用的一种方法就是进行多个单独的二分类,即分别判断搜索请求是否对应于每 一类搜索意图。这样的缺点在于,各个单独二分类的结果之间没有可比性,即不可做强弱比 较,但是对于某一个用户来说,在特定的时间、地点、场景上应该是有搜索意图的主次的,主 要搜索意图应当强于次要搜索意图,因此现有技术无法满足用户需求。
技术实现要素:
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上 述问题的搜索意图识别方法、装置、电子设备和存储介质。 依据本申请的第一方面,提供了一种搜索意图识别方法,包括:基于二分类模型识 别出搜索请求的第一搜索意图集合;基于多分类模型识别出所述搜索请求的第二搜索意图 集合,所述第二搜索意图集合中的搜索意图具有意图强弱值;将所述第一搜索意图集合与 所述第二搜索意图集合求交集,将交集中的搜索意图作为所述搜索请求对应的搜索意图, 并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。 可选地,上述方法中,所述基于二分类模型识别出搜索请求的第一搜索意图集合 包括:基于多个二分类模型,分别对归一化处理后的所述搜索请求进行识别,其中,每个二 分类模型分别对应一个预设搜索意图;获取各二分类模型的识别结果;根据各二分类模型 的识别结果确定所述第一搜索意图集合。 可选地,上述方法中,所述对归一化处理后的所述搜索请求进行识别包括:将归一 化处理后的所述搜索请求与第一词表进行匹配;在第一词表中存在完全匹配项的情况下, 将该二分类模型对应的预设搜索意图作为识别出的搜索意图。 可选地,上述方法中,所述对归一化处理后的所述搜索请求进行识别包括:将归一 化处理后的所述搜索请求与第二词表进行匹配;在第二词表中存在部分匹配项的情况下, 将该二分类模型对应的预设搜索意图作为识别出的搜索意图。 4 CN 111737544 A 说 明 书 2/13 页 可选地,上述方法中,所述对归一化处理后的所述搜索请求进行识别包括:识别出 归一化处理后的所述搜索请求的预测得分;在所述预测得分大于正负阈值的情况下,将该 二分类模型对应的预设搜索意图作为识别出的搜索意图。 可选地,上述方法中,所述基于多分类模型识别出搜索请求的第二搜索意图集合 包括:生成所述搜索请求的搜索意图特征;利用所述多分类模型对所述搜索意图特征进行 识别,得到所述第二搜索意图集合。 可选地,所述根据交集中搜索意图的意图强弱值确定搜索意图展示方式包括:根 据交集中的搜索意图生成搜索结果聚块,根据搜索聚块中各搜索意图的意图强弱值确定搜 索聚块的展示优先级。 可选地,所述根据交集中搜索意图的意图强弱值确定搜索意图展示方式包括:根 据交集中搜索意图的意图强弱值确定搜索意图的展示顺序。 可选地,所述第一搜索意图集合中的搜索意图具有意图强弱调整参数;所述根据 交集中搜索意图的意图强弱值确定搜索意图展示方式包括:根据交集中搜索意图的意图强 弱调整参数和意图强弱值确定意图调整值,根据交集中搜索意图的意图强弱调整值确定搜 索意图展示方式。 可选地,所述方法还包括:在所述第一搜索意图集合中的搜索意图命中冷启动规 则的情况下,根据命中的冷启动规则对相应搜索意图的意图强弱调整参数进行更新。 依据本申请的第二方面,提供了一种搜索意图识别装置,包括:第一识别单元,用 于基于二分类模型识别出搜索请求的第一搜索意图集合;第二识别单元,用于基于多分类 模型识别出所述搜索请求的第二搜索意图集合,所述第二搜索意图集合中的搜索意图具有 意图强弱值;融合单元,用于将所述第一搜索意图集合与所述第二搜索意图集合求交集,将 交集中的搜索意图作为所述搜索请求对应的搜索意图,并根据交集中搜索意图的意图强弱 值确定搜索意图展示方式。 可选地,上述装置中,所述第一识别单元,用于基于多个二分类模型,分别对归一 化处理后的所述搜索请求进行识别,其中,每个二分类模型分别对应一个预设搜索意图;获 取各二分类模型的识别结果;根据各二分类模型的识别结果确定所述第一搜索意图集合。 可选地,上述装置中,所述第一识别单元,用于将归一化处理后的所述搜索请求与 第一词表进行匹配;在第一词表中存在完全匹配项的情况下,将该二分类模型对应的预设 搜索意图作为识别出的搜索意图。 可选地,上述装置中,所述第一识别单元,用于将归一化处理后的所述搜索请求与 第二词表进行匹配;在第二词表中存在部分匹配项的情况下,将该二分类模型对应的预设 搜索意图作为识别出的搜索意图。 可选地,上述装置中,所述第一识别单元,用于识别出归一化处理后的所述搜索请 求的预测得分;在所述预测得分大于正负阈值的情况下,将该二分类模型对应的预设搜索 意图作为识别出的搜索意图。 可选地,上述装置中,所述第二识别单元,用于生成所述搜索请求的搜索意图特 征;利用所述多分类模型对所述搜索意图特征进行识别,得到所述第二搜索意图集合。 可选地,所述融合单元,用于根据交集中的搜索意图生成搜索结果聚块,根据搜索 聚块中各搜索意图的意图强弱值确定搜索聚块的展示优先级。 5 CN 111737544 A 说 明 书 3/13 页 可选地,所述融合单元,用于根据交集中搜索意图的意图强弱值确定搜索意图的 展示顺序。 可选地,所述第一搜索意图集合中的搜索意图具有意图强弱调整参数;所述融合 单元,用于根据交集中搜索意图的意图强弱调整参数和意图强弱值确定意图调整值,根据 交集中搜索意图的意图强弱调整值确定搜索意图展示方式。 可选地,所述装置还包括:冷启动调整单元,用于在所述第一搜索意图集合中的搜 索意图命中冷启动规则的情况下,根据命中的冷启动规则对相应搜索意图的意图强弱调整 参数进行更新。 依据本申请的又一方面,提供了一种电子设备,包括:处理器;以及被安排成存储 计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所 述的方法。 依据本申请的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读 存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一 所述的方法。 由上述可知,本申请的技术方案,基于二分类模型识别出搜索请求的第一搜索意 图集合,第一搜索意图集合中的搜索意图具有意图强弱粗属性;基于多分类模型识别出搜 索请求的第二搜索意图集合,第二搜索意图集合中的搜索意图具有意图强弱值;将第一搜 索意图集合与第二搜索意图集合求交集,将交集中的搜索意图作为搜索请求对应的搜索意 图,并根据交集中搜索意图的意图强弱值确定搜索意图展示方式。该技术方案融合了单独 二分类和统一多分类的优点,通过多个单独的二分类确定的搜索意图保证召回率,通过统 一多分类确定的搜索意图保证强弱关系的可比较性,满足业务的展示交互需求;将搜索意 图识别和搜索意图强弱排序解耦,有利于各个搜索意图对应的业务进行各自的搜索意图识 别的迭代优化,而在平台侧统一进行意图强弱排序,可以更好的解决业务冲突和展示独占 问题。 上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段, 而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够 更明显易懂,以下特举本申请的
下载此资料需消耗2积分,
分享到:
收藏