logo好方法网

信息的处理方法、装置、存储介质及电子设备


技术摘要:
本公开实施例公开了一种信息的处理方法、装置、存储装置及电子设备。该方法包括:基于历史数据,提取特征属性;基于所述特征属性,构建敏感关键词的集合;将所述敏感关键词的集合中的敏感关键词通过预定模型进行过滤。本公开实施例基于搜索词的历史数据,提取搜索词的  全部
背景技术:
用户在搜索结果页浏览内容时,搜索会用推荐搜索词进行引导,帮助用户补全搜 索减少搜索成本以提供更精准的查询。但推荐引导的候选集来自用户的主动搜索词合集, 难免会出现大量的低俗、不文明、语序不当或词不达意的词汇,或者,搜索词本身没有任何 问题,但作为个性推荐搜索词呈现在页面上可能因触犯用户隐私而让用户感到反感,使得 推荐模块的质量较低,影响各个推荐模块的用户体验。 在实现本发明的过程中,发明人发现:现有技术中主要通过对搜索词进行过滤以 滤除不适合推荐的搜索词,但现有技术中的过滤手段主要基于黑白名单机制,即不区分推 荐场景,只要属于白名单,就认定为可推荐,只要属于黑名单,就认定为不可推荐。这样通过 不区分推荐场景的非黑即白的过滤方法对搜索词进行推荐,推荐准确性较差,影响用户体 验。
技术实现要素:
有鉴于此,本公开实施例提出了一种信息的处理方法、装置、存储介质及电子设 备,用以解决现有技术的如下问题:现有方法不能区分使用场景对搜索词进行推荐,推荐准 确性较差,影响用户体验。 一方面,本公开实施例提出了一种信息的处理方法,其包括: 基于历史数据,提取特征属性; 基于所述特征属性,构建敏感关键词的集合; 将所述敏感关键词的集合中的敏感关键词通过预定模型进行过滤。 在一些实施例中,所述基于历史数据,提取特征属性包括: 基于历史数据,确定疑似敏感词; 从所述疑似敏感词中提取所述特征属性; 其中,所述疑似敏感词通过以下方式中的至少一种确定: 所述疑似敏感词的含义; 与所述疑似敏感词相关联的搜索结果。 在一些实施例中,所述基于所述特征属性,构建敏感关键词的集合包括: 通过词频-逆文本频率指数策略和/或随机游走策略计算获取与所述特征属性相 关联的所有敏感关键词; 确定所述敏感关键词的类型; 基于所述敏感关键词的类型构建所述敏感关键词的集合。 在一些实施例中,所述将所述敏感关键词的集合中的敏感关键词通过预定模型进 4 CN 111723280 A 说 明 书 2/12 页 行过滤包括: 根据所述敏感关键词的类型构建预定模型; 将所述敏感关键词通过所述预定模型进行过滤。。 另一方面,本公开实施例提供了一种信息的处理装置,其包括: 提取模块,用于基于历史数据,提取特征属性; 构建模块,用于基于所述特征属性,构建敏感关键词的集合; 过滤模块,用于将所述敏感关键词的集合中的敏感关键词通过预定模型进行过 滤。 在一些实施例中,所述提取模块具体包括: 第一确定单元,用于基于历史数据,确定疑似敏感词; 提取单元,用于从所述疑似敏感词中提取所述特征属性; 其中,所述疑似敏感词通过以下方式中的至少一种确定: 所述疑似敏感词的含义; 与所述疑似敏感词相关联的搜索结果。 在一些实施例中,所述构建模块具体包括: 获取单元,用于通过词频-逆文本频率指数策略和/或随机游走策略计算获取与所 述特征属性相关联的所有敏感关键词; 第二确定单元,用于确定所述敏感关键词的类型; 第一构建单元,用于基于所述敏感关键词的类型构建所述敏感关键词的集合。 在一些实施例中,所述过滤模块具体包括: 第二构建单元,用于根据所述敏感关键词的类型构建预定模型; 过滤单元,用于将所述敏感关键词通过所述预定模型进行过滤。 另一方面,本公开实施例还提供了一种存储介质,存储有计算机程序,其特征在 于,所述计算机程序被处理器执行时实现如上所述方法的步骤。 另一方面,本公开实施例还提供了一种电子设备,至少包括存储器、处理器,所述 存储器上存储有计算机程序,其特征在于,所述处理器在执行所述存储器上的计算机程序 时实现如上所述方法的步骤。 本公开实施例基于搜索词的历史数据,提取搜索词的特征属性,并基于搜索词的 特征属性构建敏感关键词的集合,根据不同的推荐策略构建预定模型,从而对推荐搜索词 进行过滤,最终能够根据不同场景进行搜索词的推荐,推荐搜索词准确性较高,用户体验较 好。 附图说明 图1为本公开第一实施例提供的信息的处理方法的流程图; 图2为本公开第二实施例提供的信息的处理装置的结构示意图; 图3为本公开第四实施例提供的电子设备的结构示意图。
分享到:
收藏