技术摘要:
本申请实施例公开了一种对象集合筛选的实现方法、装置、设备以及存储介质,涉及大数据处理和人工智能技术领域。具体实现方案为:获取初始对象集合;其中,所述初始对象集合中包括至少两个对象;基于强化学习的序列决策算法中的筛选策略,对所述初始对象集合执行对象筛 全部
背景技术:
广告检索系统,是一个针对特定流量拉取所有满足要求的候选广告,并进行广告 位竞价的系统。当候选广告太多时,广告检索系统不会让所有候选广告都参与竞价,而是在 竞价前不同阶段对候选广告进行排序、截断、去重等操作,以从候选广告集合中筛选子集再 进行竞价,以平衡性能和效果。这样的广告检索系统可称为漏斗检索系统。 在漏斗式检索系统中,排序、截断、去重可以看成是一种典型的最优子集选择过 程,优化目标是在漏斗的各个阶段所选择的广告子集,经展现后的收益期望最大化。漏斗筛 选操作可以是一次或多次,从而构成多级漏斗检索系统。 目前的漏斗检索系统中,对子集的筛选规则单一,往往对场景的适用专属强,不具 备通用性,在场景或外围影响因素变化时,需要进行较大调整。
技术实现要素:
本申请实施例提供了一种对象集合筛选的实现方法、装置、设备以及存储介质。 根据第一方面,提供了一种对象集合筛选的实现方法,包括: 获取初始对象集合;其中,所述初始对象集合中包括至少两个对象; 基于强化学习的序列决策算法中的筛选策略,对所述初始对象集合执行对象筛选 操作,以形成目标对象集合;其中,所述初始对象集合和/或所述对象筛选操作的数量为两 个以上,以形成至少两个所述目标对象集合; 获取将各所述目标对象集合在运行环境中实施而获得的收益; 根据各所述目标对象集合之间的收益差异,对形成各所述目标对象集合的筛选策 略进行更新。 根据第二方面,提供了一种对象集合筛选的实现装置,包括: 初始对象集合获取模块,用于获取初始对象集合;其中,所述初始对象集合中包括 至少两个对象; 目标对象集合筛选模块,用于基于强化学习的序列决策算法中的筛选策略,对所 述初始对象集合执行对象筛选操作,以形成目标对象集合;其中,所述初始对象集合和/或 所述对象筛选操作的数量为两个以上,以形成至少两个所述目标对象集合; 收益获取模块,用于获取将各所述目标对象集合在运行环境中实施而获得的收 益; 筛选策略更新模块,用于根据各所述目标对象集合之间的收益差异,对形成各所 述目标对象集合的筛选策略进行更新。 根据第三方面,提供了一种电子设备,包括: 至少一个处理器;以及 7 CN 111598616 A 说 明 书 2/13 页 与所述至少一个处理器通信连接的存储器;其中, 所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一 个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所提供的对象集合筛 选的实现方法。 根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所 述计算机指令用于使所述计算机执行本申请任意实施例所提供的对象集合筛选的实现方 法。 根据本申请实施例的技术,解决了集合筛选过程决策的通用性问题。 应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特 征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。 附图说明 附图用于更好地理解本方案,不构成对本申请的限定。其中: 图1为本申请实施例一提供的一种对象集合筛选的实现方法的流程示意图; 图2A为本申请实施例二提供的一种对象集合筛选的实现方法的流程示意图; 图2B为本申请实施例所适用的筛选过程示意图; 图3A为本申请实施例三提供的一种对象集合筛选的实现方法的流程示意图; 图3B为本申请实施例所采用的在线和离线系统架构示意图; 图4为本申请实施例四提供的一种对象集合筛选的实现装置的结构示意图; 图5是用来实现本申请实施例的对象集合筛选的实现方法的电子设备的框图。