logo好方法网

生成商品描述文本的方法及装置


技术摘要:
本发明实施例提供一种生成商品描述文本的方法及装置,该方法获取用户输入的N个关键词,将用户输入的第一个关键词输入至训练好的预设模型中,得到第一个关键词对应的第一目标文本,对于用户输入的第二个关键词至第N个关键词,按照用户输入顺序分别执行如下操作:将用户  全部
背景技术:
随着电子商务的不断发展,在电商行业中存在大量的场景,例如商品详情页、推荐 语和广告词等。不同的场景中,需要提供该商品对应的各种主题和风格的商品描述文本信 息,但是单靠人工撰写的方式,显然无法满足海量商品的需求。随着科学技术的不断发展, 自动生成商品描述文本的软件也越来越多。 目前,自动生成商品描述文本的方式主要是采用基于检索的文本生成:首先收集 相关的文本,并建立倒排索引,用户输入关键词后依次从倒排索引中检索出对应的句子,将 每个关键词检索出的句子组合到一起形成该商品的商品描述文本。 然而,发明人发现上述现有技术中至少存在如下问题:通过相同的关键词检索出 来的内容一样,导致生成的描述文本类似,描述文本缺乏多样性。
技术实现要素:
本发明提供一种生成商品描述文本的方法及装置,通过相同的关键词能够生成不 同的商品描述文本,提高生成的商品描述文本的多样性。 获取用户输入的N个关键词,其中N为正整数; 将用户输入的第一个关键词输入至训练好的预设模型中,得到所述第一个关键词 对应的第一目标文本,其中所述训练好的预设模型的目标函数中包括至少一个惩罚项,所 述至少一个惩罚项用于在所述目标函数中降低目标关键词对应输出的概率最高的目标文 本的得分,其中所述目标关键词为所述N个关键词中的任一个; 对于用户输入的第二个关键词至第N个关键词,按照用户输入顺序分别执行如下 操作:将用户输入的第n个关键词和第一目标文本至所述第n-1目标文本输入至所述训练好 的预设模型中,得到所述第n个关键词对应的第n目标文本,其中所述n为自然数,取值范围 为2≤n≤N; 根据得到的所述N个关键词分别对应的第一目标文本至第N目标文本,确定所述N 个关键词对应的商品描述文本。 可选地,所述方法还包括: 建立初始模型,其中所述初始模型为神经网络模型; 获取已经存在的商品描述的文本,从已经存在的商品描述的文本的每句话中提取 出关键词; 在每一次训练过程中,将提取的目标关键词以及所述目标关键词之前的描述文本 输入至所述初始模型中,通过初始模型的编码器进行编码,其中所述初始模型的解码器输 出的结果记为已经存在的商品描述的文本,其中所述目标关键词为所述N个关键词中的任 4 CN 111597326 A 说 明 书 2/13 页 一个; 训练调整训练中的初始模型的各权重的值,当初始模型的整体误差小于预设阈值 时停止训练; 将停止训练后的初始模型的确定为训练好的预设模型。 可选地,在每一次训练过程中,将提取的目标关键词以及所述目标关键词之前的 描述文本按照attention机制分别设置对应的权重。 可选地,所述预设模型的目标函数为: 其中,S为目标关键词,为目标关键词对应的目标文本,P(T|S)为目标关键词出现 文本T的概率,P(T)为文本T出现的概率;logP(T)为所述惩罚项。 可选地,所述惩罚项logP(T)包含控制所述惩罚项的超参数λ,相应的所述预设模 型的目标函数为: 可选地,所述训练好的预设模型为根据第一目标函数改进的seq2seq模型,其中所 述第一目标函数为: 式中,惩罚项: 权重: 其中,S为目标关键词,为目标关键词对应的目标文本,Lt为所述文本T的单词的 总数量,i为单词索引,P(ti|t1,t2,...,tI)为文本T中出现单词ti的概率,λ为控制所述惩罚 项的超参数,γ为惩罚阈值。 可选地,所述训练好的预设模型为根据第二目标函数改进的seq2seq模型,其中所 述第二目标函数为: 其中,S为目标关键词;为目标关键词对应的目标文本;P(T|S)为目标关键词出现 文本T的概率;P(S|T)为惩罚项,表示文本T基础上产生目标关键词的概率。 可选地,所述根据所述N个关键词分别对应的第一文本至第N文本,得到所述N个关 键词对应的商品描述文本之后,还包括: 获取所述商品描述文本的困惑度,若所述困惑度小于预设困惑度阈值,则将所述 商品描述文本发送至对应用户的客户端,其中所述困惑度为第一文本至第N文本在所述商 品描述文本中出现的概率之和。 第二方面,本发明提供一种生成商品描述文本的装置,包括: 获取模块,用于获取用户输入的N个关键词,其中N为正整数; 模型处理模块,用于将用户输入的第一个关键词输入至训练好的预设模型中,得 到所述第一个关键词对应的第一目标文本,其中所述训练好的预设模型的目标函数中包括 至少一个惩罚项,所述至少一个惩罚项用于在所述目标函数中降低目标关键词对应输出的 概率最高的目标文本的得分,其中所述目标关键词为所述N个关键词中的任一个;对于用户 输入的第二个关键词至第N个关键词,按照用户输入顺序分别执行如下操作:将用户输入的 5 CN 111597326 A 说 明 书 3/13 页 第n个关键词和第一目标文本至所述第n-1目标文本输入至所述训练好的预设模型中,得到 所述第n个关键词对应的第n目标文本,其中所述n为自然数,取值范围为2≤n≤N; 商品描述文本生成模块,用于根据得到的所述N个关键词分别对应的第一目标文 本至第N目标文本,确定所述N个关键词对应的商品描述文本。 第三方面,本发明提供一种生成商品描述文本的设备,包括:至少一个处理器和存 储器; 所述存储器存储计算机执行指令; 所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个 处理器执行如第一方面任一项所述的生成商品描述文本的方法。 第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存 储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述 的生成商品描述文本的方法。 本发明实施例提供的生成商品描述文本的方法及装置,该方法获取用户输入的N 个关键词,其中N为正整数;将用户输入的第一个关键词输入至训练好的预设模型中,得到 第一个关键词对应的第一目标文本,其中训练好的预设模型的目标函数中包括至少一个惩 罚项,至少一个惩罚项用于在目标函数中降低目标关键词对应输出的概率最高的目标文本 的得分,其中目标关键词为N个关键词中的任一个,对于用户输入的第二个关键词至第N个 关键词,按照用户输入顺序分别执行如下操作:将用户输入的第n个关键词和第一目标文本 至所述第n-1目标文本输入至所述训练好的预设模型中,得到所述第n个关键词对应的第n 目标文本,其中所述n为自然数,取值范围为2≤n≤N;根据得到的所述N个关键词分别对应 的第一目标文本至第N目标文本,确定所述N个关键词对应的商品描述文本。由于训练好的 预设模型的目标函数中包括至少一个惩罚项,至少一个惩罚项用于在目标函数中降低目标 关键词对应输出的概率最高的目标文本的得分,使得相同的关键词能够输出不同的能够生 成不同的目标文本,根据N个关键词得到不同的商品描述文本,提高生成的商品描述文本的 多样性。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。 图1为本发明实施例提供的生成商品描述文本系统的架构示意图; 图2为本发明实施例提供的生成商品描述文本的方法的流程图一; 图3为本发明实施例提供的生成商品描述文本的方法的流程图二; 图4为本发明实施例提供的生成商品描述文本的装置的结构示意图一; 图5为本发明实施例提供的生成商品描述文本的装置的结构示意图二; 图6为本发明实施例提供的生成商品描述文本的设备的硬件结构示意图。 6 CN 111597326 A 说 明 书 4/13 页
下载此资料需消耗2积分,
分享到:
收藏