logo好方法网

基于模糊对象语言概念格的个性化推荐方法


技术摘要:
本发明公开了一种可解决推荐解释模糊及冷启动问题且可避免信息缺失的基于模糊对象语言概念格的个性化推荐方法,按照如下步骤进行:数据处理,将收集到的训练数据集初始化成模糊对象语言形式背景;构造模糊对象语言概念及概念格;计算待推荐用户与其他用户间的评价差异  全部
背景技术:
形式概念分析(FCA)是Wille于1982年提出的一种基于形式背景分析概念层次结 构的方法。概念用满足某种闭包性质的外延和内涵刻画,形式背景中生成的所有概念构成 完备的概念格,用于刻画形式概念的层次结构关系并分析概念之间的泛化和特化关系。 用语言值表示定性概念,是人类思维的基础,既具有随机性,也具有模糊性。Zadeh 引入了语言变量的定义,并将其应用于近似推理;Xu等提出语言真值格蕴涵代数及语言真 值命题逻辑系统,体现出了自然语言中可比与不可比的特点;Xu等引入犹豫模糊语言术语 集,并提出了不同类型语言术语集的距离和相似性度量,将语言信息应用到多标准决策问 题中,使用语言值处理决策问题。在形式背景S=(U,A,I)中,通常用I(x,a)来描述对象x与 属性a之间的二元关系,但是这种二元关系只能用1或0来表示,具有一定的局限性。而人们 进行数据处理时,往往会用自然语言来描述对象与属性之间的二元关系。Xu等提出了一种 基于格值逻辑的语言真值概念格,用于处理不确定语言信息下的决策问题。Pei等针对一类 评价语言集,借鉴形式概念分析的学术思想,研究了该评价语言集的层次结构,通过评价语 言刻画对象的适合度,研究了评价语言值推理;Zou等基于下标对称的语言术语集,提出了 语言概念的形式背景,并设计一种基于语言概念的形式背景的语言概念知识约简算法;邹 丽等基于语言值直觉模糊代数和直觉模糊形式背景,提出了语言值直觉模糊概念格的模式 识别方法。 概念作为形式概念分析的基础,是自然界中事物本质的反应,它对一类事物进行 概括的表征。人们往往不能直接看透事物的本质,因此,人们认知的增长得益于概念的学 习,形式概念分析作为一种获取概念的方法,同样也被认为是进行认知学习的主要工具。张 文修和徐伟华从粒计算的观点对人类认知过程作了详细的研究,给出了认知的粒化描述和 新的认知模型;仇国芳等在两个完备格之间引入了外延内涵算子与内涵外延算子,构建了 概念粒计算系统;Yao等从认知信息学和粒计算的角度研究了概念学习的概念框架,并解释 了基于分层知识发现模型的概念学习;Xu等基于信息粒,在模糊数据集中构建了双向学习 系统,用于将模糊信息粒训练为充分、必要和充分必要模糊信息粒;Li等从认知计算的角度 讨论了基于粒计算与三支概念的概念学习;为了处理更复杂的数据并提高学习效率,Niu等 基于粒计算和信息融合的大数据和多源数据,研究了概念认知学习的并行计算技术。作为 一种新的机器学习方法,认知系统的研究已成为了学者们的热点研究问题。 随着计算机网络的高速发展,出现了信息爆炸与信息过载的问题。为了给用户提 供更多有效的信息,个性化推荐系统(PRS)应运而生。协同过滤算法其基本思想是通过计算 物品与物品或用户与用户之间的相似度,总结用户的历史数据,得出推荐结果。随着数据挖 掘技术的不断进步,关联规则已经逐步应用于PRS中,在关联规则挖掘算法中,Agrawal等提 5 CN 111597217 A 说 明 书 2/14 页 出的Apriori算法是最有影响力的关联规则挖掘算法,但是,由于Apriori算法采用的是逐 层搜索的迭代算法,因而会不断的扫描事务数据库,并且所挖掘出来的规则会出现大量冗 余,甚至会出现组合爆炸的可能。由于关联规则可以通过概念格父子概念的内涵关系来描 述,另外,概念中外延与内涵的闭合关系非常适合挖掘关联规则,因此,基于概念格的关联 规则挖掘算法得到了广泛的应用。谢志鹏和刘宗田分析了概念格与关联规则之间的提取关 系,提出了基于概念格的关联规则提取算法;强宇等说明了模糊概念格在知识发现中的应 用,提出了一种模糊概念格的构造算法;Wang等提出基于定量概念格的关联规则挖掘算法, 有效地避免了粗糙集中存在的组合爆炸的问题;Qian等在总结了几种典型的属性约简算法 的基础上,从决策表中提取关联规则,表明了概念格可以更好地实现关联规则挖掘过程中 的直观可视化。 但是,现有将基于概念格的关联规则提取算法应用于推荐系统还存在推荐解释模 糊及冷启动的问题,此外,由于概念格仍然不能处理语言信息,容易造成信息缺失。
技术实现要素:
本发明是为了解决现有技术所存在的上述技术问题,提供一种可解决推荐解释模 糊及冷启动问题且可避免信息缺失的基于模糊对象语言概念格的个性化推荐方法。 本发明的技术解决方案是:一种基于模糊对象语言概念格的个性化推荐方法,按 照如下步骤进行: A数据采集与预处理: A1.设定语言术语集为S={sα|α=-τ,…,-1,0,1,…,τ},物品集为L={l1,l2,…, ln},用户集为U={x1,x2,…,xm},所述n为物品总个数,m为用户总个数; A2.收集用户xr使用语言值sα描述物品li的语言概念 xr∈U,li∈L,语言概念集 为 初始化用户集U与语言概 念集 的模糊对象语言形式背景 作为训练集,λ∈[0,1]为用户与语言概念间 的信任度水平, 为用户集U到语言概念集 的模糊二元关系,即 A3.基于用户集U与语言概念 的模糊对象语言形式背景,利用用户集 和 语言概念集 上定义运算: 构造用户集U与语言概念集 的模糊对象语言概念及概念格; B.计算待推荐用户与其他用户间的评价差异:λ∈[0,1],xj ,xr ,xo∈U, 和 分别表示模糊对象语言形式背景 上对象xj,xr在同一个语言 概念 上的λ取值, 和 距离如下: 6 CN 111597217 A 说 明 书 3/14 页 其中, 用户xj和xr之间的距离如下: 其中,2τ 1是同类属性下的语言概念的项数,同类属性下的语言概念的集合分别 为O、P和Q,wai是每类属性所占的权重, 且 C.根据待推荐用户与其他用户间的评价差异对训练数据集进行初步处理:找到与 目标用户最相似的前K个用户,使U k={x 1 ,x 2 ,… ,x k},在模糊对象语言形式背景 的基础上构造训练数据集 D.认知阶段: D 1 .基于训练数据集 利用G算子和H模糊算子上定义运算 构造训练数据集 的认知系统; D2.基于训练数据集 利用模糊对象集 和语言概念B∈L2上 定义运算 构造训练数据集 的充分知识库K1及K1构成的 模糊对象语言知识拟格; D3 .基于训练数据集 利用模糊对象集 和语言概念B∈L2上 定义运算: 构造训练数据集 的必要知识库K2及K2构成 的模糊对象语言知识拟格; E.个性化推荐阶段: E1.令 为 中的模糊对象语言概念,则内涵B的支持度按下式计 算: 通过Supp(B)≥minSupp(B),计算频繁模糊对象语言概念和频繁模糊对象语言知 识 所述minSupp(B)为最小支持度阈值; E2.通过满足泛化与特化关系的频繁模糊对象语言概念 和 计算 模糊对象语言关联规则 E3.令 和 为 中的两个模糊对象语言概念,计算模糊 对象语言关联规则 的支持度、置信度和提升度 7 CN 111597217 A 说 明 书 4/14 页 通过 计算满足阈值条件的模糊对象语言关 联规则 所述 为模糊对象语言关联规则的最小支 持度阈值, 为模糊对象语言关联规则的最小置信度阈值; E4 .将满足阈值条件的模糊对象语言关联规则 加入推荐规则库Ω (xi),并按照Ω(xi)中模糊对象语言关联规则的置信度降序排列,对不同用户输出不同的推 荐列表。 本发明基于模糊对象语言概念格,描述了对象与语言概念之间的联系,表明了概 念之间的泛化和例化关系,所形成的Hasse图实现了对模糊数据的可视化,从而有效解决了 个性化推荐系统中推荐解释模糊的缺点,此外,还考虑了每个用户的认知过程,克服了个性 化推荐系统中的冷启动问题,将语言值加入到关联规则中去,更加符合人类的正常思维,避 免了信息缺失,增加了个性化推荐系统中推荐过程的准确率。 附图说明 图1为本发明实施例模糊对象语言概念格 的结构图。 图2为本发明实施例部分K1构成的模糊对象语言知识拟格的结构图。 图3为本发明实施例部分K2构成的模糊对象语言知识拟格的结构图。 图4为本发明实施例模糊对象语言概念格 的结构图。 图5为本发明实施例基于模糊对象语言概念格的个性化教学资源推荐系统的结构 图。 图6为本发明实施例minSupp(B)=0.25时,部分K1构成的模糊对象语言知识的结 构图。 图7为本发明实施例minSupp(B)=0.25时,部分K2构成的模糊对象语言知识的结 构图。 图8为本发明实施例minSupp(B)=0.25时,模糊对象语言概念 8 CN 111597217 A 说 明 书 5/14 页 的结构图。
分享到:
收藏