logo好方法网

模型训练方法、模型使用方法、计算机设备及存储介质


技术摘要:
本申请实施例公开了一种模型训练方法、计算机设备及存储介质,本申请实施例获取样本数据,根据所述样本数据获取已知信息和私有信息;根据所述已知信息生成第一类图像特征和向量特征,以及根据所述已知信息和私有信息生成第二类图像特征;通过预设的第一模型基于所述第  全部
背景技术:
随着人工智能(Artificial  Intelligence,AI)技术的快速发展,人工智能技术被 广泛的应用于各个领域,例如,在游戏娱乐领域,通过人工智能技术可以实现棋牌类游戏中 虚拟用户与真人之间的对局,且可以战胜最顶级的职业选手。而棋牌类游戏,经常是多人参 与,游戏参与方之间的手中棋牌信息是互不知晓的,因此,研发应用于牌类游戏的AI模型具 有更大的挑战。目前,主要基于深度神经网络(Deep  Neural  Network,DNN)和监督学习来实 现AI模型。然而,基于DNN和监督学习实现AI模型,需要大量优质的样本数据进行训练,而样 本数据的收集难度较高且耗时多,即使使用大量样本数据进行训练也无法保证AI模型的可 靠性,以及DNN和监督学习是基于每一方的数据单独进行AI模型的训练,无法充分的利用数 据,AI模型的准确性较差。
技术实现要素:
本申请实施例提供一种模型训练方法、计算机设备及存储介质,可以提高对模型 训练的可靠性和准确性。 第一方面,本申请实施例提供了一种模型训练方法,包括: 获取样本数据,根据所述样本数据获取已知信息和私有信息; 根据所述已知信息生成第一类图像特征和向量特征,以及根据所述已知信息和私 有信息生成第二类图像特征; 通过预设的第一模型基于所述第一类图像特征和向量特征,获取目标参与方执行 策略的第一预测值; 通过预设的第二模型基于所述第二类图像特征和向量特征,获取所述目标参与方 执行策略的第二预测值; 基于所述第一预测值和第二预测值对所述第一模型进行训练,得到训练后的第一 模型。 第二方面,本申请实施例还提供了一种模型使用方法,应用于服务器,所述模型为 采用权利要求上述的模型训练方法进行训练得到的模型,并部署在所述服务器中;所述方 法包括: 获取各个参与方的信息,根据所述各个参与方的信息生成目标类图像特征和目标 向量特征; 通过所述训练后的第一模型,根据所述目标类图像特征和所述目标向量特征获取 所述目标参与方执行策略的概率分布; 根据所述概率分布确定目标策略,控制所述目标参与方执行所述目标策略。 5 CN 111569429 A 说 明 书 2/20 页 第三方面,本申请实施例还提供了一种计算机设备,包括存储器和处理器,所述存 储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行本申请实施 例提供的任一种模型训练方法。 第四方面,本申请实施例还提供了一种存储介质,所述存储介质用于存储计算机 程序,所述计算机程序被处理器加载,以执行本申请实施例提供的任一种模型训练方法。 本申请实施例可以获取样本数据,根据样本数据获取已知信息和私有信息,根据 已知信息生成第一类图像特征和向量特征,以及根据已知信息和私有信息生成第二类图像 特征;然后通过预设的第一模型基于第一类图像特征和向量特征,获取目标参与方执行策 略的第一预测值,以及通过预设的第二模型基于第二类图像特征和向量特征,获取目标参 与方执行策略的第二预测值;此时可以基于第一预测值和第二预测值对第一模型进行训 练,得到训练后的第一模型。该方案可以通过第二模型基于私有信息得到的第二预测值,对 第一模型进行训练,使得第一模型的第一预测值逼近第二模型的第二预测值,该私有信息 能够大大加快模型的训练速度并提高性能,并且由于第二模型在基于私有信息的情况下得 到的第二预测值相对准确,因此,可以训练第一模型的第一预测值越准,提高了对模型训练 的可靠性和准确性。 附图说明 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于 本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附 图。 图1是本申请实施例提供的模型训练方法的流程示意图; 图2是本申请实施例提供的模型训练架构的示意图; 图3是本申请实施例提供的模型训练过程中手牌信息已知的示意图; 图4是本申请实施例提供的类图像特征和向量特征的示意图; 图5是本申请实施例提供的基于类图像特征和向量特征对模型进行训练的示意 图; 图6是本申请实施例提供的模型应用部署的示意图; 图7是本申请实施例提供的计算机设备的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏