模型训练方法、模型使用方法、计算机设备及存储介质-好方法网

技术摘要：
本申请实施例公开了一种模型训练方法、计算机设备及存储介质，本申请实施例获取样本数据，根据所述样本数据获取已知信息和私有信息；根据所述已知信息生成第一类图像特征和向量特征，以及根据所述已知信息和私有信息生成第二类图像特征；通过预设的第一模型基于所述第全部
背景技术：
随着人工智能(Artificial Intelligence，AI)技术的快速发展，人工智能技术被广泛的应用于各个领域，例如，在游戏娱乐领域，通过人工智能技术可以实现棋牌类游戏中虚拟用户与真人之间的对局，且可以战胜最顶级的职业选手。而棋牌类游戏，经常是多人参与，游戏参与方之间的手中棋牌信息是互不知晓的，因此，研发应用于牌类游戏的AI模型具有更大的挑战。目前，主要基于深度神经网络(Deep Neural Network，DNN)和监督学习来实现AI模型。然而，基于DNN和监督学习实现AI模型，需要大量优质的样本数据进行训练，而样本数据的收集难度较高且耗时多，即使使用大量样本数据进行训练也无法保证AI模型的可靠性，以及DNN和监督学习是基于每一方的数据单独进行AI模型的训练，无法充分的利用数据，AI模型的准确性较差。
技术实现要素：
本申请实施例提供一种模型训练方法、计算机设备及存储介质，可以提高对模型训练的可靠性和准确性。第一方面，本申请实施例提供了一种模型训练方法，包括：获取样本数据，根据所述样本数据获取已知信息和私有信息；根据所述已知信息生成第一类图像特征和向量特征，以及根据所述已知信息和私有信息生成第二类图像特征；通过预设的第一模型基于所述第一类图像特征和向量特征，获取目标参与方执行策略的第一预测值；通过预设的第二模型基于所述第二类图像特征和向量特征，获取所述目标参与方执行策略的第二预测值；基于所述第一预测值和第二预测值对所述第一模型进行训练，得到训练后的第一模型。第二方面，本申请实施例还提供了一种模型使用方法，应用于服务器，所述模型为采用权利要求上述的模型训练方法进行训练得到的模型，并部署在所述服务器中；所述方法包括：获取各个参与方的信息，根据所述各个参与方的信息生成目标类图像特征和目标向量特征；通过所述训练后的第一模型，根据所述目标类图像特征和所述目标向量特征获取所述目标参与方执行策略的概率分布；根据所述概率分布确定目标策略，控制所述目标参与方执行所述目标策略。 5 CN 111569429 A 说　明　书 2/20 页第三方面，本申请实施例还提供了一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器调用所述存储器中的计算机程序时执行本申请实施例提供的任一种模型训练方法。第四方面，本申请实施例还提供了一种存储介质，所述存储介质用于存储计算机程序，所述计算机程序被处理器加载，以执行本申请实施例提供的任一种模型训练方法。本申请实施例可以获取样本数据，根据样本数据获取已知信息和私有信息，根据已知信息生成第一类图像特征和向量特征，以及根据已知信息和私有信息生成第二类图像特征；然后通过预设的第一模型基于第一类图像特征和向量特征，获取目标参与方执行策略的第一预测值，以及通过预设的第二模型基于第二类图像特征和向量特征，获取目标参与方执行策略的第二预测值；此时可以基于第一预测值和第二预测值对第一模型进行训练，得到训练后的第一模型。该方案可以通过第二模型基于私有信息得到的第二预测值，对第一模型进行训练，使得第一模型的第一预测值逼近第二模型的第二预测值，该私有信息能够大大加快模型的训练速度并提高性能，并且由于第二模型在基于私有信息的情况下得到的第二预测值相对准确，因此，可以训练第一模型的第一预测值越准，提高了对模型训练的可靠性和准确性。附图说明为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1是本申请实施例提供的模型训练方法的流程示意图；图2是本申请实施例提供的模型训练架构的示意图；图3是本申请实施例提供的模型训练过程中手牌信息已知的示意图；图4是本申请实施例提供的类图像特征和向量特征的示意图；图5是本申请实施例提供的基于类图像特征和向量特征对模型进行训练的示意图；图6是本申请实施例提供的模型应用部署的示意图；图7是本申请实施例提供的计算机设备的结构示意图。

相关推荐