神经网络模型的训练方法和装置-好方法网

技术摘要：
本申请涉及人工智能领域，公开了神经网络模型的训练方法和装置。方法包括：基于第一样本数据集构建训练数据集，利用训练数据集训练目标神经网络模型，得到初始的当前基准模型；获取第二样本数据集，执行多次迁移训练操作；迁移训练操作包括：从第二样本数据集中采样出全部
背景技术：
随着人工智能技术和数据存储技术的发展，深度神经网络在许多领域的任务中取得了重要的成果。而神经网络模型的性能依赖于大量的样本数据。样本数据的质量和数量直接影响训练的效率和模型的精度。目前的样本数据集构建方法主要是通过收集大量的原始数据、对原始数据进行预处理、标注等操作来生成用于训练的样本数据。样本数据主要是人工设定的，且未对样本数据的质量和有效性进行评估，基于此训练神经网络模型的效率和模型的精度有待提升。
技术实现要素：
本公开的实施例提供了神经网络模型的训练方法和装置、电子设备以及计算机可读存储介质。根据第一方面，提供了一种神经网络模型的训练方法，包括：基于第一样本数据集构建训练数据集，利用训练数据集训练目标神经网络模型，得到初始的当前基准模型；获取第二样本数据集，执行多次迁移训练操作；迁移训练操作包括：从第二样本数据集中采样出至少一个第二样本数据组；分别预测将各第二样本数据组合并至目标神经网络模型的训练数据集后对应的当前基准模型的性能增量；选择对应的性能增量最大的一个第二样本数据组添加至训练数据集中得到更新后的训练数据集，并将基于更新后的训练数据集训练得到的训练后基准模型更新为新的当前基准模型，删除第二样本数据集中被添加至训练数据集中的第二样本数据组。根据第二方面，提供了一种神经网络模型的训练装置，包括：训练单元，被配置为基于第一样本数据集构建训练数据集，利用训练数据集训练目标神经网络模型，得到初始的当前基准模型；迁移单元，被配置为获取第二样本数据集，执行多次迁移训练操作；迁移单元包括：采样单元，被配置为执行迁移训练操作中的如下步骤：从第二样本数据集中采样出至少一个第二样本数据组；预测单元，被配置为执行迁移训练操作中的如下步骤：分别预测将各第二样本数据组合并至目标神经网络模型的训练数据集后对应的当前基准模型的性能增量；更新单元，被配置为执行迁移训练操作中的如下步骤：选择对应的性能增量最大的一个第二样本数据组添加至训练数据集中得到更新后的训练数据集，并将基于更新后的训练数据集训练得到的训练后基准模型更新为新的当前基准模型，删除第二样本数据集中被添加至训练数据集中的第二样本数据组。根据第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行第一方面提供的神经网络模型的训练方 4 CN 111582477 A 说　明　书 2/9 页法。根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行第一方面提供的神经网络模型的训练方法。根据本申请的方法可以提升目标神经网络模型的性能。应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：图1是本公开的神经网络模型的训练方法的一个实施例的流程图；图2是本公开的神经网络模型的训练方法的另一个实施例的流程图；图3是本公开的神经网络模型的训练装置的一个实施例的结构示意图；图4是用来实现本公开的实施例的神经网络模型的训练方法的电子设备的框图。

相关推荐