logo好方法网

公平性算法决策方法及装置


技术摘要:
本发明公开了一种公平性算法决策方法及装置,其中,该方法包括以下步骤:在预设公平问题中确定敏感变量、公平性变量和剩余相关变量;将上述确定的变量映射到表征空间中,得到表征变量;将表征变量映射到结果空间;根据预设要求设计公平性正则项和预测损失函数,并得到  全部
背景技术:
机器学习领域现在越来越关注于算法的公平性问题,尤其是在决策系统之中。一 些没有设计好的算法可能会对某一类人群产生歧视。比如说被广泛用于美国司法体系的 COMPAS系统就会倾向于给黑人标记为高风险人群。 在一个真实的机器学习任务中,有部分变量实际上与算法的公平性无关,比如说 加州大学伯克利分校录取问题中的院系选择。这些变量往往是由每个个体预先选择完成, 一般称之为公平变量。基于这些变量,定义条件公平为,结果在给定这些公平变量的时候与 敏感变量独立。现存的公平性概念包括群体公平、个体公平以及一些基于因果图的公平性 概念。前两者往往忽略了公平变量的影响,而基于因果图的概念往往需要很强的假设因而 无法适用于大规模真实数据。 将条件独立转化成一个可以解决的正则项是主要的挑战点。相关技术大多集中在 公平性变量是类别变量且数量有限的情况,在这种情况下,可以先将整个数据集根据公平 变量分组再分别处理。但是这样的做法无法应用到连续的公平变量情况,会有一定局限性。 表征学习是机器学习领域常用的解决特定问题的办法,在公平性领域上也被广泛 使用,但是已有的基于表征学习的公平性算法都无法解决上述的条件公平。
技术实现要素:
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。 为此,本发明的一个目的在于提出一种公平性算法决策方法,该方法可以很容易 退化到传统的统计公平或者均等机会两种公平性概念。 本发明的另一个目的在于提出一种公平性算法决策装置。 为达到上述目的,本发明一方面实施例提出了公平性算法决策方法,包括以下步 骤:步骤S1,在预设公平问题中确定敏感变量、公平性变量和剩余相关变量;步骤S2,将所述 敏感变量、所述公平性变量和所述剩余相关变量根据预设表征函数映射到表征空间中,得 到表征变量,将表征变量根据预设预测函数映射到结果空间,得到预测函数;步骤S3,根据 预设公平性要求设计公平性正则项,根据预设预测任务设计预测损失函数,并得到综合损 失函数;步骤S4,根据所述综合损失函数对所述预设表征函数和所述预测函数进行对抗训 练,得到表征函数参数和预测函数参数;步骤S5,固定所述表征函数参数,微调所述预测函 数参数,迭代执行步骤S4直至综合损失函数收敛,确定最优预测函数参数;步骤S6,将所述 表征函数参数和所述最优预测函数参数应用测试环境中,输出公平决策结果。 本发明实施例的公平性算法决策方法,与相关技术的公平性概念相比,可以提供 更加广泛通用的条件公平概念,同时,还提出条件独立式的定义,将条件独立转化成可以优 化的正则项,并将正则项应用到表征学习框架下处理公平性问题,可以同时解决已有的统 3 CN 111582499 A 说 明 书 2/5 页 计公平和均等机会两种公平性概念。 另外,根据本发明上述实施例的公平性算法决策方法还可以具有以下附加的技术 特征: 进一步地,在本发明的一个实施例中,所述敏感变量为二值变量。 进一步地,在本发明的一个实施例中,通过对抗训练所述表征函数确定所述综合 损失函数中的公平性,通过对抗训练所述预测函数确定所述综合损失函数中的预测精准 度。 进一步地,在本发明的一个实施例中,所述公平性正则项与所述公平决策结果的 准确性成负相关。 为达到上述目的,本发明另一方面实施例提出了公平性算法决策装置,包括:确定 模块,用于在预设公平问题中确定敏感变量、公平性变量和剩余相关变量;映射模块,用于 将所述敏感变量、所述公平性变量和所述剩余相关变量根据预设表征函数映射到表征空间 中,得到表征变量,将表征变量根据预设预测函数映射到结果空间;损失函数模块,用于根 据公平性要求设计公平性正则项,根据预测任务设计预测损失函数,并得到综合损失函数; 对抗训练模块,用于根据所述综合损失函数对所述预设表征函数和所述预设预测函数进行 对抗训练,得到表征函数参数和预测函数参数;迭代模块,用于固定所述表征函数参数,微 调所述预测函数参数,迭代执行对抗训练模块直至综合损失函数收敛,确定最优预测函数 参数;测试模块,用于将所述表征函数参数和所述最优预测函数参数应用测试环境中,输出 公平决策结果。 本发明实施例的公平性算法决策装置,与相关技术的公平性概念相比,可以提供 更加广泛通用的条件公平概念,同时,还提出条件独立式的定义,将条件独立转化成可以优 化的正则项,并将正则项应用到表征学习框架下处理公平性问题,可以同时解决已有的统 计公平和均等机会两种公平性概念。 另外,根据本发明上述实施例的公平性算法决策装置还可以具有以下附加的技术 特征: 进一步地,在本发明的一个实施例中,所述敏感变量为二值变量。 进一步地,在本发明的一个实施例中,通过对抗训练所述表征函数确定所述综合 损失函数中的公平性,通过对抗训练所述预测函数确定所述综合损失函数中的预测精准 度。 进一步地,在本发明的一个实施例中,所述公平性正则项与所述公平决策结果的 准确性成负相关。 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。 附图说明 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得 明显和容易理解,其中: 图1为根据本发明一个实施例的公平性算法决策方法的流程图; 图2为根据本发明一个实施例的公平性算法决策方法中的具体对抗流程图; 4 CN 111582499 A 说 明 书 3/5 页 图3为根据本发明一个实施例的公平性算法决策装置的结构示意图。
分享到:
收藏