学习笔记,仅供参考,有错必纠

关键词:公平性学习 , 分类间隔 , 目标集 , 加权距离度量 , 歧视性


公平性机器学习中基于分类间隔的歧视样本发现和消除算法

摘要

公平性学习是机器学习领域的研究热点 , 预防歧视的目的在于执行预测任务之前消除不公平训练集对于分类器的影响.为了保证分类公平性和准确性 , 本文通过发现和消除原始数据集中的歧视样本寻找生成公平数据集的方法 , 即提出了一种基于分类间隔的加权方法用于处理二分类任务中的歧视现象 , 并在 demographic parity和equalized odds公平性判定准则上实现分类公平.

为了不影响分类准确性 , 本文基于最大间隔原理将样本投影之后选出目标集 , 对于目标集中的每个样本 , 通过加权距离度量方法判定该样本是否具有歧视性 , 并进行修正 .

通过在 3 个真实数据集上与已有方法进行实验对比 , 本文的方法能够获得更好的分类公平性和准确性 , 并且不局限于特定的公平性判定准则和分类器.

引言

近年来 , 机器学习越来越受到各界人士的关注 . 然而 , 机器学习系统容易受到历史数据的影响 , 并对少数群体、弱势群体和历史上处于不利地位的群体产生歧视行为 . 因此 , 有必要使用公平性准则来约束机器学习系统在某些应用场景中的行为 , 例如贷款、就业、刑事司法和广告 , 并期望保护弱势群体 , 从而在分类公平性和准确性之间达到一个平衡.

目前 , 机器学习公平性的研究成果大致归为以下 3 大类:

  • 第 1 类方法通过数据预处理消除歧视样本 . 主要策略是通过修改训练集来平衡

文献记录(part69)--公平性机器学习中基于分类间隔的歧视样本发现和消除算法相关推荐

  1. 文献记录(part54)--软件缺陷预测中基于聚类分析的特征选择方法

    学习笔记,仅供参考,有错必究 关键词:软件质量保障:缺陷预测:数据挖掘:特征选择:聚类分析 软件缺陷预测中基于聚类分析的特征选择方法 摘要 软件缺陷预测通过挖掘软件历史仓库 , 构建缺陷预测模型来预测 ...

  2. php 项目反应理论,科学网—好文 | 纽约石溪大学:机器学习中基于项目反应理论的集成学习 - 陈培颖的博文...

    机器学习中,研究者们对分类集成的关注与日俱增,尤其关注分类精度的提升.IJAC近期发表了来自纽约石溪大学研究者的最新成果,该研究基于项目反应理论,提出一种加权投票方法---基于IRT理论的集成学习算法 ...

  3. 机器学习中的分类模型整理

    概要 机器学习中的分类模型有逻辑回归.朴素贝叶斯.决策树.支持向量机.随机森林.梯度提升树等分类算法,不仅可以进行二分类,还可以进行多分类. 一.逻辑回归 逻辑回归的本质就由线性回归演变而来,是一个线 ...

  4. ML之分类预测:机器学习中多分类预测数据集可视化(不同类别赋予不同颜色)设计思路及代码实现

    ML之分类预测:机器学习中多分类预测数据集可视化(不同类别赋予不同颜色)设计思路及代码实现 目录 机器学习中多分类预测数据集可视化(不同类别赋予不同颜色)设计思路及代码实现 代码实现

  5. 炼数成金数据分析课程---16、机器学习中的分类算法(交叉内容,后面要重点看)...

    炼数成金数据分析课程---16.机器学习中的分类算法(交叉内容,后面要重点看) 一.总结 一句话总结: 大纲+实例快速学习法 主要讲解常用分类算法(如Knn.决策树.贝叶斯分类器等)的原理及pytho ...

  6. 机器学习中的分类算法

    机器学习中的分类算法 机器学习,模式识别中很重要的一环,就是分类,因为计算机其实无法深层次地理解文字图片目标的意思,只能回答是或者不是.当然现在卷积神经网络正在希望计算机能够看懂东西,这次我们先来看一 ...

  7. 02.PyTorch基础操作(3-1 机器学习中的分类与回归问题-机器学习基本构成元素)

    @[TOC](02.PyTorch基础操作(3-1 机器学习中的分类与回归问题-机器学习基本构成元素)) 来自慕课网 一.3-1 机器学习中的分类与回归问题-机器学习基本构成元素

  8. 【机器学习】基于奇异值分解(SVD)的协同过滤推荐算法及python实现

    [机器学习]基于奇异值分解(SVD)的协同过滤推荐算法及python实现 一.协同过滤推荐算法 1.1.协同过滤算法的分类 1.2.相似度的度量 1.3.商品评分的预测 二.奇异值分解(SVD)在协同 ...

  9. 机器学习中的分类距离

    https://www.toutiao.com/a6710061523777094151/ 生活中,距离通常是用于形容两个地方或两个物体之间的远近.在人工智能机器学习领域,常使用距离来衡量两个样本之间 ...

最新文章

  1. 第十五届全国大学生智能汽车竞赛-室外光电ROS组预赛方案
  2. Vitamio FAQ(2012-11-20 )
  3. extjs4:代码实现comboBox选中事件
  4. java 时间处理_JAVA处理日期时间常用方法
  5. docker运行我们的容器
  6. gRPC服务注册发现及负载均衡的实现方案与源码解析
  7. zabbix4.0LTS安装配置
  8. IntelliJ IDEA安装AngularJS插件
  9. 再见了Antirez永远的Redis之神
  10. reactjs前端实现文件新窗口下载
  11. CORBA 架构体系指南(通用对象请求代理体系架构)​
  12. 教育培训行业现状分析
  13. 学了点技术,我要开始装X了
  14. IC验证培训——实战SV验证学习(lab1)
  15. 安卓 7.0 无法获取外置SD卡问题解决方案 | Failed to find configured root that contains
  16. mdb java_java从mdb文件中读出数据
  17. 金额转换成大写和简称的方法
  18. ctf_BUUCTF_web(1)
  19. 怎样看待比自己强的人
  20. java使用itextpdf生成pdf并填充自定义数据

热门文章

  1. 机器学习:正则化原理总结
  2. Transifex与GTK文档翻译, Linux镜像文件, 外设接口杂谈
  3. 【机器学习】线性回归之Normal Equation(矩阵求导与线性代数视角)
  4. 代码雨代码源复制_小程序基于Parser添加长按复制、代码高亮等功能
  5. 中国人工智能产业发展联盟成立 360任副理事长单位
  6. 跟着太白老师学python 09day 初识函数
  7. Linux部署web程序
  8. How do I get the lowest value of all the non zero value pixels?
  9. 《xUnit Test Patterns》学习笔记4 - Principles of Test Automation
  10. 典型的简单权限分配系统方法介绍