Pymetrics开源公平性感知机器学习算法Audit AI
Pymetrics是一件专注于向企业提供招聘服务的初创企业。最近,Pymetrics在Github上开源了企业使用的偏差检测(bias detection)算法,称为“Audio AI”。Audit AI用于降低存在于训练数据集中的判别模式。这些判别模式会改进或影响机器学习算法在选取总体上的概率。
\\
现在,越来越多的工作任务借助于机器学习实现过程自动化。重要的是应确保这些算法不会产生可从中不当受益的偏差。Pymetrics一直致力于确保机器学习算法的公平性。
\\
\
我们研究的总体目标,就是提出一种合理的考虑问题方式,使机器学习算法更公平。即便识别了训练数据集中存在的偏差,使用该训练集训练的机器学习算法并不足以解决其中的判别问题。当前,越来越多的决策使用人工智能自动做出。人们需要理解并识别算法的公平或偏差程度,这是朝正确方向迈出的一步。
\
\\
企业对多样性的关注与日俱增。一些人担心算法学习偏差的方式事实上可能会破坏这些多样性努力。最近,法国宣布希望成为能在国际舞台占有一席之地的人工智能强国。今年三月,法国总统Emmanuel Macron发布了人工智能国家战略,其中包括在未来五年内支出18.5亿美元,发展可与硅谷和中国竞争的生态系统。总统做出如此层次的AI投资,这无疑是经过了仔细的考虑:
\\
\
我认为AI完全可能危及民主。例如,我们正在使用人工智能来组织学生访问大学,对算法委以重任。很多人认为算法是一个黑箱,他们并不明白选取学生的过程是如何发生的。但当他们开始明白这依赖于某种算法时,算法就具有了特定的责任。要避免争议的发生,必须为算法创造公平性和完全透明性的条件。这样的算法中并不存在偏见,至少不存在歧视性偏见,我对此充满信心。
\
\\
对于法国而言,“公平”的算法可确保在性别、年龄及其它个体特征上不存在偏见。如果算法中并未建立公平性和透明度,那么Macron总统预计“人们最终会拒绝这种创新”。
\\
Pymetrics的客户包括消费品企业、技术企业和研究企业。Pymetrics提供的部分产品是为应聘候选者给出了一套参与性游戏。这些游戏通常完成于招聘的前期过程,完全不考虑应聘者的种族、性别和教育水平等个体特征,而是基于应聘者的记忆、对风险的态度等近80个特征做出评估。之后,Pymetrics就能够针对已有的最佳表现者对应聘者做出评定,预测应聘者在应聘职位上可能的未来表现。
\\
出于社会责任上的考虑,Pymetrics选择开源Audit AI。Pymetrics的产品负责人Priyanka Jain给出了解释:
\\
\
作为技术的创造者,我们十分强烈地感受到,我们的责任就是构建人工智能,努力创造一个人人希望生活于其中的未来。如果我们可以为其他技术创造者继续构建特性提供帮助,那么我们责无旁贷应做出共享。
\
\\
在Audit AI的Github代码库中,开发人员可以看到一个用于实现上述“公平”的机器学习算法的Python软件库,该软件库是基于pandas和sklearn构建的。此外,代码库还给出了两个示例数据集,场景分别涉及德国的学分和学生的成绩。
\\
查看英文原文: Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms
Pymetrics开源公平性感知机器学习算法Audit AI相关推荐
- 轻量级大规模机器学习算法库Fregata开源:快速,无需调参
作者:张夏天,TalkingData首席数据科学家.12年大规模机器学习和数据挖掘经验,对推荐系统.计算广告.大规模机器学习算法并行化.流式机器学习算法有很深的造诣:在国际顶级会议和期刊上发表论文12 ...
- 【机器学习】新手必看的十种机器学习算法
在神经网络的成功的带动下,越来越多的研究人员和开发人员都开始重新审视机器学习,开始尝试用某些机器学习方法自动解决可以轻松采集数据的问题.然而,在众多的机器学习算法中,哪些是又上手快捷又功能强大.适合新 ...
- 使用机器学习算法在 .NET Core 中运行的 100% C# 开源 AI 聊天机器人平台构建器...
简介 BotSharp是一个用于 AI Bot 平台构建器的开源机器学习框架.该项目涉及自然语言理解.计算机视觉和音频处理技术,旨在推动智能机器人助手在信息系统中的开发和应用.开箱即用的机器学习算法让 ...
- 机器学习算法易受攻击?阿里“安全基建”这样应对AI的不安全
出品 | AI科技大本营(ID:rgznai100) 数字基建的浪潮之下,诸多行业领域都在加速融合5G.大数据中心.AI等新技术,向数字化转型.近日,多位全国政协委员.院士和安全行业专家提出,应尽快出 ...
- AI加速器与机器学习算法:协同设计与进化
作者|Shashank Prasanna 翻译|胡燕君 此刻,你应该是在电脑或手机上看这篇文章.不管怎样,这些机器都属于现代计算机,它们都有中央处理器(CPU)和其他为特定功能服务的专用芯片,例如显卡 ...
- 发布AI操作系统、应用市场,开源机器学习数据库和AI操作系统内核,第四范式这波操作有点秀!
"AI的发展经历了'高期望--能否落地--落地是否有用"等多次潮起潮落.今天,AI的价值再次引发一些讨论和怀疑." 第四范式创始人兼首席执行官戴文渊在近日举行的新品发布会 ...
- 【活动打卡】【Datawhale】第16期 机器学习算法梳理(AI入门体验) Task02:基于决策树的分类预测
1.决策树的介绍和应用 1.1 决策树的介绍 决策树是一种常见的分类模型,在金融风控.医疗辅助诊断等诸多行业具有较为广泛的应用.决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本 ...
- 机器学习算法系列(一)- 感知器学习算法(PLA)
阅读本文需要的背景知识点:数学基础知识.一丢丢编程知识 一.引言 前面一节我们了解了机器学习算法系列(〇)- 基础知识,接下来正式开始机器学习算法的学习,首先我们从最简单的一个算法--感知器学习算 ...
- 阿里云机器学习平台PAI+AI开源项目测评来啦
一.背景介绍 阿里AI(阿里灵杰)依托阿里领先的云基础设施.大数据和AI工程能力.场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系.帮助提升AI应用开发效率,促进AI在产业中 ...
最新文章
- (C++)1041 考试座位号
- 网易严选 x 网易有数:数据产品+数据中台双引擎模式实践
- 设计模式之美:Adapter(适配器)
- C#之windows桌面软件第十课:电脑ADC值显示(上位机)(单通道显示)
- qunee for html5 api,Qunee for HTML5
- 【深度学习】新人如何入门Pytorch的路线?有哪些资源推荐?
- Oracle实现数据增删改的sql语句实例
- Qt之QObjectCleanupHandler使用介绍
- php菲波那切数列,php如何实现菲波那切数列
- webservice常见名词
- BZOJ 1599: [Usaco2008 Oct]笨重的石子( 枚举 )
- mysql count 条件_MySQL的COUNT语句,竟然都能被面试官虐的这么惨?
- java实现堆栈排序_Java代码为例讲解堆的性质和基本操作以及排序方法
- 设计模式(九): 从醋溜土豆丝和清炒苦瓜中来学习模板方法模式(Template Method Pattern)...
- vb2008 获取mac地址_华为 荣耀路由Pro 设置MAC地址克隆的方法?华为荣耀路由器怎么设置...
- 关于SPSS16的安装及教程
- 操作系统 信号量机制
- Sulfo CY5-MAL|磺基-CY5 马来酰亚胺
- ltm4650_LTM4650IY-1APBF_代理全新进口【linear】现货商
- 冰刃 IceSword1.22 中文版
热门文章
- Jfreechart显示数据点图表(线上可以显示点数据)
- 无线路由器和计算机怎么连接网络连接,华为无线路由器怎么连接宽带上网
- 前端如何实现音乐盒胶盘的转动_郑州Web前端入门教程之如何实现图片优化?
- android内容提供者_挖穿Android第三十九天
- php redis新增数据类型,Redis有哪几种数据类型
- idea java 代码混淆加密_使用 IntelliJ IDEA 开发一般 Java 应用程序时配置 Allatori 进行代码混淆...
- keil uvision2 c语言调试,keil uvision2
- python3.7官网中文官网_Python官网宣布,正式发布Python 3.7.0!
- VMware + CentOS 网络设置为NAT模式
- geoserver和openlayers学习网站