Pymetrics是一件专注于向企业提供招聘服务的初创企业。最近,Pymetrics在Github上开源了企业使用的偏差检测(bias detection)算法,称为“Audio AI”。Audit AI用于降低存在于训练数据集中的判别模式。这些判别模式会改进或影响机器学习算法在选取总体上的概率。

\\

现在,越来越多的工作任务借助于机器学习实现过程自动化。重要的是应确保这些算法不会产生可从中不当受益的偏差。Pymetrics一直致力于确保机器学习算法的公平性。

\\

\

我们研究的总体目标,就是提出一种合理的考虑问题方式,使机器学习算法更公平。即便识别了训练数据集中存在的偏差,使用该训练集训练的机器学习算法并不足以解决其中的判别问题。当前,越来越多的决策使用人工智能自动做出。人们需要理解并识别算法的公平或偏差程度,这是朝正确方向迈出的一步。

\

\\

企业对多样性的关注与日俱增。一些人担心算法学习偏差的方式事实上可能会破坏这些多样性努力。最近,法国宣布希望成为能在国际舞台占有一席之地的人工智能强国。今年三月,法国总统Emmanuel Macron发布了人工智能国家战略,其中包括在未来五年内支出18.5亿美元,发展可与硅谷和中国竞争的生态系统。总统做出如此层次的AI投资,这无疑是经过了仔细的考虑:

\\

\

我认为AI完全可能危及民主。例如,我们正在使用人工智能来组织学生访问大学,对算法委以重任。很多人认为算法是一个黑箱,他们并不明白选取学生的过程是如何发生的。但当他们开始明白这依赖于某种算法时,算法就具有了特定的责任。要避免争议的发生,必须为算法创造公平性和完全透明性的条件。这样的算法中并不存在偏见,至少不存在歧视性偏见,我对此充满信心。

\

\\

对于法国而言,“公平”的算法可确保在性别、年龄及其它个体特征上不存在偏见。如果算法中并未建立公平性和透明度,那么Macron总统预计“人们最终会拒绝这种创新”。

\\

Pymetrics的客户包括消费品企业、技术企业和研究企业。Pymetrics提供的部分产品是为应聘候选者给出了一套参与性游戏。这些游戏通常完成于招聘的前期过程,完全不考虑应聘者的种族、性别和教育水平等个体特征,而是基于应聘者的记忆、对风险的态度等近80个特征做出评估。之后,Pymetrics就能够针对已有的最佳表现者对应聘者做出评定,预测应聘者在应聘职位上可能的未来表现。

\\

出于社会责任上的考虑,Pymetrics选择开源Audit AI。Pymetrics的产品负责人Priyanka Jain给出了解释:

\\

\

作为技术的创造者,我们十分强烈地感受到,我们的责任就是构建人工智能,努力创造一个人人希望生活于其中的未来。如果我们可以为其他技术创造者继续构建特性提供帮助,那么我们责无旁贷应做出共享。

\

\\

在Audit AI的Github代码库中,开发人员可以看到一个用于实现上述“公平”的机器学习算法的Python软件库,该软件库是基于pandas和sklearn构建的。此外,代码库还给出了两个示例数据集,场景分别涉及德国的学分和学生的成绩。

\\

查看英文原文: Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms

Pymetrics开源公平性感知机器学习算法Audit AI相关推荐

  1. 轻量级大规模机器学习算法库Fregata开源:快速,无需调参

    作者:张夏天,TalkingData首席数据科学家.12年大规模机器学习和数据挖掘经验,对推荐系统.计算广告.大规模机器学习算法并行化.流式机器学习算法有很深的造诣:在国际顶级会议和期刊上发表论文12 ...

  2. 【机器学习】新手必看的十种机器学习算法

    在神经网络的成功的带动下,越来越多的研究人员和开发人员都开始重新审视机器学习,开始尝试用某些机器学习方法自动解决可以轻松采集数据的问题.然而,在众多的机器学习算法中,哪些是又上手快捷又功能强大.适合新 ...

  3. 使用机器学习算法在 .NET Core 中运行的 100% C# 开源 AI 聊天机器人平台构建器...

    简介 BotSharp是一个用于 AI Bot 平台构建器的开源机器学习框架.该项目涉及自然语言理解.计算机视觉和音频处理技术,旨在推动智能机器人助手在信息系统中的开发和应用.开箱即用的机器学习算法让 ...

  4. 机器学习算法易受攻击?阿里“安全基建”这样应对AI的不安全

    出品 | AI科技大本营(ID:rgznai100) 数字基建的浪潮之下,诸多行业领域都在加速融合5G.大数据中心.AI等新技术,向数字化转型.近日,多位全国政协委员.院士和安全行业专家提出,应尽快出 ...

  5. AI加速器与机器学习算法:协同设计与进化

    作者|Shashank Prasanna 翻译|胡燕君 此刻,你应该是在电脑或手机上看这篇文章.不管怎样,这些机器都属于现代计算机,它们都有中央处理器(CPU)和其他为特定功能服务的专用芯片,例如显卡 ...

  6. 发布AI操作系统、应用市场,开源机器学习数据库和AI操作系统内核,第四范式这波操作有点秀!

    "AI的发展经历了'高期望--能否落地--落地是否有用"等多次潮起潮落.今天,AI的价值再次引发一些讨论和怀疑." 第四范式创始人兼首席执行官戴文渊在近日举行的新品发布会 ...

  7. 【活动打卡】【Datawhale】第16期 机器学习算法梳理(AI入门体验) Task02:基于决策树的分类预测

    1.决策树的介绍和应用 1.1 决策树的介绍 决策树是一种常见的分类模型,在金融风控.医疗辅助诊断等诸多行业具有较为广泛的应用.决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本 ...

  8. 机器学习算法系列(一)- 感知器学习算法(PLA)

    阅读本文需要的背景知识点:数学基础知识.一丢丢编程知识 一.引言   前面一节我们了解了机器学习算法系列(〇)- 基础知识,接下来正式开始机器学习算法的学习,首先我们从最简单的一个算法--感知器学习算 ...

  9. 阿里云机器学习平台PAI+AI开源项目测评来啦

    一.背景介绍 阿里AI(阿里灵杰)依托阿里领先的云基础设施.大数据和AI工程能力.场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系.帮助提升AI应用开发效率,促进AI在产业中 ...

最新文章

  1. (C++)1041 考试座位号
  2. 网易严选 x 网易有数:数据产品+数据中台双引擎模式实践
  3. 设计模式之美:Adapter(适配器)
  4. C#之windows桌面软件第十课:电脑ADC值显示(上位机)(单通道显示)
  5. qunee for html5 api,Qunee for HTML5
  6. 【深度学习】新人如何入门Pytorch的路线?有哪些资源推荐?
  7. Oracle实现数据增删改的sql语句实例
  8. Qt之QObjectCleanupHandler使用介绍
  9. php菲波那切数列,php如何实现菲波那切数列
  10. webservice常见名词
  11. BZOJ 1599: [Usaco2008 Oct]笨重的石子( 枚举 )
  12. mysql count 条件_MySQL的COUNT语句,竟然都能被面试官虐的这么惨?
  13. java实现堆栈排序_Java代码为例讲解堆的性质和基本操作以及排序方法
  14. 设计模式(九): 从醋溜土豆丝和清炒苦瓜中来学习模板方法模式(Template Method Pattern)...
  15. vb2008 获取mac地址_华为 荣耀路由Pro 设置MAC地址克隆的方法?华为荣耀路由器怎么设置...
  16. 关于SPSS16的安装及教程
  17. 操作系统 信号量机制
  18. Sulfo CY5-MAL|磺基-CY5 马来酰亚胺
  19. ltm4650_LTM4650IY-1APBF_代理全新进口【linear】现货商
  20. 冰刃 IceSword1.22 中文版

热门文章

  1. Jfreechart显示数据点图表(线上可以显示点数据)
  2. 无线路由器和计算机怎么连接网络连接,华为无线路由器怎么连接宽带上网
  3. 前端如何实现音乐盒胶盘的转动_郑州Web前端入门教程之如何实现图片优化?
  4. android内容提供者_挖穿Android第三十九天
  5. php redis新增数据类型,Redis有哪几种数据类型
  6. idea java 代码混淆加密_使用 IntelliJ IDEA 开发一般 Java 应用程序时配置 Allatori 进行代码混淆...
  7. keil uvision2 c语言调试,keil uvision2
  8. python3.7官网中文官网_Python官网宣布,正式发布Python 3.7.0!
  9. VMware + CentOS 网络设置为NAT模式
  10. geoserver和openlayers学习网站