在讨伐算法导致的偏见和产生的作用时,更重要的问题是:与完全没有使用算法的情况相比是怎样的?我们应该比较算法的缺陷与人类的缺陷,而不是简单地询问算法是否存在缺陷。

一场革命正在悄然进行。

这场革命与大部分新闻报道中出现的人工智能的进展有所不同。

新闻媒体往往聚焦于感知型机器人军团的重大发展,而更重要的角逐是在全国各类机构传统人为决策过程中展开,很显然,自动化比重正在稳步增加。

不同于AlphaGo Zero这样占据头条新闻的先进成果,这场革命通过相当传统的机器学习和统计技术如普通最小二乘法、逻辑回归、决策树等,为许多组织创造了真正的价值。

这些技术应用的领域是很广泛的,包括医疗诊断、司法判决、公共机构的专业招聘和资源分配等。

这场革命是好事吗?

似乎有越来越多的作者、学者和记者给予否定的回答。这一类型的书包括《数学毁灭武器》,《自动化不平等》和《黑匣子协会》等。还有一连串的曝光式长篇文章,如“机器偏差”,“紧缩是一种算法”,“算法是否在构建种族主义的新基础设施?”等。

人们关注的焦点是,算法通常是不透明、有偏差并且难以解释的工具,而这样的工具正在被权利组织加以利用。那么,对于算法逐渐上升的决策地位,人类需不需要感到担忧呢?

这些批评和调查往往很具有洞察力和启发性,并且成功地让人们认为“算法是完全不受主观影响”是不可能的。但是这些批评者之间存在一种模式,即他们很少会探讨他们分析的系统在没有算法参与的情况下运行得如何。

对于从业者和政策制定者而言,这是最相关的问题:算法导致的偏见和产生的作用,与完全没有使用算法的情况相比是怎样的?我们应该比较算法的缺陷与人类的缺陷,而不是简单地询问算法是否存在缺陷。

研究结果怎么说?

关于算法决策的大量研究可以追溯到几十年前。与这一主题相关的研究都得出了一个非常相似的结论:算法比他们所取代的人类更少偏见、更准确。

下面是一个研究样本,调查了当算法控制了传统上由人类执行的任务时会发生什么:

2002年,一个经济学家团队研究了自动承保算法对抵押贷款行业的影响。他们的主要发现是“[自动承保]系统比手动承销商更准确地预测违约”并且“提高了预测借款批准率的准确性,特别是对于通常服务不到的申请人。”在传统的方法中,资源匮乏的消费者往往被边缘化;但算法系统使这部分消费者受益最多。

Bo Cowgill来自哥伦比亚商学院(Columbia Business School),他在研究一家软件公司的工作申请筛选算法的效果时得出了类似的结论。当公司通过算法来决定哪些申请人应该接受面试时,算法实际上比人类筛选者更喜欢“非传统”候选人。与人类相比,该算法对公司中代表性不足的候选人(例如没有个人引荐或没有拥有名牌大学的学位)的偏见显著偏少。

在纽约市审前保释听证会中,一支由著名计算机科学家和经济学家组成的团队判定,与目前作出保释决定的法官相比,算法有可能实现更为公平的决策,“监禁率减少高达41.9%,犯罪率没有增加”。他们还发现,在他们的模型中,“所有类别的犯罪,包括暴力犯罪中,都显示出监禁率的降低。这些成果可以在减少种族差异的过程中同时实现。”

《纽约时报》杂志最近报道了一个长篇故事来回答这个问题,“算法可以判断孩子何时处于危险之中吗?”

事实证明答案是肯定的,并且算法可以比人类更准确地执行这项任务。有些政府服务加剧了种族偏见,而“阿勒格尼郡的经验表明,它的筛选工具在权衡偏见方面不像人类筛选者那么糟糕”。

最后一个例子是,一个由财务教授组成的团队开始通过查看公开交易公司的历史数据构建算法,为特定公司选择最佳董事会成员。研究人员发现公司在由算法选择的董事会的管理下业绩更好,而且与他们提出的算法相比,“没有算法的公司倾向于选择拥有庞大的社交网络与丰富的董事会经验、目前在董事会参与更多、具有财务背景的男性董事。”

在每个案例研究中,数据科学家都做了一件看起来惊人事情:他们根据过去的数据训练他们的算法,而这些数据肯定会受到历史偏见的影响。所以这是怎么回事呢?

在很多不同的领域 ——信用申请、工作筛选、刑事司法、公共资源分配和公司治理 ,算法都可以减少偏见;但为什么许多评论家和批判者告诉我们的却正好相反呢?

人类是非常糟糕的决策者

我们可以看到,上述提到的算法实际上是存在偏见的,但它们正在取代的人类显然有更大的偏差。毕竟,如果不是一直被人为控制,制度偏见从何而来?

人类是糟糕到极点了么?也不尽然。虽然存在着偏见,但在某些维度上看,我们也做过一些较好的决策。不幸的是,近几十年来,判断和决策方面的心理学研究已经一次又一次地证明了人类在各种背景下的判断非常糟糕。我们至少在20世纪50年代就已经知道,在预临床环境中的重要结果方面,非常简单的数学模型就已优于所谓的专家。

在上面提到的所有例子中,人类决策者的表现并不好,用算法取代他们既提高了准确性,又降低了制度偏差。这就达到了经济学家所说的帕累托改进,即一项政策在我们关心的每一个方面上都有更优越的表现。

虽然许多批评者喜欢暗示前沿公司以牺牲公平和公正为代价来追求运营效率和更高的生产力,但当前的证据都表明其实没有这样的让步。算法可以提供更高效,更公平的结果。

如果有什么事情会让你感到惊恐,那么应该是这样一个事实:我们的许多重要决策是由前后矛盾的,有偏见的,非常糟糕的决策者做出的。

改善现状

当然,我们应该尽一切努力消除制度偏见及其对决策算法的有害影响。对算法决策的批评催生了机器学习的研究的新浪潮,人们更加重视算法的社会和政治后果。

统计学和机器学习中出现了一些新技术,专门用于解决算法歧视问题。每年甚至还有一次学术会议(https://www.fatml.org),研究人员不仅讨论机器学习的伦理和社会挑战,而且还提出了确保算法对社会产生积极影响的新模型和新方法。

随着深度学习等不太透明的算法变得越来越普遍,这项工作可能会变得更加重要。 即使技术不能完全解决制度偏见和偏见歧视的社会弊端,这里所回顾的证据表明,在实践中,它在改善现状方面发挥着微小但重要的作用。

这不是在鼓吹算法绝对主义或对统计力量的盲目信仰。如果我们在某些情况下发现算法与当前的决策过程相比具有不可接受的高度偏差,那么接受这样的结果并维持人类决策现状也不会造成任何损害。

但是,维持现状也是有利有弊。

我们应该承认,在某些情况下,算法将会为减少制度偏见起到一些作用。因此,下次当您读到有关算法偏差风险的标题时,请记得冷静下来,并想一想人类偏见带来的危险是否会更严重。

作者:Alex P. Miller

转自:大数据文摘

编译:倪倪、陈同学、Alieen

原文链接:

https://hbr.org/2018/07/want-less-biased-decisions-use-algorithms

版权归原作者所有,转载仅供学习使用,不用于任何商业用途,如有侵权请留言联系删除,感谢合作。

数据与算法之美

用数据解决不可能

长按扫码关注

算法有偏见?总比人类识别强吧!相关推荐

  1. “算法有偏见,比人强就行?”其实影响很广泛!

    一.披着人工智能外衣的伪科学 在今年12月举办的清博盛典暨新媒体大数据AI峰会上,清华大学教授沈阳分享了这样一个观点:人类的能力正在逐步被机器所替代,每一个人被技术赋能之后,他都在自我的能力上更强大. ...

  2. 百度机器人对战人类最强大脑,赢在了小数点后第二位

    百度机器人对战人类最强大脑,赢在了小数点后第二位 第1期:人机大战人类认怂?刘国梁怒斥怯战选手,章子怡黑脸 [AI世代编者按]1月6日江苏卫视<最强大脑>,上演了一场精彩的人机对决,这次的 ...

  3. 深度学习新算法,完成字里行间的情绪识别

    深度学习新算法,完成字里行间的情绪识别 发表于2013-10-12 11:41| 40891次阅读| 来源Wired| 68 条评论| 作者Daniela Hernandez 深度学习人工智能机器学习 ...

  4. 微分算法 非侵入式负荷识别_基于用户用电行为和粒子群算法的非侵入式负荷识别方法...

    基于用户用电行为和粒子群算法的非侵入式负荷识别方法 丁屹峰 1 ,杨 烁 1, 赵 乐 1 ,焦 然 1 ,马龙飞 1 ,许仪勋 2 ,王洪安 2 [摘 要] 居民用电行为是影响负荷识别的重要因素之一 ...

  5. 学习笔记|强化学习(Reinforcement Learning, RL)——让AlphaGo进化得比人类更强

    文章目录 1. 题外话:人类棋手的最后赞礼 2. 强化学习概述 2.1 强化学习的目标也是要找一个Function 2.2 强化学习的三个基本步骤 2.2.1 定义一个function 2.2.2 定 ...

  6. 使用 OpenCV与 HAAR 级联算法进行人脸检测和人脸识别

    AI人脸识别是一种从数字图像或视频帧中识别或验证人脸的技术.人类可以毫不费力地快速识别面部.这对我们来说是一项轻松的任务,但对计算机来说却是一项艰巨的任务.因为存在各种复杂性,例如低分辨率.遮挡.光照 ...

  7. 机器学习算法 08 —— 支持向量机SVM算法(核函数、手写数字识别案例)

    文章目录 系列文章 支持向量机SVM算法 1 SVM算法简介 1.1 引入 1.2 算法定义 2 SVM算法原理 2.1 线性可分支持向量机 2.2 SVM计算过程与算法步骤(有点难,我也没理解透,建 ...

  8. aloha算法c语言代码,论文对最简单的反碰撞算法ALOHA算法进行了研究,在识别时间...

    论文对最简单的反碰撞算法ALOHA算法进行了研究,在识别时间和重发次数之间作一下折衷,确定如何选择退避时间. 相关句子 1.确定如何选择这三个之一超出了本文的范围. 2.时间有限,精力有限,金钱有限. ...

  9. TF之LSTM:利用多层LSTM算法对MNIST手写数字识别数据集进行多分类

    TF之LSTM:利用多层LSTM算法对MNIST手写数字识别数据集进行多分类 目录 设计思路 实现代码 设计思路 更新-- 实现代码 # -*- coding:utf-8 -*- import ten ...

最新文章

  1. 取一个字符串中的数字
  2. 【PC工具】N个直播录屏相关软件,手机投屏电脑,电脑显示手机摄像头图像,必须好用无广告!...
  3. 常问面试题总结(JAVA基础篇)
  4. 音视频技术开发周刊 | 165
  5. 将组策略编辑器添加到控制面板
  6. neo4j cypher_Neo4j:Cypher – Neo.ClientError.Statement.TypeError:不知道如何添加Double和String...
  7. 理解什么是前后端分离
  8. nginx mysql双机热备_MYSQL双机热备
  9. 向mysql中插入时间_Java向mysql中插入时间的方法
  10. php 音频上传大小限制,WordPress最大上传文件大小限制修改 | Stay Curious
  11. 特征提取之——Haar特征
  12. android rom 刷机包下载地址,谷歌Android5.0 Nexus系列安卓ROM刷机包镜像/驱动下载地址发布...
  13. 全行业产业链图示(摘自企查查)
  14. 读书笔记《深度学习与图像识别原理与实践 大白话讲解对小白易懂》2022-8-5
  15. ecap捕捉epwm波形的占空比及频率(总结)
  16. 基本模块 time datetime randon os sys subprocess 打印进度条
  17. C++记录程序运行时间5大方法
  18. 肝了1个月!2022 顶会论文代码大合集!
  19. linux pe无法识别硬盘,diskgenius识别不到硬盘是怎么回事?原因以及解决方法
  20. Entity Framework 一对多关系映射

热门文章

  1. 「分布式系统理论」系列专题
  2. Web Template Studio 发布!在 VS Code 中轻松创建 Web 应用
  3. C#并行编程(5):需要知道的异步
  4. 把旧系统迁移到.Net Core 2.0 日记(2) - 依赖注入/日志NLog
  5. .NET平台微服务项目汇集
  6. 微软开放Holographic平台,意在统一VR的操作系统?
  7. 3分钟看完Build2016 Day 1 Keynote
  8. 架构师必须知道的架构设计原则
  9. 【MATLAB统计分析与应用100例】案例007:matlab数据的极差归一化变换
  10. 【ArcGIS风暴】ArcGIS 10.2导入Excel数据X、Y坐标(经纬度、平面坐标),生成Shapefile点数据图层