独家 | 改善AI性别偏见的4种方法

作者：Josh Feast

翻译：王子龙

校对：王琦

本文约2200字，建议阅读8分钟。

本文阐述导致AI偏见的原因并提出应用的解决方案。

图片来源：哈佛商业评论工作人员 / UNSPLASH

任何对AI偏见的审查都需要意识到一个事实：这些偏见主要源于人类固有的偏见。我们创建、训练的模型和系统就是我们人类自己的真实写照。

因此AI从人类那里学习到了性别偏见也就不足为奇了。例如，亚马逊的Alexa和苹果的Siri等常见AI系统的核心—自然语言处理（natural language processing, NLP）就存在性别偏见，而这并不是孤例。此前还发生了几起明显带有性别偏见色彩的案例，包括能够识别性别的计算机视觉系统，其在识别女性时报告的错误率更高，尤其是对于那些肤色较深的女性。

为了开发出更公平的技术，整个行业的研究人员和机器学习团队必须共同努力来纠正这种不平衡。幸运的是，我们开始看到有新的研究致力于解决这些问题。

其中需要特别提到的是目前正在进行的关于词嵌入（Word-embeddings）的偏见研究，词嵌入将词转换为数字表示，然后在自然语言处理模型中用作输入。词嵌入将词表示为序列或数字向量，如果两个词意思相近，它们的映射（associated embedding）在数学意义上也是相近的。词嵌入通过评估单词出现的上下文来编码信息。例如，AI能够客观地把“女王”一词填充到“男人是国王，女人是X”这句话中的X处。但当AI填写“父亲是医生，母亲是护士”这样的句子时，就会引起潜在的问题。这句话中固有的性别偏见反映了我们社会中对妇女的过时看法，这种看法既没有事实根据，也不平等。

很少有研究对情感相关的演讲中的性别偏见进行评估，而情感AI在未来的工作、营销以及几乎所有你能想到的行业中开始扮演更重要的角色。在人类社会中，当一个人对某一类人情感的误解多于另一类时，偏见就会产生。例如，错误地认为某一类人比另一类人更容易生气。目前的机器也有同样的偏见，它们将与情感相关的信息错误地分类。要理解为什么会这样，以及我们如何解决这个问题，先去了解造成AI偏见的原因就显得重要了。

什么导致了AI偏见？

在机器学习的背景下，偏见可能意味着某些人口统计类别的误差更大。因为找不到这种偏见的根源，所以在开发和训练机器学习模型时，研究人员必须考虑许多变量，包括以下因素：

不完整的或偏斜的训练数据集：当训练数据中缺少某种人口统计类别时，就会出现这种情况。在那些有缺失人口统计类别的新数据上使用这些数据训练的模型时，则不能正确地衡量。例如，如果女性演讲者只占你训练数据的10%，那么当你将一个训练过的机器学习模型应用于女性时，很可能会产生更高程度的误差；
训练模型所用的标签：绝大多数商业AI系统使用有监督机器学习，这意味着训练数据是被打上标签的，标签用来训练模型如何作出反应。通常情况下，这些标签是人类想出的，考虑到人们经常表现出偏见（既有有意识的，也有无意识的），这些偏见会无意地编码到由此产生的机器学习模型中。考虑到机器学习模型被训练出来用于估计这些标签，这种对特定性别不公平的分类将被编码到模型，这会导致偏见；
特征和建模技术：机器学习模型的输入值或者实际的模型训练过程中都可能因为测量而产生偏见。例如，几十年来，语音合成，即把文本转换为语音的技术（例如：斯蒂芬·霍金的声音）和自动语音识别，即把语音转换为文本的技术（例如：CC字幕）都有该情况发生。与男性相比，女性演讲者的表现不佳，这是由于对演讲者的分析和建模对于声带较长、音调较低、个子较高的人来说更准确。因此，语音技术对于具有这些特征的演讲者（通常是男性）来说是最准确的，而对于那些音调较高的演讲者（通常是女性）来说就不那么准确了。

机器学习团队避免性别偏见的四个最佳解决方案

和生活中的许多事情一样，AI偏见的原因和解决方案并不是非黑即白的。“公平”本身甚至也必须通过量化来减轻偏见所带来的不必要影响。对于那些想要利用AI的力量，但又担心产生偏见的管理者来说，落实下面的方法对于你的机器学习团队很重要。

确保训练样本的多样性（例如，在训练数据中使用与男性差不多数量的女性音频样本）。
确保给音频打标签的人们有着多元化的背景。
针对不同人口统计类别，鼓励机器学习团队分别评估模型的准确程度。并且当某个类别被不公平地对待时要能识别得出来。
通过收集更多与敏感群体相关的训练数据来解决不公平的问题。在此基础上，可以应用新的机器学习去除偏见技术，该技术不仅惩罚主要变量的识别错误，还额外惩罚造成不公平的错误。

虽然研究这些原因和解决办法是非常重要的第一步，但仍有许多悬而未决的问题需要回答。除了训练机器学习模型之外，业界还需要开发更全面的方法以解答造成上述三个主要偏见的原因。此外，为了应对日益增加的多样性，未来的研究应该考虑性别变量的更广泛表示，如跨性别者、非二元性别等，以此来增强我们对此的理解。

我们有义务创造对每个人都有效和公平的技术。我相信，如果我们能够共同解决这些问题，AI的收益将超过风险。这取决于该领域的所有从业者和领袖合作、研究和开发解决方案，以减少AI对任何人的偏见。

原文标题：

4 Ways to Address Gender Bias in AI

原文链接：

https://hbr.org/2019/11/4-ways-to-address-gender-bias-in-ai

编辑：黄继彦

译者简介

王子龙，新加坡国立大学智能系统硕士在读。关注数据科学如何更好地创造出商业价值，感兴趣的方向有自然语言处理和智能流程自动化。希望自己能广泛地阅读好的文章并从中获得启发，也非常高兴能和大家一起学习、分享知识。

翻译组招募信息

工作内容：需要一颗细致的心，将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生，或在海外从事相关工作，或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到：定期的翻译培训提高志愿者的翻译水平，提高对于数据科学前沿的认知，海外的朋友可以和国内技术应用发展保持联系，THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利：来自于名企的数据科学工作者，北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载，请在开篇显著位置注明作者和出处（转自：数据派ID：datapi），并在文章结尾放置数据派醒目二维码。有原创标识文章，请发送【文章名称-待授权公众号名称及ID】至联系邮箱，申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱（见下方）。未经许可的转载以及改编者，我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

独家 | 改善AI性别偏见的4种方法相关推荐

改善AI性别偏见的4种方法 | CSDN博文精选
加入「公开课」交流群,获取更多学习资料.课程及热招岗位等信息作者 | Josh Feast 翻译 | 王子龙校对 | 王琦本文阐述导致AI偏见的原因并提出应用的解决方案. 任何对AI偏见的审查都 ...
独家 | 使EfficientNet更有效率的三种方法（附链接）
作者:Dominic Masters翻译:王可汗校对:欧阳锦本文约3300字,建议阅读5分钟本文为大家介绍了提升EffcientNet效率和性能的三个策略. 在实践中有更好性能的EfficientNe ...
改进AI/ML部署的5种方法
http://blog.itpub.net/29829936/viewspace-2642581/ 2019-04-25 13:36:51 在进行任何AI/ML部署之前,组织需要将其数据科学的研究工作 ...
笔记本电池寿命检测软件_改善Windows笔记本电脑电池寿命的6种方法
笔记本电池寿命检测软件 Laptop owners have a critical enemy: a drained battery. Sure, you can plug it in, but o ...
改善客户体验 (CX) 的 10 种方法
改善企业的客户体验 (CX) 可能会对企业的底线产生重大影响.事实上,对客户体验的投资还可以降低运营成本,例如服务成本.毕竟,不满意的客户是昂贵的. 以下有关如何改善客户体验的 10 条建议: 1. ...
Facebook AML实验室负责人：将AI技术落地的N种方法（上）
(Facebook AML实验室负责人 Joaquin Candela) 雷锋网(公众号:雷锋网)按:在Facebook,有两个实验室领导着AI发展方向,一个是Yann LeCun领导的FAIR实验室 ...
独家 | Python处理海量数据集的三种方法
作者:Georgia Deaconu 翻译:陈超校对:欧阳锦本文约1200字,建议阅读5分钟本文介绍了Python处理数据集的方法. 作为一名数据科学家,我发现自己处理"大数据" ...
【NLP】ACL2020 | 词向量性别偏见
作者 | Salesforce Research 编译 | NewBeeNLP ACL2020关于词嵌入性别偏见的蛮有意思的一项工作: 论文地址:https://arxiv.org/abs/2005 ...
改善员工绩效的七种方法
绩效考核应该如何做?传统的年度绩效评估究竟有什么样的弊端?让我们看看绩效研究专家们如何来解读. 传统绩效的问题年度绩效评估不够频繁这是一个过时的方法,因为员工需要更频繁的反馈和对目标的投入. 当你 ...

独家 | 改善AI性别偏见的4种方法

独家 | 改善AI性别偏见的4种方法相关推荐

最新文章

热门文章