作者 | Salesforce Research

编译 | NewBeeNLP

ACL2020关于词嵌入性别偏见的蛮有意思的一项工作:
论文地址:https://arxiv.org/abs/2005.00965
代码地址:https://github.com/uvavision/Double-Hard-Debias

TL; DR

从人类生成的语料库中学习到的单词嵌入继承了强烈的「性别偏见(gender bias)」,并且会通过下游模型进一步放大。我们发现诸如单词频率之类的语料库规则会对现有的post-hoc debiasing算法产生负面影响,并建议在推断和删除性别子空间之前针对此类语料库规则来净化词向量。

词嵌入中的性别偏见

词嵌入是词汇表中单词的向量表示,它们能够捕获单词的语义和句法含义以及与其他单词的关系。尽管在自然语言处理(NLP)任务中广泛使用了词嵌入,但由于其从训练语料库中继承了意想不到的性别偏见,因此饱受批评。如论文中所讨论的(Man is to Computer Programmer as Woman is to Homemaker? Debiasing Word Embeddings[1]),我们认为一个单词在定义上与性别无关但其学习的嵌入更接近于某个性别时,这就产生了性别偏见。例如,在下图中,




轴是对「他(he)」「她(she)」 两个词的嵌入之间差异的投影,而




轴是在嵌入过程中捕获性别中立性的方向,与性别无关的位于上半部分,而与性别有关的词位于下半部分。尽管从定义上说,brilliantgenius不分性别,但它们的embedding更加接近男性(he)。同样,homemakersewing与女性(her)联系更紧密。

为什么性别偏见如此重要?

词嵌入中的性别偏见是一个严重的问题。想象一下,人们基于有偏词嵌入开发了一个简历过滤模型。该模型可以潜在地过滤掉像程序员这样的职位的女性候选人,也可以排除像理发店这样的职位的男性候选人。同样,当QA模型被用于解析医学报告时,如果将医生全部默认为男性而护士全部默认为女性的则很大可能会提供错误的答案。

早期的硬Debias方法

先前的工作[1]通过后处理(post-processing)从词嵌入中减去与性别相关的成分,从而减少了性别偏见。具体而言,它需要一组特定于性别的单词对,并计算这些单词对的差异向量的第一个主成分作为嵌入空间中的性别方向。其次,它将有偏见的词嵌入投射到与推断的性别方向正交的子空间中,以消除性别偏见。虽然证明了这种方法可以缓解单词类比任务中的性别偏见,但这篇论文(Lipstick on a Pig: Debiasing Methods Cover up Systematic Gender Biases in Word Embeddings But do not Remove Them[2])认为这些努力的效果是有限的,因为性别偏见仍然可以从去偏后的嵌入几何图中恢复。

词频会扭曲性别倾向

在某种情况下,我们假设很难以现有的「Hard Debias」方法所采用的方式来识别单词嵌入的真实性别方向。参考资料[3]和[4]表明词频显著影响词嵌入的几何形状。例如,流行词和稀有词聚集在嵌入空间的不同子区域中,尽管事实上这些词在语义上并不相似。这可能会对识别性别方向的过程产生负面影响,并因此降低“硬性偏见”消除性别偏见的能力。我们通过经验证明,某些单词的频率变化会导致相应差异向量与其他差异向量之间的相似性发生重大变化,如下图所示。

双重硬性偏差:通过消除频率影响来改善硬性偏差

由于单词频率会扭曲性别方向,因此我们建议使用「Double-Hard Debias」消除单词频率的负面影响。关键思想是在应用Hard Debias之前将单词嵌入投影到intermediate subspace。回想一下,Hard Debias通过将嵌入空间转换为无性别的空间来减少性别偏见。同样,在Double-Hard Debias中,我们首先将所有单词嵌入转换为「无频率子空间」,在该子空间中,我们能够计算出更准确的性别方向。更具体地说,我们尝试找到对频率信息进行编码的维度,该频率信息分散了性别方向的计算。然后,我们沿着字词嵌入的这个特定维度投影组件,以获得修正的嵌入,并对修正的嵌入应用Hard Debias。

为了识别此维度,我们采用top biased words的聚类作为代理,并反复测试词嵌入的主成分。详细步骤如下:

  1. 计算所有单词嵌入的主成分作为频率维度候选;

  2. 选择一组最偏(top-biased)的男性和女性词汇(例如,程序员,家庭主妇,游戏,舞蹈等);

  3. 对没有候选维度







    分别重读步骤4-6;

  4. 投影嵌入(embedding)到与







    正交的中间空间中,从而获得经过修正的嵌入;

  5. 对修正的嵌入应用 Hard Debias;

  6. 对选定的top biased词的debiased embedding进行聚类,并计算聚类精度。

如果步骤6中的聚类算法仍将有偏见的词聚类为与性别对齐的两组,则意味着删除







不能改善去偏性。因此,我们选择导致有偏词聚类准确性下降幅度最大的







并将其删除。

Double-Hard Debias的表现如何?

我们在几个bias mitigation基准上评估Double-Hard Debias,包括重要的下游任务--conference resolution。我们使用 WinoBias数据集来量化性别偏见。WinoBias由两种类型的句子组成。每种类型的句子可以分为pro-stereotype子集和anti stereotype子集,性别是这两个子集之间的唯一区别。类型1句子中的一个示例包含一个定型观念句子:「The physician hired the secretary because he was overwhelmed with clients」。还有一个反刻板印象的句子:「The physician hired the secretary because she was overwhelmed with clients」。前定型和反定型之间的性能差异反映了共指系统在男性和女性群体中的表现差异。因此,我们将此差距视为性别偏见得分。最初的GloVe嵌入带有明显的性别偏见,因为我们可以看到两种类型的句子的性能差距分别达到29点和15点。与Hard Debias和其他最新的debiasing方法相比,我们的方法在两种共指句子中都实现了最小的差异。同时,Double-Hard Debias还保留了词嵌入中有用的语义信息。在原始测试集上,我们仅观察到F1分数下降了0.1%。

我们还对所有前500个有偏见的女性和男性嵌入进行tSNE预测。如下图所示,原始的GloVe嵌入明显投影到了不同的区域,表明强烈的性别偏见。与其他方法相比,Double-Hard GloVe最大程度地混合了男性和女性的嵌入,显示出在消除偏见后可以捕获到较少的性别信息。

结论

我们发现单词频率统计信息的简单变化可能会对用于消除单词嵌入中性别偏见的去偏方法产生不良影响。尽管迄今为止在以前的性别偏见减少工作中都忽略了词频统计,但是我们提出了Double-Hard Debias,它减轻了词频特征对去偏算法的负面影响。我们认为,提供公平实用的单词嵌入很重要,希望这项工作能够激发沿这个方向的进一步研究。

本文参考资料

[1]

Man is to Computer Programmer as Woman is to Homemaker? Debiasing Word Embeddings: https://arxiv.org/abs/1607.06520

[2]

[Lipstick on a Pig: Debiasing Methods Cover up Systematic Gender Biases in Word Embeddings But do not Remove Them: https://arxiv.org/abs/1903.03862

END -

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家:

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读


整理不易,还望给个在看!

ACL2020 | 词向量性别偏见相关推荐

  1. 【NLP】ACL2020 | 词向量性别偏见

    作者 | Salesforce Research  编译 | NewBeeNLP ACL2020关于词嵌入性别偏见的蛮有意思的一项工作: 论文地址:https://arxiv.org/abs/2005 ...

  2. 改善AI性别偏见的4种方法 | CSDN博文精选

    加入「公开课」交流群,获取更多学习资料.课程及热招岗位等信息 作者 | Josh Feast 翻译 | 王子龙 校对 | 王琦 本文阐述导致AI偏见的原因并提出应用的解决方案. 任何对AI偏见的审查都 ...

  3. 独家 | 改善AI性别偏见的4种方法

    作者:Josh Feast 翻译:王子龙 校对:王琦 本文约2200字,建议阅读8分钟. 本文阐述导致AI偏见的原因并提出应用的解决方案. 图片来源:哈佛商业评论工作人员 / UNSPLASH 任何对 ...

  4. 05.序列模型 W2.自然语言处理与词嵌入(作业:词向量+Emoji表情生成)

    文章目录 作业1: 1. 余弦相似度 2. 单词类比 3. 词向量纠偏 3.1 消除对非性别词语的偏见 3.2 性别词的均衡算法 作业2:Emojify表情生成 1. Baseline model: ...

  5. L5W2作业2 词向量的基本操作

    欢迎来到本周的第一份作业! 因为训练单词嵌入在计算上非常耗时耗力,所以大多数ML练习者都会加载一组经过预先训练的嵌入. 完成此任务后,你将能够: 加载预训练的词向量,并使用余弦相似度测量相似度 使用单 ...

  6. 序列模型 - 词向量的运算与Emoji生成器

    文章目录 1 - 词向量运算 1.1 - 余弦相似度 1.2 - 词类类比 1.3 - 去除词向量中的偏见(选学) 1.3.1 - 消除与性别无关的词汇的偏差 1.3.2 - 性别词的均衡算法 2 - ...

  7. Java词向量比较字符串相似度_Sequence Model-week2编程题1-词向量的操作【余弦相似度 词类比 除偏词向量】...

    1. 词向量上的操作(Operations on word vectors) 因为词嵌入的训练是非常耗资源的,所以ML从业者通常 都是 选择加载训练好 的 词嵌入(Embedding)数据集.(不用自 ...

  8. 2021-1-9 吴恩达-C5 序列模型-w2 自然语言处理与词嵌(课后编程1-Operations on word vectors 词向量运算-含UnicodeDecodeError解决)

    原文链接 如果打不开,也可以复制链接到https://nbviewer.jupyter.org中打开. 自然语言处理与词嵌 Operations on word vectors 词向量运算 1-余弦相 ...

  9. Sequence Model-week2编程题1-词向量的操作【余弦相似度 词类比 除偏词向量】

    1. 词向量上的操作(Operations on word vectors) 因为词嵌入的训练是非常耗资源的,所以ML从业者通常 都是 选择加载训练好 的 词嵌入(Embedding)数据集.(不用自 ...

  10. 【中文】【吴恩达课后编程作业】Course 5 - 序列模型 - 第二周作业 - 词向量的运算与Emoji生成器

    [中文][吴恩达课后编程作业]Course 5 - 序列模型 - 第二周作业 - 词向量的运算与Emoji生成器 上一篇:[课程5 - 第二周测验]※※※※※ [回到目录]※※※※※下一篇:[课程5 ...

最新文章

  1. 微服务架构之「 容器技术 」
  2. 项目管理概述学习记录(一)
  3. eclipse 中创建maven工程问题(常见)
  4. 谷歌地图将很快显示电动汽车充电站
  5. 巨蟒python全栈开发-第6天 is==
  6. 简单防止通过执行存储过程攻击服务器
  7. Java学习笔记(二)Java基本语法
  8. 在线等比数列项数生成器
  9. ActiveMQ代码示例
  10. 华为ARP代理的三种方式
  11. 2017cad光标大小怎么调_关于调整input里面的输入光标大小
  12. android手机电池寿命,手机电池寿命检测
  13. 通过server酱来发送爬虫爬到的数据
  14. 艾媒咨询:2015年度中国智能路由器市场监测报告
  15. 前端css让div浮动,Web前端篇:css浮动
  16. Biopython入门
  17. 理解 Audio 音频系统二 之 audioserver AudioPolicyService
  18. gamma 色彩饱和度_网页设计师的色彩:了解Gamma
  19. android 通讯录搜索算法,一个简单的通讯录联系人拼音匹配算法
  20. ABAP-面试中的奇葩问题

热门文章

  1. 课时46:魔法方法:描述符(property的原理)
  2. 【Luogu3478】【POI2008】STA-Station(动态规划)
  3. 【SSH】---【Struts2、Hibernate5、Spring4】【SSH框架整合笔记 】
  4. 洛谷P3378 【模板】堆
  5. 十一、JUC包中的锁
  6. 网站性能测试工具--MS Web Application Stress Tool
  7. iOS:菜单控制器和菜单项:UIMenuController和UIMenuItem
  8. 转载js实现打印功能
  9. ORACLE进制转换函数
  10. 【SolidWorks、URDF】在SolidWorks里面插入URDF方法步骤以及无法启动的解决问题