整理 | 夕颜

出品 | CSDN(ID:CSDNnews)

最近,人工智能领域又发生了一次热热闹闹的争论,随后演变成一场偏离轨道的争吵,目前以 Yann 道歉封推暂告一段落......

              

争论来龙去脉

这次争论的主角是图灵奖得主、人工智能标杆性人物 Yann LeCun,争论源自于 Yann 针对一篇 CVPR 论文提出的 PULSE 算法发表的一句观点。

PULSE 算法是美国杜克大学研究人员发明的一种新的图像识别算法,它可以将低分辨图片变成高清图片,细致到毛孔、头发都能神还原,即使是被打了马赛克的图片,也可以通过该算法“脑补”出清晰地图片。于是一张引起争议的图片诞生了:

有人用作者在论文中开源的代码进行了模型推理,使用美国前总统奥巴马的打码图像进行了试验,结果发现奥巴马被还原成了白人。

            

为了证明还原照片不是假的,还有人用自己和更多人的照片做了对比实验,可以很清楚地看到,生成照片中的人都具有了白人的特征。

一石激起千层浪,尤其是在这个特殊时期,有色人种被还原成白人的事挑起了大家对于 AI 系统产生偏见(bias)的批判,也再次警醒人们,AI 技术带有偏见所带来的潜在危机。

而 Yann 此时在 Twitter 上发表了自己的观点:

推文大意是,当数据集有偏见时,机器学习系统也随之产生偏见。这个系统之所以让生成图片看起来都是白人是因为系统在只包含白人图像的 FlickFaceHQ 数据集上进行预训练,换成一个来自塞内加尔的数据集,同一个系统生成的图像看起来就是非洲人了。

就是这样一句话引起了争议,有人说,机器学习系统产生偏见不应只归咎于数据集,这种甩锅的做法是不公平的,还有人的原因、观念的原因,等等,最后评论区的声音很快偏离轨道,没有多少人关心关于偏见的学术和技术讨论,而是转移到具有煽动性的种族话题讨论中, Yann 也终于疲于应对指责,发布了一条道歉推文,宣布自己从此将不再在推特发表重要观点。

PULSE 算法如何产生偏见?

抛开不理智的声音,这次陷入争论中心的 AI 系统偏见其实是一个存在很久热度很高的话题,今天我们就来看一下,还原马赛克图片背后的PULSE 算法究竟是怎么回事,为什么会产生偏见。

PULSE 算法背后的团队来自杜克大学,阐述这一算法的论文入选了 CVPR 2020 大会。

论文地址:https://arxiv.org/pdf/2003.03808.pdf

简单来说,该算法利用了“放大(upscaling)”技术来处理图像中的像素,其工作原理类似于将低分辨率电影高清化,就是在放大画面后增强细节。问题是,马赛克图片缺少了很多像素细节,PULSE 算法必须借助机器学习技术来填补像素不足的地方,也就是说,还原后的图像实际上并不是说复原图像本来真实的样子,而是算法通过数据记得训练,“脑补”出新的图像。

而“脑补”的过程,就需要用到英伟达的 StyleGAN。PULSE 算法进一步利用了 StyleGAN 的想象力。论文作者在文章中也指出,虽然用 PULSE 用 StyleGAN(在FFHQ上训练)作为生成模型生成了令人印象深刻的图像质量,但他们注意到当在测试以外的人脸自然图像上进行实验时会产生偏见,而他们认为 PULSE 的偏见继承自 StyleGAN 的一些固有偏见,并提出了这种偏见的来源:

  • 从潜在空间约束继承的偏差:如果为StyleGAN有色人种分布在隐空间较低密度的区域会产生偏见,这是因为PULSE对潜在空间的的必要限制,以持续生成高分辨率图像。

  • 无法收敛:在GitHub上发布的初始代码中,当在优化结束时 PULSE 仍未找到正确缩小的图像(在内)时,PULSE 无法返回“找不到图像”。因此,可能的问题是,在 StyleGAN 的输出中很难找到有色人种要比白人人少的图像。

  • 从优化继承而来:这意味着受约束的潜在空间包含各种有色人种的图像,但PULSE的优化程序未找到它们。但是,如果是这种情况,那么我们应该能够在受约束的潜在空间中找到具有足够随机初始化的图像。但是经过试验似乎并不奏效。

  • 从StyleGAN继承:一些人指出,似乎在StyleGAN的增强的潜在空间中可以生成更多元化的图像。但是,这与StyleGAN本身在训练后生成的图像集并不相似,例如,在同一篇论文中,作者展示了嵌入的不相关领域(例如猫)的图像也很成功。在他们的工作中,PULSE仅限于StyleGAN认为是真实的人脸图像。

正如算法的创建者在 GitHub 上的说明:“看起来 PULSE 生成白人面孔的频率确实比其他有色人种高很多,这种偏见很可能是从 StyleGAN 训练时使用的数据集继承而来的,也可能存在我们不知道的其他因素,”

AI 艺术家 Mario Klingemann 认为,这个问题应该归结于 PULSE 算法本身,在选择像素的逻辑上出现了偏见,而不全是训练数据的问题。Mario 强调自己可以利用 StyleGAN,从相同的低分辨率奥巴马图像中生成非白人特征的图片。

在论文中,PULSE 的作者在附录中的model card中也讨论了模型偏见,写道相比于 CelebA HQ(基于公众人物(名人)的人脸数据集),FairFace或许是评估模型时的更好选择。

偏见都甩锅给数据集对吗?

在这个案例中,AI 艺术家 Mario Klingemann 认为,算法产生偏见其实应该归结于 PULSE 算法本身在选择像素的逻辑上出现了偏见,而不全是训练数据的问题,指出自己利用 StyleGAN,从相同的低分辨率奥巴马图像中可以生成非白人特征的图片。

其实 Yann 在推特中已经很明确地表示,他的本意并不是说问题都出在数据集上,只是针对这篇论文中 PULSE 算法在特定场景下,换个数据集就能解决问题,但并不是说所有的机器学习系统偏见都来源于数据集。

机器学习系统中导致社会偏见的原因很多(这里不谈论更一般的归纳偏置):

1.如何收集数据和格式化

2.特征设计

3.模型的架构

4.目标函数

5.部署方式

摒弃偏见,还能从哪里入手?

其实,关于 去 AI 偏见的研究早就已经有了,各种方法各有利弊,但是也表明了大家对这一问题的重视。当然,最重要的思路还是从训练数据集本身入手,尽量使用不带偏见的数据集,从源头上摒弃偏见。然而,世界上不可能存在完全不带任何偏见的数据集,还需从其他角度提出解决的方案。

比如 2019 年 MIT 就提出了一种纠偏算法,可以通过重新采样来自动消除数据偏见,借助无监督神经网络 VAE (变分自编码器)学习训练数据的潜在结构,用学到的潜在分布为数据点加权,从而解决偏见问题。

这并不是人们第一次提出解决 AI 偏见问题。早在 2018 年,Facebook 曾发布Fairness Flow,会在算法因种族、性别、年龄等因素做出不公正判断时发出警告以提醒开发者。

宾夕法尼亚州立大学的研究人员开发了一种人工智能工具,用于识别人工智能系统或人类决策者对受保护属性(如性别或种族)的歧视,该工具基于因果关系的概念,即一件事(一个原因)导致另一件事(一个结果),同时利用反事实推理算法来达到最优猜测。

再比如,南加州大学信息科学研究所(ISI)的AI研究人员研究团队发表了论文《通过对抗遗忘实现不变表示》,提出了一种被称为对抗性遗忘的机制,可以首先训练神经网络来表示所分析数据的所有潜在方面,忘记指定的偏见。举例来说,用机器学习模型预测某个人的信用卡限额,使用这个机制可以教会银行的算法预测限额,同时忘记或不改变与性别或种族有关的特定数据,这意味着它可用于训练神经网络,使其与训练数据集中的已知偏差保持不变,反过来,这将导致训练有素的模型在做出决策时不会受到偏见。

奥哈拉说,记住,鉴别力衰弱时,偏见就会占上风。对于人类创造出来的 AI 系统来说也是如此,系统怎样才能具备强大的鉴别力,还需要我们继续探索。条条大路通罗马,希望在不久的将来,我们能找到那个摒弃 AI 偏见的金手指。

推荐阅读
  • 牛!Python 也能实现图像姿态识别溺水行为了!

  • 高文、张钹、杨强隔空论道:AI精度与隐私的博弈

  • 90行Python代码,让张小龙的微信地球转起来

  • 突发!印度封禁抖音、微信、快手等 59 款中国 App

  • 厉害!国内大学生计算机编程第一人,一人挑战一个队,百度最年轻 T10,现创业自动驾驶

  • Balancer因通缩代币STA遭遇闪电贷攻击,价值50万美元资产被黑

  • 浅谈分布式存储中的网络通信

你点的每个“在看”,我都认真当成了AI

深度学习先驱 Yann LeCun 被骂到封推!AI 偏见真该甩锅数据集?相关推荐

  1. 深度学习元老Yann Lecun详解卷积神经网络

     深度学习元老Yann Lecun详解卷积神经网络 本文联合编译:Blake.高斐 雷锋网(公众号:雷锋网)注:卷积神经网络(Convolutional Neural Network)是一种前馈神 ...

  2. 对话Facebook人工智能实验室主任、深度学习专家Yann LeCun

    对话Facebook人工智能实验室主任.深度学习专家Yann LeCun Yann LeCun(燕乐存),Facebook人工智能实验室主任,NYU数据科学中心创始人,计算机科学.神经科学.电子电气科 ...

  3. 深度学习综述Yann LeCun

    论文作者:Yann LeCun 1,2 , Yoshua Bengio 3 & Geoffrey Hinton 4,5 深度学习系统可用于图像识别.电子购物中的商品推.网页搜索等.传统机器学习 ...

  4. 深度学习先驱Bengio:AI顶会论文的Deadline是时候取消了

    选自yoshuabengio.org 作者:Yoshua Bengio 机器之心编译 对于机器学习界的研究者来说,一年的进度条几乎是靠数着顶会 deadline 来过的.「投稿→rebuttal→接收 ...

  5. 2021 几何图机器学习大盘点 | 几何深度学习先驱 Michael Bronstein长文解读

    导读:几何机器学习和基于图的机器学习是当前最热门的研究课题之一.在过去的一年中,该领域的研究发展迅猛.在本文中,几何深度学习先驱 Michael Bronstein 和 Petar Veličkovi ...

  6. 深度学习已入末路,谁能引领下一代AI?

    https://www.toutiao.com/a6656350889747415556/ AI能将一根香蕉照片识别成一台烤面包机,尽管AI在训练阶段可能被展示了数千张香蕉.蛞蝓.蜗牛以及其他类似物体 ...

  7. 四天人工智能 python入门体验课_百度深度学习7天打卡营,用Python+AI识别“青你2”小姐姐的高颜值...

    原标题:百度深度学习7天打卡营,用Python+AI识别"青你2"小姐姐的高颜值 "淡黄的长裙,蓬松的头发",一夜之间洗脑全网,小姐姐们实在太让人上头了! 导师 ...

  8. 花书+吴恩达深度学习(十九)构建模型策略(训练模型顺序、偏差方差、数据集划分、数据不匹配)

    目录 0. 前言 1. 调试模型顺序 2. 偏差方差的解决方法 3. 数据集的选取划分 4. 数据不匹配问题 5. 评估指标的选取 6. 贝叶斯最佳误差 如果这篇文章对你有一点小小的帮助,请给个关注, ...

  9. 深度学习综述(LeCun、Bengio和Hinton)

    原文摘要:深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示.这些方法在许多方面都带来了显著的改善,包括最先进的语音识别.视觉对象识别.对象检测和许多其它领域,例如药物发现和基 ...

最新文章

  1. 自动驾驶安全框架开发进展综述
  2. 程序员面试题精选100题(04)-二元树中和为某一值的所有路径[数据结构]
  3. ubuntu16.4中创建帐户
  4. 一个服务器上配置多个tomcat
  5. [css] 说下你对css样式的这几个属性值initial、inherit、unset、revert的理解
  6. HP 维保自助查询链接
  7. linux把程序添加到全局环境变量
  8. VM在使用过程中开机频繁黑屏(VM14版本问题导致的,频繁开机黑屏)
  9. 中达优控触摸屏编程视频教程_中达优控触摸屏软件下载 YKBuilder(中达优控触摸屏编程软件) v5.0.200 官方安装免费版 下载-脚本之家...
  10. ld 无法找到项目符号 链接失败_【Linux】一步一步学Linux——ld命令(256)
  11. 第二章-数据描述(初级统计)
  12. 机器学习:房价预测项目实战
  13. 人工智能现在的技术“好玩”到了什么程度?
  14. 大数据集可以用自助法吗_基于大数据的自助点餐方法和点餐匹配系统与流程
  15. tcp 粘包 丢包 解决方案
  16. U盘容量会“缩水”当心文件丢失
  17. 字典破解密码实验(Python3)
  18. 《你必须知道的的495个C语言问题》阅读笔记-(第4章)指针篇
  19. LTM提示使大语言模型中的复杂推理成为可能
  20. 黑客也看《人民的名义》:把手机卡扔马桶有 bug

热门文章

  1. 阿里90后工程师利用ARM硬件特性开启安卓8终端“上帝模式”
  2. a标签是什么意思 怎么使用?
  3. 新盒模型移动端的排版
  4. 点分十进制IP校验、转换,掩码校验
  5. Same binary weight (位运算)
  6. 在windows sever 2008系统中如何添加桌面体验功能
  7. 利用三层交换机实现VLAN的通信实验报告
  8. surface pro 3 linux,新闻|在Surface Pro 3上运行Ubuntu – 虽不完美但很有戏
  9. 深度学习各种环境问题积累
  10. 修改mysql的时间/时区