编译 | 禾木木

出品 | AI科技大本营(ID:rgznai100)

很多公司都使用机器学习来分析人们的欲望、厌恶或面孔。研究人员提出了一个不同的问题:我们如何让机器忘记学习?

机器学习正在寻找如何在人工智能软件中诱发选择性失忆的方法。目标是从机器学习系统中删除特定人员或数据点的所有痕迹,而不影响其性能。

如果该功能可以实现,这个概念可以更好地让人们控制他们的数据和产生的价值。尽管用户已经可以要求一些公司删除个人数据,但他们并不清楚算法是如何调整这些信息。机器忘掉学习却有可能让一个人撤回他们的数据和公司获利的方法。

该方法对于那些想删除网上分享的内容来说很直观,但人工健忘症的概念需要计算机科学方面的一些新想法。

你认为这个想法可以实现吗?

这些公司花费数百万美元训练机器学习算法来识别面孔或对社交帖子进行排名,算法比手动编码人员可以更快地解决问题。但一旦经过训练,机器学习系统就不会轻易改变,甚至不会被理解。消除特定数据点影响的传统方法是从头开始重建系统,这是一项代价高昂的工作。

宾夕法尼亚大学机器学习的教授亚伦罗斯表示“这项研究旨在找到一些中间立场,当他们要求删除数据时,我们能否消除他们数据的所有影响,同时避免从头开始重新训练的全部成本?”

机器取消学习的工作部分是由于人们关注到人工智能可能侵犯隐私的方式。长期以来,世界各地的数据监管机构都有权强制公司删除不良信息。例如欧盟和加利福尼亚州的公民,如果他们对披露的内容改变了主意,他们有权要求公司删除他们的数据。最近,美国和欧洲的监管机构表示,人工智能系统有时必须更进一步:删除针对敏感数据进行训练的系统。

“当他们要求删除数据时,我们能否消除他们数据的所有影响,同时避免从头开始重新训练的全部成本?”

去年,英国数据监管机构警告,一些机器学习软件可能会受到 GDPR 权利的约束,例如数据删除,因为 AI 系统可能包含个人数据。安全研究人员已经表明,算法有时会被迫泄露其创建中使用的敏感数据。今年年初,美国联邦贸易委员会迫使面部识别公司 Paravision 删除了一系列以不当方式获取的面部照片和用它们训练的机器学习算法。FTC 专员 Rohit Chopra 称赞这种新的执法策略是一种迫使违反数据规则的公司“丧失其欺骗成果”的方式。

取消机器学习研究的小领域正在努力解决这些监管转变带来的一些实际和数学问题。研究人员已经表明,他们可以让机器学习算法在某些条件下忘记,但该技术尚未准备好。

“对于一个年轻的领域来说很常见,这个领域渴望做的事情与我们现在知道如何做的事情之间存在差距,”罗斯说。

多伦多大学和威斯康星大学麦迪逊分校的研究人员在 2019 年时,提出了一种很有前景的方法是将新机器学习项目的源数据分成多个部分。单独处理每个,然后将结果组合到最终的机器学习模型中。如果需要忘记一个数据点,则只需重新处理原始输入数据的一小部分。该方法被证明适用于在线购买数据和超过一百万张照片的集合。

Roth 和来自宾夕法尼亚大学、哈佛大学和斯坦福大学的合作者最近证明了这种方法的一个缺陷,表明如果提交的删除请求以特定的顺序出现,无论是偶然的还是来自恶意行为者,学习系统都会崩溃。并且他们还展示了如何缓解这个问题。

滑铁卢大学教授 Gautam Kamath 也致力于取消学习,他说该项目发现并解决的问题是,关于如何使机器取消学习不仅仅是实验室好奇心的许多悬而未决的问题的一个例子。他自己的研究小组一直在探索通过连续取消学习多个数据点来降低系统准确性的程度。

Kamath 还对寻找方法让公司证明——或监管机构来检查——系统真的忘记了它应该忘记的东西。“感觉好像还有一段路要走,但也许他们最终会为这类事情配备审计员,”他说。

随着 FTC 和其他机构仔细研究算法的力量,调查解除机器学习可能性的监管理由可能会增加。牛津大学研究数据保护的教授鲁本·宾斯 (Reuben Binns) 表示,近年来在美国和欧洲,个人应该对其数据的命运和成果有发言权的观念越来越多。

在科技公司真正实施机器学习之前,需要精湛的技术工作,让人们更好地控制其数据的算法命运。即便如此,该技术可能不会对人工智能时代的隐私风险产生太大影响。

差分隐私是一种巧妙的技术,可以对系统泄漏的个人信息进行数学限制,提供了有用的比较。苹果、谷歌和微软都对这项技术赞不绝口,但使用相对较少,隐私风险仍然很多。

Binns 说,虽然它确实很有用,但“在其他情况下,它更像是一家公司所做的事情,以表明它正在创新。”他怀疑机器取消学习可能会证明是相似的,与其说是数据保护的重大转变,不如说是对技术敏锐度的展示。即使机器学会忘记,用户也必须记住要小心与谁共享数据。

参考链接:

https://www.wired.com/story/machines-can-learn-can-they-unlearn/

本文由AI科技大本营翻译,转载请注明出处。

这是一个好问题:既然机器可以学习,它们能忘掉吗?相关推荐

  1. 经典笔试题:用C写一个函数测试当前机器大小端模式

    "用C语言写一个函数测试当前机器的大小端模式"是一个经典的笔试题,如下使用两种方式进行解答: 1. 用union来测试机器的大小端 1 #include <stdio.h&g ...

  2. 每日一题(38)—— 一个32位的机器,该机器的指针是多少位?

    一个32位的机器,该机器的指针是多少位? 指针是多少位只要看地址总线的位数就行了.80386以后的机子都是32的数据总线.所以指针的位数就是4个字节了.

  3. 纯新手入门机器/深度学习自学指南(附一个月速成方案)

    原作:Masum Hasan 问耕 编译整理 量子位 出品 | 公众号 QbitAI 怎么入门机器/深度学习? 回答这个问题,最先要考虑的问题是:你有多少时间? 准备用三个月入门,和想要一个月速成,肯 ...

  4. Hive thrift服务(将Hive作为一个服务器,其他机器可以作为客户端进行访问)

    步骤一:启动为前台:bin/hiveserver2 步骤二:启动为后台:nohup bin/hiveserver2 1>/var/log/hiveserver.log 2>/var/log ...

  5. 机器不学习:浅析深度学习在实体识别和关系抽取中的应用

    机器不学习 jqbxx.com -机器学习好网站 命名实体识别(Named Entity Recognition,NER)就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型,如下图.命名实体 ...

  6. 2021 年了,机器/深度学习还有哪些坑比较好挖?

    作者丨张趔趄.微调.金雪锋 来源丨知乎问答 编辑丨极市平台 导读 深度学习以及机器学习发展至今,涌入了大量的人才和资源,有很多方向已经达到了一个瓶颈,短时间内有非常大的突破有些难以实现.那么对于有学术 ...

  7. 送你一份机器/深度学习自学指南(附视频amp;速成方案)

    本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处. 本文约3052字,建议阅读6分钟. 本文详细讲解了机器/深度学习的学习方法,一共为分三个部分,做出了详细的指南. 怎么入 ...

  8. 前方高能!AI 大牛 LeCun 设想下一个新前沿:摈弃深度学习的所有概率技巧,改而掌握不断转变的能量值...

    来源:云头条 据深度学习界的领军人物Yann LeCun声称,AI的下一个发展阶段可能是摈弃深度学习的所有概率技巧,改而掌握不断转变的能量值. 据说工程师(以及一些科学家,但以工程师为主)早在坐到板凳 ...

  9. Java还欠缺什么才能真正支持机器/深度学习?

    如何让团队开始使用ML以及如何最好地将ML与我们运行的现有系统集成? 实际上没有用Java构建的ML框架(有DL4J,但我真的不知道有谁使用它,MXNet有一个Scala API而不是Java,而且它 ...

最新文章

  1. 盘点热门的目标检测开源方案(附论文+代码下载)
  2. linux 下载jdk
  3. wireshark C插件开发
  4. IDEA 中的神奇插件:防沉迷、防猝死...
  5. BAT教程 第三节(FOR命令中的变量)
  6. C# Image 学习总结
  7. PUTTY、Xshell远程连接Linux与PUTTY、Xshell密匙认证
  8. 写给粪坑里的钻石——烂公司里的好员工
  9. 常用于单片机的接口适配器模式C语言实现
  10. HTML文本框写在同一行,标签和文本框在同一行使用css
  11. 陀螺仪传感器维特智能WT901JY901九轴传感器受金属干扰的解决方法。九轴陀螺仪、九轴传感器、磁场计、姿态感应器
  12. 华为丁耘突发疾病去世
  13. android面试题之四(红黑联盟)
  14. 移动架构师第一站UML建模
  15. 久违的狮子王,王者归来
  16. Python干旱指数库climate_indices学习
  17. 小白记录第一个Android APP,VS2019,Xamarin,C#
  18. 安卓屏幕坏了怎么把资料拷出来_选择苹果还是安卓呢?(老安卓转苹果11用户体验)...
  19. MarkDown语法详解
  20. Windows10 IoT 企业版 LTSC 2021安装应用商店

热门文章

  1. 标准功能模块组件 -- 内部联络单组件,内部邮件组件,提高多人异地协同办公效率...
  2. 使用Powershell管理Linux 下的 SQL Server
  3. android上line-height的问题
  4. 建立名称server
  5. Openssl req命令
  6. 一个多年网络工程师总结的工作实用经验
  7. MySQL两主多从,且故障转移配置
  8. “80后”财富新贵创业秘诀
  9. mysql的调用有哪三种方式_MySQL数据库之mysql命令行中执行sql的几种方式总结
  10. inshot怎么转gif_Figma插件开发-生成Gif