https://www.toutiao.com/a6696362352897425927/

原文载于Fast Company,作者Harry McCracken

2017年,Facebook因平台内容(例如假新闻、仇恨言论等)引发一系列争议。很显然,Facebook认为解决这些问题的方案就是最古老的信息处理设备——人的眼睛。

Facebook宣布将增加数千名审核人员浏览用户的贴文,以过滤攻击性、非法或其他有问题的内容。这相当于承认仅依靠技术无法遏制社交网络的危险分子。许多专家宣称,并无任何迹象表明人工智能能够在无人为干预的情况下识别和清除有问题的内容。

Facebook的首席技术官Mike Schroepfer在今年举办的Facebook F8开发者大会第二天的主旨演讲中表示,人工智能已经能够大规模检测不适当的内容。他还说道,Facebook及其他公司的研究人员当前正在攻克技术难关,从而让软件能够在较少人工干预下处理更多工作。

在本周早些时候,他在Facebook总部的会议室向我展示了他计划在主旨演讲中展示的图表,其中包括代表各种违规项目(垃圾邮件、假账户、色情、暴力内容)的条形图,统计数据显示了Facebook何时开始利用人工智能识别这些违规项目以及人工智能何时能够承担大部分流程。

Schroepfer希望通过分享这些数据,反驳关于Facebook并未采取谨慎措施清理平台问题内容的观点。然而,他很快就承认还有更多工作有待完成,但并没有批评持怀疑态度的人。

他说,“对于我个人而言,最让人难以接受的事情是有人认为我们根本不在乎。我们并非不在乎,也并非没有将其作为优先事项,同时也并不是因为‘其并非我个人的日常经历’。但人们有权发表自己的观点,直到我们解决这些问题,他们才有理由证明自己的观点。”

Schroepfer非常谨慎地强调,不能忽视人工智能作为解决内容审核问题通用方案的优势。他说道,“我预测在短期内我们还是需要人工参与审核环节,因为这些问题本质上是人的问题,我们需要确定哪些是仇恨言论或人为误导信息。”

但他还说道,人工智能可能会处理越来越多繁重枯燥的审核工作。正如Casey Newton二月份在Verge报道中所述,成天关注Facebook最糟糕用户发布的可怕内容不仅无趣,而且会侵蚀人的灵魂。

Schroepfer说,“有些内容确实不堪入目。因此,如果我们可以删除这些最糟糕的内容,接触这些内容的人就会少一些。”

一个人承担两项工作

Schroepfer估计,他目前大约将一半的时间用于处理Facebook当前面临的技术难题,另一半精力用于其他任务,包括更有趣的未来事项,例如Oculus VR。

他说,“有时,我每天要花70%的时间,有时花30%的时间。”当谈到研究时,他的回答就有些含糊。例如,Facebook关于门户网站视频聊天屏幕智能拍摄的机器调查,其可以帮助公司审查视频,同时更快速删除问题视频。Schroepfer说,“我像是生活在两个不同的世界,这让我感到兴奋。”

技术行业在教授人工智能识别事务(文本和视觉项目)方面取得了一些进展,无需大量人工参与。这项技术超越当前的机器学习技术,但需要进行大量的人类相关前期训练。

Schroepfer说,传统训练“主要存在两大方面的问题”。“一是定制化严重,如果训练未涉及到相关内容,就可能难以发现问题。第二,整个过程进度缓慢,可能需要数周才能建立全新的分类器。”计算机可自动处理的事项越多,在一系列任务中的表现就越好。

Schroepfer提到谷歌正在开展“BERT”研究项目。这相当于变量器的双向编码器,如果你不是人工智能科学家,就很难理解这些事项,但基本思想并不难理解。我们并非用人类选择的案例训练人工智能模型,而是向机器提供类似于文字谜题的项目。这种练习就像“配对游戏”,隐藏句子中的部分单词,让计算机补充缺失的单词。另一种方式是向计算机提供成对的句子,然后让计算机猜测第二个句子是否与第一个句子出自同一篇文章。

计算机科学家正将类似的技术运用于视频审查,例如向人工智能模型提供一段视频和音轨,然后让其预测两者是否匹配。Facebook的科学家还会向人工智能模型提供成对的视频片段,然后让其猜测片段的来源是否相同。根据Schroepfer所述,这种训练方法可以将人工劳动量从12,000小时减少到80小时。他说,“这节省了几个数量级的时间”。

这些文本和视觉谜题输入算法的过程相对容易:Schoepfer说,“你可以输入大量数据,并进行改编。”软件解决的谜题越多,未来处理问题的准确度就越高,因为软件是根据情境线索理解内容——这项技术广泛运用于Facebook,从识别不合格的广告到智能安排新闻资讯。这些技术属于“自我监督”训练类别,Facebook 首席人工智能科学家Yann LeCun将其称之为人工智能在未来十年的重大机遇之一。

更有效训练的关键并不在于降低该流程理解Facebook上内容过程的重要性。相反,这可以通过更多训练处理其他类型的内容,并且可以处理人工难以应对的繁重工作。Schroepfer提到了一个已在Facebook上使用的自我监督学习案例:“如果我们正在训练分类器判断人们是否在谈论选举,我们可以同时训练多种语言,这样在印度等地方的效果会更好。”

Schroepfer最后说道,他能够看到技术行业当前阴霾消散的那一天,这也并非仅Facebook面临的问题。“我认为我们现在对技术的态度极度悲观,或者接近极度悲观。”他补充说道,对于Facebook而言,解决方案的内容包括公司应当在出现问题之前更好地识别问题,继而尽早部署技术和人力资源。

他说,“实际上,我们识别问题的能力正处于历史最强时期,因为其中有些问题是可预测的。我们可以更迅速地应对新事物。即使我们并未预测到问题,我们仍然可以通过运营能力解决问题。”

Facebook的首席技术官:人工智能已用于内容审核,未来会做更多相关推荐

  1. Facebook、YouTube都会遇到的内容审核难题,今日头条是怎么解决的?

    截止到2022年,Facebook全球月活已经突破27亿,Youtube是20亿,微信也超过13亿,可以说互联网已经覆盖了全球大部分人口,而随着使用人口同步激增的还有用户时长,以及内容的生产消费量级也 ...

  2. 基于百度AI的内容审核平台+Jsoup网络爬虫开发的一个自动审核小说程序(以纵横中文网为例)

    这个程序是我的毕业设计所设计的一个程序,由于时间原因,可能有些地方或者细节没有考虑清楚,请各位多多包涵 最后的源代码工程我已经上传,有需要的可以自取,希望可以帮助到大家 程序简介 此程序使用Java语 ...

  3. java对接七牛后台进行内容审核(鉴黄、敏感人物、暴恐)

    关于七牛内容审核的介绍 在七牛的控制台找到智能多媒体 接下来找到智能内容审核,可以看到一些审核数据情况,主要包含:鉴黄.暴恐.敏感人物 另外看一下API接口说明: 查看地址是:https://deve ...

  4. java复核审查_java对接七牛后台进行内容审核(鉴黄、敏感人物、暴恐)

    关于七牛内容审核的介绍 在七牛的控制台找到智能多媒体 接下来找到智能内容审核,可以看到一些审核数据情况,主要包含:鉴黄.暴恐.敏感人物 另外看一下API接口说明: 查看地址是:https://deve ...

  5. 硅谷色情谷的良心,XHamster的内容审核竟然比Facebook强?

    全文共3018字,预计学习时长9分钟 来源:Pexels 在中国,虽然现在人们思想开放了很多,但"谈性色变"的现象还是不在少数. 不管国内还是国外,对于"色情业" ...

  6. 图普科技:国内最早将人工智能深度学习技术应用于互联网内容审核的企业之一 | 百万人学AI评选

    2020 无疑是特殊的一年,而 AI 在开年的这场"战疫"中表现出了惊人的力量.站在"新十年"的起点上,CSDN[百万人学AI]评选活动正式启动.本届评选活动在 ...

  7. 面对海量内容,如何快速完成视频内容审核?

    如今,随着智能时代的快速发展,智能审核系统在专做内容的平台上已经很常见. 在面对巨大的内容审核压力之下,基于人工智能的智能审核系统被广泛用于各类内容的审核和标注.但是,技术水平通常会限制评估错误. 为 ...

  8. Facebook背后的人工智能

    是时候停止把Facebook当作纯粹的社交媒体公司来看了.它用无人机提供互联网服务,为了发展虚拟现实而收购Oculus,不懈追求人工智能,Facebook已经迅速成为世界上最先进的技术研究中心之一了. ...

  9. Twitter或面临欧盟更严格内容审核;韩国电商巨头用机器人军团替代仓库工人;高通公司副总裁加盟三星丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 投融资 辰鳗科技完成新一轮五千万元融资 数字化能源管理服务企业四川辰鳗科技有限公司(以下简称"辰鳗科技")于2月7日宣布 ...

最新文章

  1. 2019牛客暑期多校训练营(第三场)
  2. ES6_入门(1)_let命令
  3. 回答知乎问题:你写过什么自认为惊艳的诗?
  4. star-cd linux安装,linux 使用PXE方式,kickstar网络安装系统
  5. chkdsk 和sfc.exe修复命令
  6. exe文件解包_如何获取别人微信小程序的源文件?
  7. python学习6 web开发
  8. linux socket 结构定义 send,Linux下Socket编程中用send发送结构体
  9. IBM科学家凌棕:欧美国家的智慧交通与管理
  10. GEF: 图形拖拽处理
  11. 【图论】最优乘车(最短路变形)
  12. 亲测源码多多进鱼带VUE源码任务悬赏源码活动营销三级分销返佣积分商城版
  13. 苹果鼠标滚轮驱动_双飞燕血手幽灵V8M Max电竞鼠标兼具功能和性价比
  14. 机器学习根据文字生成图片教程(附python代码)
  15. Word 分节符的删除(不改变文章格式)
  16. eclipse 缓解眼睛疲劳保护眼睛
  17. 我的梦想是成为一名计算机程序员英语怎么说,我的梦想英语作文带翻译八篇(I have a dream)...
  18. 配置计算机老是重启,电脑无缘无故重启是什么原因_电脑老是无故自动重启如何解决-win7之家...
  19. java的web开发之旅——第1站html
  20. 2020安徽省程序设计省赛知识点

热门文章

  1. AttributeError: module ‘sys‘ has no attribute ‘maxint‘
  2. mongodb 与 mysql区别 NOSQL 型号与SQL型号的区别 是非关系型号与关系型号的区别
  3. 深入理解特征值与特征向量
  4. 一个伟大、孤僻、特立独行的灵魂:天才已去60年
  5. Neighbor2Neighbor: Self-Supervised Denoising from Single Noisy Images
  6. TensorBoard可视化网络结构和参数Tensorboard windows显示空白
  7. 入选Gartner全球AI魔力象限,阿里云解读AI工程化为什么需具备这三大基础能力?...
  8. 活动总结丨企业参访:特斯联科技集团有限公司
  9. 深度解析机器学习中的置信区间(附代码)
  10. 我在谷歌实习时发现了一个模型 bug,于是有了这篇 ACL