译者:momojyang原文作者:Viktor Mayer-Schönberger and Kenneth Cukier

算法的预言的基础可能为常人所不能理解。图片来源:David Guttenfelder/AP

本文摘自维克多•梅耶•松博格与肯尼迪•古奇尔合著的《大数据:改变我们生活、工作、思考的革命》

现在的电脑系统是根据编写程序时明确要求它们遵循的规则来进行运算的。因此,当一个结果偶尔无可避免地出错的时候,我们可以回过头去,看看电脑是如何得出这个结果的。比如说,我们可以问“为什么外部传感器发现湿度突然大幅上升时,自动驾驶系统会将飞机抬高五度?”今天的电脑代码可以被打开检查,知道如何翻译代码的人可以追踪并理解运算的基础,无论这个基础如何复杂。

但是,有了大数据分析之后,这种追踪就会变得困难许多。算法预言的基础可能会复杂得让常人难以理解。

当电脑根据程序编写的明确要求遵循系列指令,比如IBM在1954年发展的将俄语翻译为英语的程序,人可以轻易理解为什么软件会用一个词代替另一个词。但谷歌翻译在判断英语单词“light”是该翻译成法语的“lumière”还是“léger”时(即描述光还是重量),却动用了数十亿页的翻译资料。一个人不可能追踪到程序作出最后选择的准确原因,因为这些选择是基于海量的数据和大量的统计运算的。

大数据运作的规模也超乎我们的想象。比如,谷歌分辨几个搜寻关键词和流感的关联是测试四亿五千万个数学模型的结果。相对地,辛西娅•鲁丁(Cynthia Rudin)为检修孔是否会着火设计了106个预报,而且她可以向联合爱迪生电力公司的经理们解释为什么她的程序优先了某些检查位置。人工智能界所说的“可解释性”,对于我们常人来说是很重要的,我们总是想知其所以然,而不仅是知其然。可是,如果系统自动生成了601个预报,而不是106个呢?如果这601个中大多数都不是特别重要,但把它们放在一起,就会提升模型的精确性?任何预报的基础都可能非常复杂。要说服经理们重新分配有限的预算,她该告诉他们什么呢?

在这个情景中,我们可以看到,大数据预报的风险,及其背后的算法和数据集,可以变成不可说明、不可追踪、甚至不可信的黑匣子。要防止这样的事情发生,大数据需要监控和透明,这就要求新的专业知识和机构。这些新成员会帮助社会仔细检查某些领域的大数据预报,会让被数据伤害的人得到平反。

在社会上,当一个特定领域的复杂性和专业性大幅上升,因而对管理新技术的专家产生紧急需求时,我们常会看到这些新实体出现。法学、医学、会计和工程学的专业人才在超过一世纪前就经历了这种巨变。最近,电脑安全和隐私专家突然冒起,以保证公司遵从诸如国际标准组织这样的机构订立的最佳操作准则(该组织本身就是成立来满足该领域对指引的新需求的)。

大数据会需要新的一群人来担当这个角色。也许他们会被称为“算法师”。他们可能分两类——从外部监测公司的独立实体,或从内部监测公司的雇员或部门——就像公司有内部会计师和外来审计师来检查财务一样。

算法师的崛起

这些专业人士会是电脑科技、数学和统计学方面的专家;他们会检查大数据的分析和预报。算法师必须中立并保密,就像会计师和其他一些职业现在所做的那样。他们会评价数据源的选择,分析和预报工具的选择,包括算法和模型,以及对结果的阐释。在有争议时,他们会获取得出某个结果的算法、统计方法和数据集。

如果2004年的时候国土安全局有算法师,他就可能防止该局产生一张如此多错误的禁飞名单,上面竟然还有参议员肯尼迪。在日本、法国、德国和意大利,最近都有算法师本可以有所作为的例子,这些国家的人们抱怨说谷歌的“自动完成”功能诽谤了他们,这个功能会根据一个输入的名字产生一系列常见的搜索关键词。这些词基本是基于过往搜索的频率得出的:词语根据概率排列。尽管如此,当一个潜在的商业伙伴或情人上网查我们的时候,我们的名字跟“罪犯”或“妓女”放在一起的,谁能不生气呢?

我们眼中的算法师是为像这样的问题提供市场导向的解决方法的人,他们的存在可能减少过分的规范管制。他们满足的需求与会计师和审计师在二十世纪早期出现应对泛滥的金融资讯所满足的需求是相似的。人们难以理解数字突击。它要求专家以灵活而自律的方式组织在一起。市场的反应是让专门进行财务监察的有竞争力的公司形成一个新兴部门。通过提供这种服务,新型职业提升了社会对经济的信心。大数据可以,而且应该,算法师可以提供的相似信心中获益。

外部算法师

我们眼中的外部算法师可以在政府需要的时候,比如法庭发出命令或颁布规章,以中立审计师的身份检查大数据预报的准确性或合理性。他们也可以把大数据公司当成客户,给需要专业支持的公司提供审计服务。他们可以保证大数据应用软件的稳定性,例如反欺诈技术或库存盘点系统。最后,外部算法师可以为政府部门提供关于如何在公共领域最好地利用大数据的咨询服务。

如同医学、法学或其他专业一样,我们认为这个新行业会有一套行为准则来规管自己。算法师的中立性、保密性、竞争力和专业性是通过严格的问责规则来保证执行的。如果他们不能符合标准,他们就会惹上官司。他们也可以在庭审中被传召为专家证人,或“聆案官”,这些是由法官任命来协助审理某些复杂案件中的技术问题的。

另外,那些认为自己被大数据预报伤害的人——被拒绝实施手术的病人,被拒绝保外就医的犯人,被拒绝抵押贷款的申请人——可以请算法师,就像请律师一样,帮忙分析和提出上诉。

内部算法师

内部算法师在机构的内部监察大数据活动。他们不仅关注企业的利益,还关注被企业的大数据分析影响到的人的利益。他们监督大数据操作,任何人觉得自己被该机构的大数据预告伤害到的时候,内部算法师是他们第一个联络的人。他们在数据公布前检查分析的完整性和准确性。要完成头两个任务,算法师必须在他们供职的企业内享有一定程度的自由和中立性。

一个雇员对公司的运作保持中立的想法看起来可能有点反直觉,但这样的情况其实是挺普遍的。主要金融机构的监察部门就是一个例子。许多公司的董事会也是,他们要对股东而非管理层负责。许多媒体公司,包括《纽约时报》和《华盛顿邮报》都会请监察员,他们的基本职责就是保护公众的信任。这些雇员处理读者的投诉,并常在确定雇主有错时,公开谴责他们的雇主。

与内部算法师更相近的一个例子是,负责保证个人资料不被公司滥用的专业人士。举个例子,德国要求一定规模以上的公司(一般是有十个或以上雇员负责处理个人资料)安排一名数据保护代表。自二十世纪七十年代开始,这些内部代表发展起了一套职业操守和团队精神。他们定期开会,分享最好的做法和训练,并有他们自己的媒体和研讨会。另外,他们已经成功保持对其雇主及其中立检察人员身份的忠诚,一方面作为数据保护检查员,另一方面通过公司行为贯彻信息死因的价值观。我们相信内部算法师也可以做到。

打开黑匣子

没有任何简单的方法可以让我们充分准备好迎接大数据的世界。它要求我们建立新的准则以规管自己。我们实际操作上的一系列重要改变可以在社会注解熟悉大数据的特点和缺点时提供帮助。我们必须设计保障,让新的“算法师”专业阶层可以评估大数据分析——这样一个因为大数据而变得难以掌握的世界才不会变成一个黑匣子,用一种不可知代替另一种不可知。


本文作者是维克多•梅耶•松博格和肯尼迪•古奇尔。

维克多•梅耶•松博格是牛津大学牛津互联网中心的教授,出版了八本书。他是微软和世界经济论坛的顾问委员会的成员。

肯尼迪•古奇尔是《经济学人》的数据编辑,大数据发展方面的著名评论家。

转自  http://select.yeeyan.org/view/369864/353944

转载于:https://www.cnblogs.com/renly/archive/2013/03/26/2983106.html

我们用大数据创造没人能理解的人工智能相关推荐

  1. 你能用大数据创造一个新的商业模型吗?

    美国著名的技术创业训练营 Y Combinator, 一个众所周知的连接有潜力的新贵科技公司和风险投资的纽带.它另一个鲜为人知但是同等重要的功能,就是训练创业公司的所有者向所有可能最好的商业模型发展. ...

  2. “聚沙成塔”——用大数据思维理解生命的复杂体系,数据之眼看显微镜下的复杂生命【数据故事计划二等奖】...

    摘要:细听学长学姐讲故事,或许在他们的路上也有你的身影! [第一届数据故事计划] "数据故事计划"旨在收集各类有关大数据的故事然后进行比赛及相关的宣传和推广.包括同学们接触大数据. ...

  3. 阿里“三活”数据中心实践经验:没人能做,我们就自己做

    阿里"三活"数据中心实践经验:没人能做,我们就自己做 发表于2015-10-29 18:11| 4813次阅读| 来源CSDN| 4 条评论| 作者郭雪梅 阿里云数据中心运维多活数 ...

  4. 用大数据和机器学习揭示十二星座的真实面目(下) ‖ 处女座Get√

    在推送完本文上半部分用大数据和机器学习揭示十二星座的真实面目!(上)后,好多鸡油留言.都对本文为"被黑了很久的双鱼座" 正名表示了强烈的支持.我猜留言的一定是心里已经憋出内伤的双鱼 ...

  5. 什么是大数据,企业如何正确使用大数据

    如今大数据已经成为了大家口中的热门话题,很多企业能够对其进行合理的挖掘使用,产生良好的商业价值.但是有一些企业依然不知道或者不能够正确的使用它.那么,我们要怎么合理并且以一种合适的方式加以开发.使用大 ...

  6. 电子商务中如何使用大数据

    大数据在很多的领域中都有应用,而且大数据所涉及到的领域都有不同程度的进步和发展,这是一个值得欣慰的事情,当然也正是这个原因,很多的行业都争先恐后地使用大数据技术.当然,电子商务也不例外,在这篇文章中我 ...

  7. 《有限与无限的游戏》第二章 没人能独自玩游戏:经典摘抄(3)

    将社会视为文化的一种,并不等同于要推翻甚至或改变社会,而只是去消除它感知的必要性.无限游戏的参与者有他们的规则,他们只是不忘记这一点:规则是对一致同意的一种表达,并不是对一致同意的要求. 社会由其边界 ...

  8. 技术派的梦想旅行 用大数据推动旅游2.0

    本文讲的是技术派的梦想旅行 用大数据推动旅游2.0[IT168 资讯]旅游与每个人的生活息息相关,旅游产业也亟需一种脱胎换骨的方式提升效益.在近日第15届中国互联网大会"互联网+民航&quo ...

  9. 用大数据为互联网金融保驾护航

    近日,在"2015·上海新金融年会暨外滩互联网金融外滩峰会"上,中国人民银行条法司司长张涛表示,互联网和金融结合之后,金融风险的特点如传导性.广泛性.突发性依然存在,所以在创新的时 ...

  10. 如何用大数据和开放平台创新

    在一个大部分数据可以实时获取而且存储没有限制的世界里,金融机构该如何竞争?更多的数据和更多的数据归档服务不一定能帮助金融机构更好地服务客户,除非可以以一种能为顾客带来便利的独特方式使用这些数据.你的银 ...

最新文章

  1. Python爬虫案例-获取最新的中国行政区域划分
  2. Spring 国际化例子
  3. Oracle备份提示,EXP-00091: 正在导出有问题的统计信息。
  4. Metail Design入门(一)
  5. 神经网络中的激活函数的比较
  6. java连接ibm mq
  7. SQL Server 2005新特性之使用with关键字解决递归父子关系
  8. Algorithm-Gossip(4) 三色棋(Three_Color_Flag)
  9. 一文说清linux system load
  10. Android之远程图片获取和本地缓存
  11. java中几种Map在什么情况下使用,并简单介绍原因及原理
  12. 第十六章 python Pygame的使用
  13. provisional headers are shown问题排查
  14. 【小睿精选·第七期】基于STM32的DIY蓝牙机械键盘
  15. C语言入门(一代小白被迫被拔苗助长)
  16. 【HDU】4942 Game on S♂play 线段树
  17. 如果用seagull php框架开发一个类似zen cart,Oscommerce,magento这样的模块会什么样
  18. FRAM芯片扩展在低功率应用中的耐力
  19. 微信小程序搜索功能的实现(模糊搜索、带历史记录)
  20. python软件-mPython(图形化编程软件) V0.5.0 官方版

热门文章

  1. golang 猜数字小游戏
  2. LINUX OpenGL简单测试代码
  3. LINUX使用patchelf增加/修改rpath
  4. 查看JDK进程信息的几个命令
  5. LINUX SHELL mkdir建立多级目录
  6. JDK8-u271/u272的jre和jdk/jre的文件有差异
  7. Looking for pthread_create - not found
  8. 纽微特纪事:改个字串,竟然成了“二期工作”,还拖了几个月
  9. LINUX上开发ffmpeg程序,查看链接的库
  10. FireFox使用百度网盘插件