时代周刊》:用形象化的老办法对付大数据

2015年08月03日 14:46 新浪财经 微博

0 分享 添加喜爱 打印 增大字体 减小字体
图为最新期《时代周刊》杂志封面

  导读:《时代周刊》最新一期封面文章称,我们每天被数据海洋淹没,只有让冷冰冰的数据形象化,变成看得见摸得着的东西,我们才能从中挖掘出意义。

  威廉-普莱费尔(William Playfair)生于1759年,在家里排行老四,父亲是上进的苏格兰大臣。他年纪轻轻便当上瓦特的个人助理,随后从事制图、会计、工程、经济、银匠、土地投机、记者等多种职业,取得大小不等的成功。最终他在贫困中去世。

  不过在此过程中,他差不多是不声不响地一手创立了统计图表学,发明了柱状图、线形图和扇形图。1786年他出版《商业和政治地图集》,该书以一副英国历史进出口图开场,放在今天的话与本刊的排版看上去并不太脱节。用他自己的话说,“普莱费尔是将几何原理用于财政事务之第一人”。

  他生不逢时。如果他活在当今时代,普莱费尔很可能身居硅谷一家受热捧创业公司的首席数据官高位。我们周围的世界发生着看不见但影响巨大的转变,即从信息稀缺到信息过剩的无声颠覆。人类进化首先面临的是食物短缺,如今我们却遭受着普遍肥胖之苦。

  与之大同小异的是,过去我们获得信息很困难,现在到处都是海量的信息。谷歌[微博]前CEO斯密特曾经估计,人类每两天所创造的数据量就相当于有史以来到2003年的数据量总和。他说这话是在五年前。我们从认识上还未进化到这一步。

  估计人类创造的总数据量是技术人员的一大爱好。确切数字虽然各不相同,但谁都承认大得惊人。只需想想你的智能手机就够了:没错,它是一个通讯设备,但它也是把你周围的世界转化为数据的工具。你看到某个东西,把它拍下来或者录下来,然后上传到云端,以字节的方式永远存在。每一天人们发布五亿条推文,在Instagram分享7000万张照片,在Facebook观看40亿条视频。每一分钟我们向YouTube上传300小时的新内容。

  创造数据的不仅是人。还有被称为物联网的新现象。汽车、自动售货机、眼镜、计步器等装上传感器和传输器,与云端或彼此之间通讯。这些物体也像人类一样在数字世界留下痕迹。市场研究机构IDC在2014年的报告中估计,数字世界的规模将从2013年的10万亿吉字节增长到2020年的44万亿或44泽字节。

  我们拥有丰富的数据,但从中获得的回报却迅速减少,因为拥有的数据越多,就越难从中挖掘出意义。颇具讽刺意味的是,信息过多差不多也像信息不足一样难以分析和理解。于是,新技术让我们的世界充斥着越来越多的复杂信息,我们最终就越需要有着悠久历史的人类努力,即始终致力于使复杂的东西可以理解、从混乱中求得意义的艺术,尤其是视觉艺术。

  正如普莱费尔所发现的那样,超过某一界限挖掘数据意义的最佳办法就是使数据形象化。试想Instagram的海量照片。去年纽约市立大学教授曼努维奇(Lev Manovich)对来自纽约、圣保罗、柏林、曼谷、莫斯科5座城市的12万张照片进行了视觉分析。他和他的研究团队从中选取自拍照片,估计照片上的人的年龄和性别。然后他们对照片运用面部分析算法,对所有数据进行统计分析,最后放到selfiecity.net制成互动图表。

  结果这些毫无意义的原始数据现在具有了意义。你可以按照城市、性别、心情、是否歪脑袋、是否戴眼镜、睁开还是闭上眼睛浏览照片。你可以提出问题并得到答案:谁自拍用的多,男人还是女人?(答案是女人)。哪里的人笑得最多?(曼谷)哪里的老年人爱自拍?(纽约)……

  如果你把数据形象化看作我们抵抗信息海洋的防洪堤,那么随着数据日益增多,防洪堤的压力总是不断上升,而压力上升又改变了数据形象化的方式和作用,这一点甚至普莱费尔也不曾料到。

  形象化从对统计数据集的分析呈现发展为实时数据的不断变化图景。在Bostonography你可以像上帝一样鸟瞰波士顿所有按照当前时速进行颜色编码的公交车位置。Crimemapping.com实时显示按照报案地点分类的案发地情况,用不同表情符号代表不同性质的案件。fbomb.co网站提供上推特的人何时何地如何说国骂的全球实时图景。

  从“纽约出租:生命中的一天”(NYC Taxis: A Day in the Life)可以得见美观、免费的数据丰富性。一位名叫Chris Whong的黑客根据《信息自由法》从出租车与电召车委员会(TLC)下载50G纽约市出租车数据,利用这些数据制作了2013年某一天任意出租车的路线和收入图。你可以选择一辆车快进(或以正常速度——如果你有时间)观看它在曼哈顿大街上行驶,像勤劳的小精灵吃豆子那样在身后留下一条蓝线。

  数据形象化并非总是为了闹着玩。今年4月30日在Kickstarter发布的一个众筹项目将从OpenSecrets.org抓去竞选资金数据并以多种方式自动图像化,清楚、简洁地显示政治家获得的资金数量和来源。这是超越透明性的下一个必要步骤:不仅公布信息,而且要公布该信息的意义。今年数据图像化最引人注目、最具革命性的实验之一是纪录片制作人、数据专家霍洛兰(Neil)的“二战死难者”(The Fallen of World War II)互动视频。该实验利用图表图像讲述历史:表示成千上万死难者的几乎独家的抽象数据形象化地带领我们回顾二战和“大屠杀”。

  视频六分钟左右镜头急剧仰拍现出摩天大楼似的柱状图,表示前苏联军队870万人的伤亡。初一看似乎极不可能,但随着镜头回摇,在二战的巨大灾难中又合情合理。在这种不动声色的叙述中,人类的死亡更显触目惊心。

  之后的视频同样摄影手法反复出现:冷冰冰的抽象数据变为视觉艺术,让我们感同身受,增加知识。现阶段人类遭遇普莱费尔也发现无法理解的海量数据。我们也觉得数据多得无法理解,而这些数据又可能使得我们的世界不可理解。不过我们并非毫无办法。信息不仅需要自由,它还需要看得见摸得着

时代周刊》:用形象化的老办法对付大数据相关推荐

  1. 《时代周刊》:用形象化的老办法对付大数据

    威廉-普莱费尔(William Playfair)生于1759年在家里排行老四父亲是上进的苏格兰大臣.他年纪轻轻便当上瓦特的个人助理随后从事制图.会计.工程.经济.银匠.土地投机.记者等多种职业取得大 ...

  2. IT时代周刊:2009年IT十大争议人物

    IT时代周刊:2009年IT十大争议人物(1) <IT时代周刊>2010年第2期杂志封面 有IT人的地方就有江湖,就有为争市夺利引发的纷纷扰扰,是是非非. 2009年,金融风暴的肆虐放大了 ...

  3. 大数据时代时代舍恩伯格书资源_大数据时代的特征和思维

    随着信息技术的发展和应用, 人类进入了一个大数据时代.大数据时代和我们以前的时代有什么不同?什么又是大数据时代的特征,和应具备的思维呢? 维克多·舍恩伯格在<大数据时代>一书中将大数据时代 ...

  4. 大数据时代你需要知道的7个大数据定义

    文章讲的是大数据时代你需要知道的7个大数据定义,大数据究竟是什么?很多人可能仍然有些混淆,本文让我们来看看大数据的一些主要的定义.首先要注意的是,行业内的所有人都普遍认同,大数据不只是更多的数据. ( ...

  5. 大数据时代第一部分思维导图_大数据时代总结思维导图模板分享

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物.数据涉及了方方面面,那主要介绍哪些呢?下面是分享的大数据时代思维导图模板 ...

  6. 我们不做看客,只做时代的赋能者—FMI2018人工智能与大数据高峰论坛圆满落幕...

    科技大潮风生水起,人工智能.大数据发展如火如荼,在这个汹涌的时代,没有人能止步于看客.十七年风雨征程,光环国际大步迈进人工智能.大数据领域,旗下FMI飞马网也一直致力于成为"人工智能时代的人 ...

  7. 我们不做看客,只做时代的赋能者 —FMI2018人工智能与大数据高峰论坛(深圳站)圆满落幕

    科技大潮风生水起,人工智能.大数据发展如火如荼,在这个汹涌的时代,没有人能止步于看客.十七年风雨征程,光环国际大步迈进人工智能.大数据领域,旗下FMI飞马网也一直致力于成为"人工智能时代的人 ...

  8. 我们不做看客,只做时代的赋能者 —FMI2018人工智能与大数据高峰论坛深圳场圆满落幕...

    科技大潮风生水起,人工智能.大数据发展如火如荼,在这个汹涌的时代,没有人能止步于看客.十七年风雨征程,光环国际大步迈进人工智能.大数据领域,旗下FMI飞马网也一直致力于成为"人工智能时代的人 ...

  9. 时代周刊评出2011年度50大最佳网站(上)

    <TIME>杂志每年都会评选出全球最佳网站(The 50 Best Websites of 2011),包括Facebook.Twitter都曾上榜,今年又是哪些网站上榜呢? 音乐和视频类 ...

最新文章

  1. 获取当前页面的宽度和高度
  2. Unity3D之主菜单
  3. Windows2012R2 Hyper-v3.0 高可用群集安装及配置(Live Migration)
  4. 记录一次血崩式的CPLD不稳定 bug经验
  5. 引入N-gram改进Transformer架构,ACL匿名论文超越Primer等基准
  6. 宏定义和内联函数的学习
  7. [数据结构-严蔚敏版]P64循环队列-队列的顺序存储结构
  8. 【Flink】Flink 反压机制 导致checkpoint 失败
  9. python典型应用场景、domo及模板之一-----------配置日志
  10. 阿里大鱼短信接口PHP版,精简版阿里大鱼短信SMS发送接口PHP实例
  11. 如何提高芝麻信用分?解读芝麻信用是怎么做的
  12. 什么是视频结构化?视频结构化有什么作用
  13. 手机扫描二维码登录原理
  14. php中怎么添加css样式_html怎么添加css样式?
  15. 数据链路层------基于TCP/IP五层模型
  16. 【Java】设计一个动物声音“模拟器”,希望模拟器可以模拟许多动物的叫声。
  17. PyCharm中怎么将非当前工程文件的目录的文件加到当前工程中
  18. OpenGL(12)GL库API
  19. 一“站”成名 | 盘点全球域名收购经典案例
  20. 最新超漂亮UI仿芒果TV听书网站模板双端+苹果CMS内核

热门文章

  1. jeePlus+SpringBoot学习笔记
  2. 对Vintage分析的一些学习理解
  3. MPB:上海巴斯德所崔杰组-RNA病毒组与生物信息学分析
  4. 2台计算机怎么共享一个打印机驱动,办公室两天电脑怎么设置共享打印机?两台都装了驱动,在一个工作组里面!...
  5. CF923E Perpetual Subtraction 题解
  6. 【每日新闻】百度花十亿打造的春晚活动怎么样?
  7. ro服务器维护副本cd,仙境传说ro手游测试服12月21日更新维护内容官网公告:强制更新客户端...
  8. mysql设置127.0.0.1访问_请问如何设置以访问127.0.0.1
  9. 本地登录github
  10. js实现栈、队列、链表数据结构