随着计算器技术以及公众使用的飞速发展,大数据的应用应运而生。当我们收集数据的能力变得前所未有的强大,数据的爆炸性增长为更全面和精确的分析工作提供了可能性,这就是大数据时代的特征和价值。

  作为一个生活平淡的人,你是否设想过在完成了某一天的无聊工作后,会在自家的厨房里听到警察的敲门声,然后被告知你可能跟一周后即将发生的一起凶杀案件相关?

  在汤姆?克鲁斯主演的电影《少数派报告》(MinorityReport)中,神秘的“先知”计算器系统能够预知犯罪活动,甚至可以精确到时间、地点及卷入其中的人物,让警方能够提前行动加以阻止。

  而在现实中,这并非小说家的凭空想象。美国洛杉矶因警员比例过低,一直是全美犯罪率最高的地区之一。2012年,该警察局开始进行了一项尝试,由加州大学人类学与数学系联合组成的一个实验室,为该局提供了一套类似“先知”的计算器系统。这套系统把洛杉矶市发案最高的福德希尔地区划分为几个区域,通过分析过去的1300多万起案件,找到了发案与日期、天气、交通状况以及其它相关事件之间的某种关系,进而能够预测出哪个区域在未来数小时内可能发生案件。

  现在,洛杉矶警察局有一组专门的警员每天会驾驶着警车按照计算器发出的巡逻指令前往不同的区域。尽管这些熟练的经验丰富的警员仍然不适应被一堆二进制的代码所指挥,但是在不增加警员的前提下,“先知”已经使该地区财产犯罪下降了12%,盗窃案件下降了26%。

  美国的另外一所大学--麻省理工学院正在进行另外一项研究,他们与当地一家妇女医院合作,把该医院所有心脏病患者的病例和心电图录入计算机,从而创建了一个计算器程序。当有病人来这里看病时,这个程序可利用心脏病患者的心电图,预测在未来一年内患者心脏病发作的机率。

  美国咨询界的翘楚麦肯锡咨询公司将这些现象总结为一个概念--大数据(BigData),并预言这项技术将成为人类未来生产力的指向标。随后,英国牛津大学教授维克托?迈尔-舍恩伯(ViktorMayer-Schonberger)的著作《大数据时代》在全球畅销,让大数据这个概念开始深入人心。

  “很难准确地描述什么是大数据。”维克托教授说:“它应该是一种思维方式,这也是一个新的改变,从因果性到相关性的转变,也就是不问原因,而是直接由数据得出结果。”

  他说,在过去我们问的更多的是“为什么”,对人类来说,这其实是一个很大的挑战。比如心脏病发作这项研究,尽管医学界已经研究了几十年,但是仍然很难找出发病的具体因果关系,但是现在,只需要建立一个足够大的心电图数据库,并且找到数据与心脏病发作的对应关系,就可以作出准确的预测。

  “搜集和分析数据,从表面上看,这就是大数据的开发者们正在做的工作,这并不是什么新的技术。”北京缔元信公司CEO秦雯说:“但是互联网的发展使我们在过去的数年内制造的数据超过了人类历史上的数据总量,更重要的是,随着全息摄影技术、传感技术以及谷歌眼镜这样的新技术的诞生,我们收集数据的能力变得前所未有地强大,数据的爆炸性增长为更全面和精确的分析工作提供了可能性,这正是这个时代的价值。”

  整合无序的资源

  6300多年以前,古埃及人通过太阳升起和下落之间的时间规律制做了太阳历,预测太阳在某一天何时会升起,将单向前进的时间划分为365天为一个周期。2200多年以前,中国人通过观察候鸟迁徙和植物发芽制作了二十四节气,大致预测了一年之中的天气变化情况,让农业的播种和收割时间变得有规律可循。

  北京缔元信数据公司CEO秦雯认为,从广义上看,这些都是根据过去的数据进行的预测,但是与现在大数据的含义相比,这些预测显得过于广泛,而且规律更容易掌握。现在的大数据更多的是分析由人类行为所构成的现象,比如华尔街的股票走势、洛杉矶的犯罪发生情况、淘宝网上即将热销的商品,而在过去这些都是不可预测的。

  1966年,美国交通事故死亡人数高达5万人,达到了历史的峰值。美国国会要求联邦政府立即建立一套有效的交通事故记录系统,分析确定交通事故及其造成死亡的原因,以期望找到最能够避免事故的交通规划方式。

  这在当时看起来仅仅是一种前途未知的尝试,因为一起交通事故的数据可能是完全独立且无序的,一年的数据、一个地区的数据也看不出太多章法。然而随着跨年度、跨地区的数据越来越多,群体的行为特点就会在数据上呈现一种“秩序、关联、稳定”,更多规律就会浮出水面。现在,美国的汽车保有量是中国的3倍,而交通事故死亡人数仅仅是中国的一半。

  这种做法最符合现在的大数据含义,而且也是人类最早在大数据方面获得的甜头。

  英特尔中国研究院首席工程师吴甘沙说,大数据并不仅仅是大量的数据,而是在看似无序和不关联的数据之间找到某种关联,发掘这些形态各异、快慢不一的数据流之间的相关性,是大数据做前人之未做、前人所不能的机会,也正是大数据最主要的特点。

  “比如,你如果知道人们在晨洗之后多长时间会走出家门,再从供水系统的数据中找到用水的高峰时间,就能准确地预测到今天早晨哪个区域哪个时间路上的交通最拥挤,同样可以从电网数据中统计出傍晚办公楼集中关灯的时间,加上偏移量来估计出堵车时点。”他说。

  “数”中自有黄金屋

  缔元信是一家网络监测公司,其主要业务是为互联网站的站长提供访问量统计报告。自2008年开始,他们致力于开发一套数据分析系统,希望通过关键词设置分析人们在互联网上浏览的内容,以获知他们的审美取向和使用偏好,进而知道他们正在成为哪种商品的潜在购买者。

  “这项工作并不像它看起来那样容易。”秦雯说,“因为你并非要刻意地监视某一个人,全中国有5亿多网民,每天他们要在网页上点击上百亿次鼠标,每一次鼠标的点击对你的监测服务器来说都是一样的,它并不知道这是坐在高档写字楼里的公司白领还是书房里的中学生操作了这一次点击。”

  这项服务现在正变得炙手可热,无论是在淘宝、京东还是亚马逊,你都会在打开网页的的同时,看到那些你似乎很需要的广告,而并非过去那样毫无指向的信息。

  “尽管如此,无论是缔元信还是淘宝或者美国的亚马逊,现在对于大数据的开发都非常初级,大数据的开发远远不是为了做广告。”秦雯说:“大数据是人类刚刚获得的一个富矿,而我们目前只开发了它表面的一小层。”

  的确有更多的人在利用这一思路淘金。保罗?霍廷是英国的一名80后外汇交易员,他从三位信息学教授那里获得灵感,认为Twitter上每天两亿多条信息能直接反映人们的情绪,而这种情绪将是宏观经济走向的晴雨表。

  霍廷依据分析结果决定如何处理手中数以百万美元计的股票。原则很简单:如果所有人似乎都高兴,买入;如果大家的焦虑情绪上升,抛售。随后他推出了一款利用Twitter关键词检索来预测公众情绪进而判断股票走势的对冲基金

DerwentCapital,并大胆承诺,公司推出的交易策略可以获得的年回报率高达15~20%。结果表明,人们在网上的情绪变化会在2~6天后影响到指数的变化,霍廷的公司今年第一季度获得7%的收益率。

  在国家层面,2012年,尚在经济危机阴影下的英国政府就拨款10万英镑,并邀请英国股市排名前100的大企业共同出资,建立一个国家级的公开数据研究组织。英国内阁部长弗朗西斯?莫德证实说,其实英国政府早有意带头建立“英国数据银行”,政府想算清楚究竟这个国家或政府创造了什么。他表示,英国不只是要成为世界首个完全公布政府数据的国家,英国还应该成为一个国际榜样,去探索那些公开数据在商业创新和刺激经济增长方面的潜力。

  被忽视的个人价值

  数据的产生变得更加个人化,无论是亚马逊、谷歌还是那些尚隐藏在大学里的实验室,他们研究的数据组都是由个人创造的。每当我们打电话、发短信,在互联网上使用搜索工具或者旅行、购物,这些行为都在为这个世界提供着新的数据。这些内容使得这个世界上的数据正在以每天250万TB的速度增加。

  互联网特别是移动互联网的发展,加快了信息化向社会经济各方面、大众日常生活的渗透。有数据显示,1998年全球网民平均每月使用流量是1MB(兆字节),2003年是100MB,2008年是1GB(1GB等于1024MB),2014年将是10GB。

  你使用餐具是用左手还是右手?吃饭的时候习惯喝汤吗?在加油站等待时是否会下车?你在早晨洗脸之后多久会走出家门?这些看起来毫无意义的问题正在变成一种有形的价值。因为当千万个甚至更多的如“你”一样的人被制作成为统计数字和图表之后,这些数学符号就有可能被其它的个人、企业甚至是政府有效使用。

  正如吴甘沙所说,普通人早晨的洗漱习惯很有可能成为那些导航地图生产者所需要的数据,而这些产品则会反过来让每个人的生活变得更便捷、更可支配。

  来自麦肯锡的报告显示:互联网产生的数据量将伴随着安装在汽车、零售、物流、安全、应用工具领域传感器数量的增加而增长。此外,报告还指出,在今后的五年里,全世界互联网传感器的部署将以30%的速度增加。到2020年,在美国,基于地理位置服务LBS将催生8000亿美元的市场空间,其中,个人的位置应用服务将产生7000亿美元的市场,基于位置的移动游戏、方位共享及出于社交网络安全考虑的定位跟踪是个人市场的主要应用。另一方面,企业将拥有1000亿美元的市场,主要应用聚焦于移动端的广告推送、基于手机位置的自动收费及基于位置的商业智能服务。

  秦雯坚信,未来的数据会像现在的石油或者其它金属那样成为一种商品,在世界各地会诞生数据交易所。

  “你会看到这样的场景,一个小公司的经营者拿着信用卡走进交易所说,我想要购买香港地区所有人刷牙习惯的数据。”秦雯说。

大数据技术已经成为互联网后的又一个里程碑意义的科技革命与生产力革命,也是产业结构战略调整的战略机遇。如何管理自身的业务大数据,从中获取智慧,对传统业务再造并实巨大价值的产品和服务?如何将大数据困境转换为大数据宝藏?如何从大数据概念炒作到实践落地?

由北京理工大学大数据搜索挖掘实验室、中国科学院计算技术研究所教育中心联合主办,大数据论坛联合承办,开设大数据技术进修班。聘请北京理工大学赵燕平教授、张华平博士、北京市外办信息中心姜伟主任、清华大学马宝君博士等知名专家全面讲授大数据架构、大数据搜索、大数据挖掘以及大数据应用四大板块,分享亲身经历的大数据应用,并为学员提供大数据搜索挖掘工具的实训。

授课时间 9月7、8日上午9:00-12:00,下午13:30-16:30 ( 16:30-17:00 开放式讨论答疑 )

进修费用 4980元(包含发票,讲义,教材,工作餐,与讲师互动自助晚餐会); 老学员或同单位三人以上报名九折优惠; 全日制学生凭学生证优惠价格2980元,不含发票。差旅及食宿费用自理

授课方式 :(a)《大数据搜索与挖掘》教材(科学出版社); (b)中文多媒体讲义;

(c) 针对学员具体需求的互动交流会。 (d)大数据搜索与挖掘工具实训;

(e)互动自助晚餐会;

主讲讲师:张华平:北京理工大学大数据搜索挖掘实验室主任,博士,副教授

赵燕平:北京理工大学教授,教育部电子商务专家

姜伟:北京市外事办信息中心主任

马宝君:清华大学搜索评价与推荐系统专家

小班授课:为保证充分讨论,确保进修效果,采用小班授课,名额有限,先到先得。

培训内容:《科学的大数据观》《云计算与大数据架构》《大数据精准搜索关键技术》

《大数据挖掘关键技术》《大数据搜索与挖掘平台工具实训》

《大数据与电子商务应用》《大数据在电子政务中的应用》《微博大数据挖掘》

《大数据困惑及解决》《方案应对讨论》

报名地址:http://www.lingjoin.com/lingjointrain/#add06

赵老师   010-68918050    13681251543

转载于:https://my.oschina.net/u/1160813/blog/145380

大数据:千万个“路人甲”的价值逻辑相关推荐

  1. 大数据可视化的方法和价值

    数据可视化平台是是通过三维表现技术来表示复杂的信息,实现对海量数据的立体体现.可视化技术借鉴人脑的视觉展现能力,通过挖掘重要数据之间的关联关系将若干关联性的可视化数据进行汇总处理.揭示数据中隐含的关联 ...

  2. 转 《光明日报》:“大数据面前,统计学的价值在哪里”

    转 <光明日报>:"大数据面前,统计学的价值在哪里" 统计学对大数据的意义 很高兴有这样一个机会,我能与大家在这里做一些关于统计学与大数据的交流,与大家分享一些观点. ...

  3. 大数据治理平台有哪些价值

    随着大数据技术在众多领域的广泛应用,大量数据源需要接入大数据平台,多种数据处理引擎和开发语言被各类技术/非技术人员人员使用,复杂业务催生了规模庞大.逻辑复杂的工作流程,数据成为业务的生命线需要重点保护 ...

  4. 疫情期间,防控大数据产品都有着怎样的逻辑?

    一.疫情期间有哪些痛点? 新型冠状病毒肺炎此次的疫情导致的全国各地.企业.居民住宅区进入并维持紧急的状态. ①相关政府机构.企业单位及居委会等如何在各交通工具关卡识别流动人员是否去过疫情高发地.如武汉 ...

  5. 工业大数据的真正意义和价值

    近年来,以 .移动互联网.大数据.云计算为代表的新一代信息技术,以 . .人机协作为代表的新型制造技术,与新能源.新材料与生物科技呈现多点突破.交叉融合,智能制造技术创新不断取得新突破.2016年是我 ...

  6. 大数据技术如何实现核心价值

    大数据的最大魅力在于开启了人类的"上帝视角",人类从一个前所未有的角度俯瞰着这个世界,知道全国乃至全世界的商品流动情况,知道每个商圈的繁荣情况,知道全球的航空业发展状况等等等等,而 ...

  7. 大数据指一笔巨大价值的资产

    大数据是一种信息资产,是一种无形的,但是有很大的价值的资产,虽然它看不见也摸不着,但是它的价值是没有办法估计的,可以为一个公司创造非常大的财富. 第一.种类多 各种各样的数据都有,就像是一个大杂烩一样 ...

  8. 打造大数据团队 从组建到价值创造全流程指南

    国际数据分析研究所创始人托马斯·H.达文波特作序推荐:数据分析师.企业管理者必备,第一本打造大数据分析团队和实现数据分析变现的实用指南:从数据收集.管理.分析到执行,教你打造一流的数据分析团队. 简介 ...

  9. 工业大数据平台解决方案的应用价值

    大数据经过多年的潜心发展,在当今可以说是进入到了一个快速发展期.各种围绕大数据的应用开发也迅速火热起来了.政务大数据解决方案.企业级大数据解决方案.智慧城市停车大数据解决方案等已经开始被应用.5月份一 ...

最新文章

  1. ValueError: not enough values to unpack (expected 2, got 1)
  2. 是什么限制了区块链技术的应用?
  3. java打字母小游戏总结与收获,java:打字母小游戏demo
  4. 你了解机房保温棉的使用和作用吗?
  5. KMP 算法并非字符串查找的优化 [转]
  6. 【Paddle】解压文件到指定文件夹
  7. static变量 static函数
  8. oracle逻辑备份和物理备份,Oracle备份与恢复介绍(物理备份与逻辑备份)
  9. php 安装rabtmq amqp 扩展
  10. 文字在状态栏上从右往左显示,而且是循环的
  11. 30 WM配置-策略-出库策略3-定义后进先出策略L(LIFO)
  12. window.opener的用法
  13. 计算机图形学完整笔记(六):三维图形变换
  14. M0+体系结构与指令系统简介
  15. 【模型检测学习笔记】8:无限字上ω正则LT性质的验证
  16. 小米怎么卸载html,小米11内容中心有什么用?怎么关闭和卸载呢
  17. 史上最全机器学习资源整理
  18. word目录中页码没有向右对齐的解决方法
  19. JCE cannot authenticate the provider BC
  20. 祝所有高考学子高考加油!

热门文章

  1. addEventListener的常用事件
  2. Hibernate入门6.Hibernate检索方式
  3. 金蝶K3WISE常用数据表(整理)
  4. VB简单播放器与python文字语音朗读
  5. 小程序单张图片上传至服务器
  6. 简易商品展示HTML+CSS
  7. Linux之 解决 Linux 性能瓶颈的黄金 60 秒
  8. 米Pad2Gpu降频修改
  9. 黑客入侵微软邮件服务器、Windows零日漏洞可获管理员权限|11月23日全球网络安全热点
  10. 【JAVA】使用javax.mail发送邮件