前言

大数据,并非一蹴而就。

大数据的时代,已悄然而至,殊不知,我们已被数据的海洋环绕。环顾左右,有人争相控之,有人只缘身在此山中,云深不知处,当然,也有溺者。

当第一次接触大数据的时候,并不感冒,感觉只是一个普通的概念而已。尽多时之力,试从各个方面接触,无大获。

以当时资料显示:大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

抽象,抽象的很,来自一个大数据小白的真实感受。

其中,读到一本书维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代,生活、工作与思维的大变革》(以下简称《大数据时代》),其中大数据是指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性)。

不识庐山真面目,只缘身在此山中。对个人而言,当时最为贴切的感受莫过于此。但身为IT之士,不搞懂大数据,今后聊天,以后岂不是很没面子(以后大家可以照此方式激励自己读书呦!当然,开玩笑啦,只是人丑就要多读书而已)。

正如维克托教授(本书作者之一)所说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。而发掘数据价值、征服数据海洋的“动力”就是云计算。大数据与云计算是一个问题的两面:一个是问题,一个是问题的解决方法。

解决这种由大规模数据引发的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。而大数据发展的障碍,在于数据的“流动性”和“可获取性”。

值此大数据方兴未艾、众说纷坛的时刻,本书进一步阐述和厘清了大数据的基本概念和特点,对于很多以为“大数据”就是“数据大”的人来说有很大的帮助。

正如维克托教授所强调的,最重要的是人们可以在很大程度上从对于因果关系的追求中解脱出来,转而将注意力放到相关关系的发现和使用上。

大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。

大数据的路上没有戈多,我们已经在路上,晃晃悠悠。人类的自由意志和诸多之下的尊严,会在这条道路上异化甚至消逝吗?极目远眺,不知道世界的尽头,是否是一个冷酷的仙境!

          关于本书的试读:推荐 豆瓣读书

概述

全书基本涵盖了生活的方方面面,从公共卫生到时代转型的大挑战,无论从任何方向观察大数据,她均以无可阻挡之势,来到我们面前,不管你是否相信,都将无法再离开她。

1.公共卫生:大数据,小荷才露尖尖角

公共卫生的变革或是当代人了解大数据的伊始。殊不知,大数据的影子早在十九世纪五十年代所望见,最早的大数据实践——莫里航海图,阴差阳错莫里上校开创了一个全新的时代。

2009年,全球H1N1流感病毒的迅速传播,不仅是医疗事业迅速提升的重心,更是展现全新科技控制流感蔓延表现的时机,以最快的速度掌握其蔓延之势。时势造英雄,个人一直奉为经典。谷歌以更有效、更及时的指示标,一种前所未有的方式,通过对海量数据进行分析,拥有了一种更好的预测工具,以预防流感的传播。

2.商业:大数据,淡妆浓抹总相宜

在大数据时代的整个商业界都因之而重新洗牌。

2003年,奥伦·埃齐奥尼提早购买飞机票事件,让埃齐奥尼决心帮助人们开发一个系统,用来预测当前网页上的机票价格是否合理。几经改动,项目很贴切的一个名字为“哈姆雷特”,后被微软收购改名为Farecast。后扩展至各行各业,也算是大数据较早的体现着之一。

Farecast系统是大数据公司的一个缩影,也代表着当今世界发展的趋势。虽说技术上的突破是这一切得以发生的主要原因,但也有一些细微而重要的改变正在发生,特别是人们关于如何使用数据的理念。

3.思维:大数据,晴空一鹤排云上

如今,人们不再认为数据是静止和陈旧的。

而是已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。数据的奥妙只为谦逊、愿意聆听且掌握聆听手段的人所知。

这仅仅是一个开始,大数据时代对我们的生活,以及与世界的交流方式都提出了挑战。最惊人的是,社会需要放弃她对因果关系的渴求,而仅需关注相关关系。也就是说我们只需知道是什么,并不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。

4.开启重大时代的转型:大数据,秦诸子百家争鸣

就像望远镜能够让我们感受宇宙,显微镜能够让我们观测微生物,这种能够收集和分析海量数据的新技术将帮助我们更好地理解世界---这种理解世界的新方法我们现在才意识到。

从信息爆炸的起源天文学到人体基因密码、金融领域,从银行业到互联网、医疗保险等等,各个不同的领域都在讲述着一个类似的故事,那就是爆炸式增长的数据量。

尽管我们仍处在大数据时代来临的前夕,但我们的日常生活已经不开她了。大数据的科学价值和社会价值正是体现在这里。

5.预测,是核心:大数据,预则立不预则废

大数据的核心,就是预测。

它通常被视为人工智能的一部分,或者更确切的说,被视为一种机器学习。但是这种定义是有误导性的。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。

就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为她为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。

6.大数据,大挑战:大数据,山雨欲来风满楼

我们已经沉浸在数据的海洋里。

大数据给社会带来的益处将是多方面的。因为大数据已经成为解决紧迫世界性问题,如抑制全球变暖、消除疾病、提高执政能力和发展经济的一个有力武器。但是大数据时代也向我们提出了挑战,我们需要做好充足的准备迎接大数据技术给我们的机构和自身带来的改变。

大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化了。拥有大量的数据和更多不那么精确的数据为我们理解世界打开了一扇新的大门。

阅读完整本书,较之其他感觉到一种不同于心,一种不同于任何其他(或许是初次接触大数据的缘故)。乍相遇,迎之,一种恐惧感,当然也不乏莫名的欣喜,对待新事物我们总是这样哭笑不得。

勾画思维导图概述所识所知:

思考

大数据的到来,随着人们对数据的不断引用,也为我们更好的服务,我们很希望努力去尝试接触、使用和掌握,以期盼我们会生活的更好。但是,随着大数据的到来,我们的生活也会受其所扰,相当于时时刻刻暴露在别人的眼睛之下,没有一点儿隐私,这样的社会,你害怕吗?

所以在本书的最后,作者也呼吁了责任与自由并举的信息管理。当世界开始迈向大数据时代时,社会也将经历类似的地壳运动。在改变人类基本的生活和思考方式的同时,大数据早已推动人类信息管理准则的重新定位。然而,不同于印刷革命,我们没有几个世纪的时间去适应,我们也许只有几年的时间。

正在发生的未来。大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全的替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的办法和答案还在不久的将来。

思考着高科技发展的变化,也思考着自己的未来。

在路上。

走走停停。

风卷过树林,留下落叶纷飞,阳光变换着强弱,演绎着四季的轮回。一个春夏,一个故事,零落一段情。没有刻意记录着日子的消逝,亦没有好好珍惜大好的时光。只是当漫不经心地停下脚步时,才发现日子是何等的匆匆。转眼间,已经不再是懵懂的少年。

因为成长,所以懂得。

读 书 要 思 考

2016.03.16

大数据,并非一蹴而就相关推荐

  1. 大数据开发你需要知道的十个技术

      前言 "当你不创造东西时,你只会根据自己的感觉而不是能力去看待问题." – WhyTheLuckyStiff 汇总一些自己在大数据路上走过的弯路,愿大家不再掉坑- 1.分布式存 ...

  2. 基于材料数值计算大数据的材料辐照机理发现

    点击上方蓝字关注我们 基于材料数值计算大数据的材料辐照机理发现 任帅1,2, 陈丹丹1,2, 储根深1,2, 白鹤1,2, 李慧昭1, 何远杰1, 胡长军1,2 1 北京科技大学计算机与通信工程学院, ...

  3. 管理大数据存储的十大技巧

    在1990年,每一台应用服务器都倾向拥有直连式系统(DAS).SAN的构建则是为了更大的规模和更高的效率提供共享的池存储.Hadoop已经逆转了这一趋势回归DAS.每一个Hadoop集群都拥有自身的- ...

  4. 什么是大数据?大数据又有什么用处?

    国家图书馆的藏书量有2600万册,如果从数据来看的话,一个家庭一年产生的数据相当于半个国家图书馆的数据总量.工业和信息化部电信研究院互联网中心主任何宝宏认为,当一个时代的人没有办法用传统的工具来处理的 ...

  5. 漫谈阿里那些大数据技术,大数据学习者必看

    目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象.我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的 ...

  6. hawk大数据基础知识总结(1)

    一.大数据概述 1.1大数据的概念 大数据一共具有三个特征:(1)全样而非抽样:(2)效率而非精确:(3)相关而非因果. (1)在过去由于缺乏获取全体样本的手段,人们发明了"随机调研数据&q ...

  7. 大数据的应用是什么?有三大关键点

    大数据应用的关键点是数据来源.产品化和价值创造:数据资源分布不均,大数据应用在数据密集领域更易获得突破:须对不当的行业管理模式进行改革,以促进大数据在已有各个行业中应用. 大数据贵在应用.当前,在国家 ...

  8. 大数据是不是互联网思维?

    在移动互联网时代显得越来越重要,不仅仅是因为用户的习惯碎片化的趋势明显,更多的是因为在营销多元化情况下用户选择繁多.把握用户属性和用户有效转化是不论传统还是创新企业都同样要面对的问题. 在大家都在探讨 ...

  9. 小数据 vs. 大数据

    2019年1月-2019年12月 文 | 潘爱民 来自 iSyscore Radio 的报道 第一讲 随着互联网技术的发展,电脑.智能手机和其他各种智能设备产生了大量的数据,我们从信息时代进入了大数据 ...

  10. 不懂分布式,枉称大数据

    国内大数据人才需求达150万,平均月薪远超万元 .很多毕业生都有意向进入大数据领域,做一名"体面多金"的大数据人才. 然而许多求职者对岗位要求知之甚微,殊不知包括开发.测试.维护. ...

最新文章

  1. http中post和get方法区别
  2. requestmapping配置页面后_@RequestMapping接口及页面乱码问题
  3. HttpWebResponse 的问题
  4. 安卓checkbox无响应_【安卓手机】无法连接电脑的解决方法
  5. Visual Studio 2017 15.5 正式发布,性能再提升
  6. SQL case when then else end运用
  7. Android Binder实现浅析-Binder驱动
  8. 算法笔记和上机实战训练指南(附下载)
  9. 微信小程序下拉刷新功能--onPullDownRefresh
  10. 2017云栖大会Tech Insight亮点大剧透
  11. win10系统优化计算机,win10系统必做优化,让你的电脑告别卡顿,运行速度至少提升20%...
  12. Qt图像中心旋转的两种方法
  13. 路由器管理android,ASUS Router app-华硕路由器管理软件(ASUS Router)下载v2.0.0.6.16 官方安卓版-西西软件下载...
  14. 温州兰博基尼车主遭绑架案1名嫌犯获死刑-兰博基尼-女车主-绑架
  15. 19张插画让你秒懂Kubernetes
  16. Git克隆Github项目学习笔记
  17. 日常学习之总结(1机器学习,2jupyter notebook,3语言类,4快捷键,5操作系统,6密码学,7Web安全,8Kali,9正则表达式,10计算机网络,11编程题目)
  18. MT6739的Android9.0 Camera kernel 驱动
  19. pyserial_API函数说明
  20. 绝地求生为何显示服务器上限,绝地求生服务器为啥不给力?官方解释:人太多了...

热门文章

  1. Java高并发编程详解系列-Future设计模式
  2. 【MyBatis框架】高级映射-多对多查询
  3. ubuntu16.04下安装codeblocks(2分钟安装)
  4. kafka消费者分区消费策略
  5. [20190530]oracle Audit文件管理.txt
  6. 刷前端面经笔记(九)
  7. Css 分类 属性 选择器
  8. 将一个二维数组合并成一个一维数组
  9. 深入理解DOM事件机制系列第四篇——事件模拟
  10. JavaScript之array