处理器,存储,软件和网络技术的进步使我们能够存储和处理海量数据,将这项技术用于人类科学,利益,娱乐,恶意方案,或一些我们可以做的事。 人们可以谈论“数据的民主化”,因为科学家和决策者,记者和医疗保健提供者,艺术家和工程师,新手和领域专家都试图从数据中提取知识。

本章介绍了三个最令人兴奋和要求最高的云应用方向:大数据,数据流和移动云计算。 大数据是现实可查的,我们每天生成2.5×1018字节的数据。1 这些庞大的数据量每天都收集设备信息。收集的设备从手机中的廉价传感器到大型强子对撞机的探测器,然后通过Google和亚马逊提供的在线服务,或物联网连接的设备上传信息。

为本章讨论的应用程序定义更全面的扩展概念是有意义的。 在这种情况下,“规模”意味着数百万台服务器在大型数据中心中协同工作,大量不同的应用程序,数千万用户以及一系列性能指标一方面反映了用户的观点和用户的观点,另一方面反映了CPS(信息物理系统)的观点。 该规模具有破坏性影响,它改变了我们设计和建造此类系统的方式,并加大了问题难度,所以我们只能在云计算上运行程序来解决这类问题。
海量的规模放大了意想不到的好处,同时也给系统设计人员带来了巨大的噩梦。即使是对单个服务器性能或者资源管理算法的轻微改进,也可能导致巨大的成本节约和好评。与此同时,数以百计的硬件和软件组件中的一个故障可能被放大,能够传播到整个系统中,产生灾难性的后果,最终导致系统瘫痪。

在大数据存储和处理的大型系统工程中,有几个重要的经验教训是:(a)为低概率事件的发生和可能导致的重大中断意外事件做好准备;(b)认为在大数据环境下可以按比例提供严格的性能保证是完全不合理的;(c)建立超过一定系统复杂性水平的无故障系统是难以实现的;在这种情况下产生了下一个最好的解决方案,开发容错系统的设计原理。

对于本章中讨论的应用程序,一个现实的替代方案是为了性能指标(如响应时间延迟)的分布式开发容错技术。这意味着能够理解为什么性能量度有一个重尾分布。尽早发现导致这种不良状态的事件,并采取必要的行动来限制其影响。大规模信息检索系统的另一个设计原则是,近似但快速的响应优于迟缓的最佳结果。

第12.1节分析了大数据定义的属性。下一节讨论了大数据是如果存储和处理的。大容量的数据存储和数据库对于存储大量的数据是有必要的。扩展数据仓库和数据库也带来了挑战。在第12.2节中讨论了Google开发的Mesa数据存储、Spanner和F1数据库。
许多云应用处理着大数据;数据分析是这类应用的一个重要类别。引导技术为响应大型数据集的查询提供了一种低延迟的替代方法。这些技术和近似查询将在12.3和12.4节中进行分析。最后,在第12.5节中讨论了另一类将数字建模与仿真和测量相结合的大数据应用,即动态的数据驱动应用。[ See the April 2015 report at http://www.vcloudnews.com/every-day-big-data-statistics-2-5-quintillion-bytes-of-data-created-daily/]

云计算承载着许多类型的数据流应用。从内容分发数据流到消费连续事件流的应用。这些应用将会在12.6,12.8,12.7中讨论。

大规模集群改变了云计算领域的一切。大规模集群使得添加任务关键型应用成为可能,这些应用要求云具备很高的可用性。这将在第12.9节中进行讨论。大规模集群放大了可变性,经常导致包括延迟在内的关键性指标成了厚尾分布,这些会在第12.10节中讨论。

智能手机、平板电脑、笔记本电脑、可穿戴设备等移动设备在现代社会中无处不在,不可或缺。移动设备的一大优点是它们与云计算的共生关系。移动云用户得益于数据处理的民主化。拥有移动设备的个人可以访问计算机云上可用的大量计算周期和存储。

移动云计算定位于云计算、无线网络和移动设备的交叉点。移动设备是云数据的生产者和消费者。嵌入移动设备的传感器生成存储在云上并与他人共享的数据;运行在移动设备上的应用程序使用云数据,并且可以触发云计算的执行。

第12.11节介绍移动计算及其应用,第12.12节介绍移动计算的能源效率。第12.13节分析了延迟的影响,并提出了包括Cloudlets在内的其他移动计算模型。同样的主题在12.14节中继续讨论移动边缘云和马尔可夫决策过程。

[译 ] 云计算Cloud Computing 12章 大数据、数据流、和移动云计算 -序相关推荐

  1. 云计算(cloud computing)十大问答

    本文讲的是云计算(cloud computing)十大问答,[IT168 资讯]云计算这个新名词最近甚嚣尘上,最近周围不少朋友都在谈,有必要写一个关于云计算的科普了. 一般的业界比较喜欢用一些新名词来 ...

  2. Hadoop专业解决方案-第1章 大数据和Hadoop生态圈

    一.前言: 非常感谢Hadoop专业解决方案群:313702010,兄弟们的大力支持,在此说一声辛苦了,经过两周的努力,已经有啦初步的成果,目前第1章 大数据和Hadoop生态圈小组已经翻译完成,在此 ...

  3. 云计算(Cloud Computing) 培训总结

                       云计算(Cloud Computing) 培训总结     近来,云计算(Cloud Computing)是一种新兴的商业模型,在网络中是一个热度很高的新名词,被 ...

  4. 第一、二章大数据与Hadoop的概述

    目录 第一章:大数据的概述 1.1 大数据的概念 1.2 大数据的特征(重点) 1.3 大数据的应用场景 1.4 大数据的发展前景 1.5 企业大数据的一般工作流程 1.6 数据部门的组织架构​ 1. ...

  5. 智慧城市(大数据,物联网,云计算之应用)

    最近看完<智慧城市(大数据,物联网,云计算之应用)>这本书,然后做一些总结: 大概目录: 1.智慧城市建设 2.大数据分析:最近大数据很火,主要解决数据的采集(可以到微博,网站,博客等去采 ...

  6. 大数据技术原理与应用——第一章 大数据概述

    第一章 大数据概述 1.1 大数据时代 1.1.1 第三次信息化浪潮 信息化浪潮 发生时间 标志 解决的问题 代表企业 第一次浪潮 1980年前后 个人计算机 信息处理 Intel.AMD.IBM.苹 ...

  7. [扫盲] Salesforce.com: 业界云计算(Cloud Computing)的主要倡导者之一

    Salesforce.com是一家CRM解决方案的vendor, 使用Software as a service(SAAS)模型通过Internet来提供服务. 该公司成立于1999年, 是业界最主要 ...

  8. 《中国人工智能学会通讯》——12.58 大数据不确定性学习的研究

    12.58 大数据不确定性学习的研究 一个建立在常规数据集上的学习模型和算法一般是不能拓展到大数据的,原因有多个.基于不确定性的学习模型自然也是如此.不确定性的处理对大数据学习更为重要,有些与不确定性 ...

  9. 淘宝双12趣味大数据:150万件打底裤被男人买走了;套套销量暴涨50%...

    双12购物节过去了,离2020年又近了一步,这也是21世纪最后一个10年代的购物节.双12,大家买买买的热情虽然不如双11,但是身边还是有不少小伙伴熬夜剁手. 今天,淘宝官方发布了双12购物" ...

最新文章

  1. C++ Char int string关系
  2. MemberShip使用大全
  3. 脂肪粒是否可以针刺入
  4. android sqlite查询某个字段,Android的sqlite:如何检索特定列的特定数据?
  5. 几个so经常使用Function
  6. scrapy爬虫启示录-小伙子老夫看你血气方刚这本《爬虫秘录》就传给你了
  7. 131. Palindrome Partitioning
  8. restful api接口设计
  9. 1844. 将所有数字用字符替换
  10. 安装pyOpenGL/python-opengl
  11. SQL Server 数据库文件和文件组
  12. python nlp 中文伪原创_人工智能伪原创工具(AI伪原创)
  13. C++高阶 每个对象都有一个this指针
  14. Linux系统配置jdk
  15. Wireshark用户使用手册系列完结篇
  16. 王者荣耀游戏高清壁纸(手机|电脑),来袭
  17. 安卓miracast花屏_手机投屏电视频繁断开的解决办法
  18. 后渗透篇:CLSID大全
  19. 底特律中国工程师协会研讨汽车技术新动向
  20. 怎么把ppt文字大小设置一致_学会这个方法,轻松制作海报级别的霓虹灯PPT!

热门文章

  1. Emboss的几个有用的小程序
  2. 基于JAVA的问卷调查系统设计与实现计算机毕业设计源码+系统+mysql数据库+lw文档+部署
  3. 看板:精益生产的起源与今天
  4. Gpick Linux下拾色工具
  5. php使用nltk,无法从phps shell\u ex中导入NLTK
  6. 如何善用产品设计的三个层级
  7. 专业制造计算机电缆,八步耐火计算机电缆专业制造
  8. 蓝牙基带解调(GFSK:Gauss frequency Shift Keying )
  9. Echarts常用柱状图
  10. 绩效管理之KPI设定_程序员