大数据对于系统架构的需求

显式的需求

  • 海量计算和存储
  • 快速计算

隐式的需求

  • 数据的快速传输
  • 灵活性
  • 低成本

如何实现这些需求?
并行化(并行化的理念存在于计算机方方面面)

  • 并行请求(分配给多个计算机)
  • 并行线程(分配给多个处理器核心)
  • 并行指令(同一时刻有多于一条指令)
  • 并行数据(同一时刻有多于1个数据项 )
  • 硬件描述(同一时刻使用所有门电路)

规模经济(极端规模的并行化:仓库规模的计算机 WSC)

  • 主要部件 —— 供电、制冷、建筑、网络、安全、存储、计算
  • 优势 —— 规模经济、提高使用率
  • 挑战 —— 能耗PUE、运维

WSC是用网络连接起来的计算和存储设备
WSC的特点:
1、使用相对同质的硬件和系统软件平台
2、共享相同的系统管理
3、大多数应用程序、中间件、系统软件都是自主开发,而传统数据中心则由第三方软件主导
4、WSC运行相对小数目的超大型程序(或服务)
5、通用的资源管理架构增强了部署的灵活性

虚拟化(抽象)

云计算的商业模式概述

—— 云计算的定义
云计算 Cloud computing 既指作为服务通过互联网提供的应用程序(SaaS模式),又指提供这些服务的,位于数据中心的硬件和系统软件(公用计算)
:数据中心硬件与软件
公有云:用即付即用的模式,开放给大众使用的云
私有云:一个企业或组织内部的数据中心
公用计算:给人以无限资源的错觉

—— 云计算商业模式的三大特点

  • 按需服务
  • 资源池
  • 可测量的服务

—— 云计算发展的市场条件

  • 大规模互联网应用(社交网络、多媒体)
    1、规模经济
    2、需求增长促进数据中心建设增长
    3、无法预测的应用增长速度Zynga,Netflix
  • 大数据应用
    1、日志分析
    2、机器学习应用

云计算的价值

云计算的分类

  • 指令集虚拟机(Amazon EC2, 3Tera)
  • 运行时系统虚拟机(Microsoft Azure)
  • 框架型虚拟机(Goole AppEngine,Force.com)
  • 折衷:灵活性/可移植性

为什么要虚拟化

资源池

  • 聚合:将多个资源结合起来
  • 合一:例如存储
  • 动态:快速分配(虚拟机)

隔离:保护消费者隔离其他租客 ,例如虚拟专用网(VPN)
便于管理:测试、机动性

云计算的核心思想

  • 性能:并行化
  • 经济性:规模化、公有云
  • 可管理:虚拟化

从云计算到大数据

  • 虚拟化提供了硬件资源的抽象
  • 用户看到的接口
    (虚拟)计算节点
    (虚拟)网络
    (虚拟)存储
  • 仍然是许多独立的设备:需要分布式系统编程
  • 如何提供一个易于编程的“单一系统”感觉
    分布式存储、计算框架

云计算与分布式系统课程学习笔记(一)——云计算简介相关推荐

  1. 云计算与分布式系统课程学习笔记(二)——Linux基本命令的使用与熟悉

    (1) jps [显示当前系统的java进程情况,及其id号] -q 只显示pid,不显示class名称,jar文件名和传递给main方法的参数 -m 输出传递给main方法的参数 -l 输出主类的完 ...

  2. 【OpenCV-Python-课程学习(贾)】 OpenCV3.3课程学习笔记-开篇和简介

    一.课程简介 该课程围绕OpenCV3.3进行讲解,不仅包括图像加载和保存.色彩空间转换.ROI与泛洪填充.模糊和滤波平滑操作.图像二值化.图像金字塔.图像直方图.图像梯度.模板匹配等内容,贾志刚老师 ...

  3. 怎样学习Linux运维云计算,linux运维云计算课程学习,Linux云计算面试时遇到的问题...

    原标题:linux运维云计算课程学习,Linux云计算面试时遇到的问题 Linux命令行,以及用户使用Linux命令进行Linux shell交互,是Linux最吸引人的地方,也是面试中最普遍的话题之 ...

  4. 台湾大学林轩田机器学习技法课程学习笔记4 -- Soft-Margin Support Vector Machine

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了Kernel SVM.先将特征转换和计算内积这两个步骤合并起来,简化计算.提高计算速度,再用Dual SVM的求解方法来解决. ...

  5. 台湾大学林轩田机器学习技法课程学习笔记1 -- Linear Support Vector Machine

    红色石头的个人网站:redstonewill.com 关于台湾大学林轩田老师的<机器学习基石>课程,我们已经总结了16节课的笔记.这里附上基石第一节课的博客地址: 台湾大学林轩田机器学习基 ...

  6. 台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

    红色石头的个人网站:redstonewill.com 上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度 ...

  7. c语言课程笔记格式,C语言课程学习笔记.docx

    C语言课程学习笔记 C语言基础语言排行榜C--java--objective-C进制:进制:进位机制.用普通的话讲,应该为人为的定义一种度量来标识一样东西.计算机常用的进制有:十进制.二进制.八进制和 ...

  8. 斯坦福大学CS520知识图谱系列课程学习笔记:第三讲高级的知识图谱是什么样的

    这一讲的主题是:一些高级的知识图谱是什么样的.三位讲者分别从他们各自带领的团队构建出来的高质量的知识图谱实例出发,从中我们可以认识到一些大佬们构建的优秀的知识图谱产品有哪些特点和优势,从中对我们自己构 ...

  9. 斯坦福大学CS520知识图谱系列课程学习笔记:第二讲如何构建知识图谱

    上一讲我们学习了知识图谱的一些基本概念: 斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱 本节课程关于如何构建知识图谱,因为知识图谱的构建是整个知识图谱领域的一个非常核心且基础的工 ...

最新文章

  1. 针对上上篇博文--仿优酷菜单---的bug修改
  2. MSScriptControl详解(可实现在C#等语言中调用JAVASCRIPT代码)
  3. Spring常问的面试
  4. ASP.NET Core之跨平台的实时性能监控(2.健康检查)
  5. 【转】ASP.NET MVC 3 Service Location, Part 5: IDependencyResolver
  6. C语言:编写一个程序,建立一个abc.txt文本文件,向其中写入“this is a test”,然后显示该字符串
  7. 【Linux】用户必须知道的常用终端快捷键
  8. 力扣题目系列:1. 两数之和
  9. 超过2T硬盘用不了,怎么办?
  10. svg练习题——抽风路径、高斯模糊、仪表盘、个性签名、loading加载
  11. 使用jsonp跨域调用百度js实现搜索框智能提示,并实现鼠标和键盘对弹出框里候选词的操作【附源码和在线测试地址】
  12. telegram 常见问题
  13. 使用代码给ACCESS窗体中32个文本框赋不同值的实例
  14. Angular 2.0 文本拖拽
  15. Qt实现telnet服务【记录】
  16. 双碳丨碳库、碳平衡、温室气体、碳循环等多领域监测与模拟
  17. php B KB MB TB
  18. 百度云下载速度慢解决方案(仅供参考,大神请指导)
  19. 单品购买商城源码/单个商品详情页购买源码下载
  20. c++判断是否为闰年

热门文章

  1. celery异步执行任务在Django中的应用实例
  2. liunx中udp服务器与客户端创建
  3. 知识图谱论文阅读(十六)【WWW2019】Knowledge Graph Convolutional Networks for Recommender
  4. Google、MS和BAT教给我的面试真谛
  5. 机器学习从理论到工程的第一步-编程语言篇
  6. Spring Boot 2.x基础教程:配置文件详解
  7. 基于 KIF 的 iOS UI 自动化测试和持续集成
  8. 美团点评移动端基础日志库——Logan
  9. 论文浅尝 | 一种基于递归超图的知识图谱问答方法
  10. 会议交流 | CAAI BDSC2021大会专题七:社会计算与开放知识图谱