大数据和云计算

  • 1 大数据和云计算的关系
  • 2 云计算的技术
  • 3 云计算的优势
  • 4 云服务类型
  • 5 GFS/HDFS的架构模式
  • 6 大数据处理过程
  • 7 MapReduce编程结构
  • 8 VPC的概念
  • 9 Hadoop的部署方式
  • 10 Yarn的作用
  • 11 Hadoop组件
  • 12 网络存储模式

1 大数据和云计算的关系

G=f(x)G=f(x)G=f(x) GGG是目标,fff是云计算,xxx是大数据。
云计算是处理大数据的手段。

2 云计算的技术

虚拟化、分布式计算、并行计算、效用计算

3 云计算的优势

与计算易于部署,方便维护,而且拓展起来也很快。

4 云服务类型

类型 服务内容
IaaS 基础资源封装成服务
PaaS 云平台服务
SaaS 云应用服务

5 GFS/HDFS的架构模式

HDFS采用master/slave体系,master运行NameNode,slave运行DateNode

客户端 ⇌ 中心服务器(NameNode)⇌ 数据块服务器(DateNode)

6 大数据处理过程

  1. 对原始数据进行分割,得到数据块
  2. 对每一个数据分块都运行一个Map进行处理
  3. 对Map得到的中间结果启动Reduce,输出最终结果的键值对

7 MapReduce编程结构

Map表示映射

(in_key, in_value) -> Map -> (key, value)

Reduce表示归约

(key, list[value]) -> Reduce -> (key,final_value)

8 VPC的概念

VPC是虚拟私有云服务,企业通过安全网络信道连接到云服务商的产品。

9 Hadoop的部署方式

部署方式 用途
单机 函数调试
伪分布式 模拟调试
分布式 实际使用

10 Yarn的作用

Yarn是分布式操作系统,作用有资源管理和任务调度。

11 Hadoop组件

组件 功能
Hbase 分布式数据库(结构为行键、列键、列组)
Hive 数据仓库(将sql语句转换为MapReduce任务进行运行)
Pig 脚本语言平台

12 网络存储模式

模式 特点
NAS 使用局域网作为传输通道
FC-SAN 使用光纤作为专用数据传输网络

大数据和云计算知识点汇总相关推荐

  1. 大数据、云计算该如何学习?

    大数据之Linux+大数据开发篇 [大数据开发学习资料领取方式]:加入大数据技术学习交流群458345782,点击加入群聊,私信管理员即可免费领取 阶段一.大数据.云计算 - Hadoop大数据开发技 ...

  2. 大数据、云计算系统高级架构师课程学习路线图

    大数据之Linux+大数据开发篇 大数据的前景和意义也就不言而喻了,未来,大数据能够对大量.动态.能持续的数据,通过运用新系统.新 工具.新模型的挖掘,从而获得具有洞察力和新价值的东西.源于互联网的发 ...

  3. 云计算和python学哪个_大数据、云计算该如何学习?

    大数据之Linux+大数据开发篇 阶段一.大数据.云计算 - Hadoop大数据开发技术 课程一.大数据运维之Linux基础 本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习H ...

  4. 大数据、云计算系统顶级架构师课程学习路线图

    大数据之Linux+大数据开发篇 Java Linux基础 Shell编程 Hadoop2.x HDFS YARN MapReduce ETL数据清洗Hive Sqoop Flume/Oozie 大数 ...

  5. 大数据面临的挑战:当大数据遭遇云计算

    本文讲的是大数据面临的挑战:当大数据遭遇云计算,大数据正在彻底改变IT世界.那么,什么样的数据谈得上数据呢? 根据IDC的报告,未来十年全球大数据将增加50倍.仅在2011年,我们就将看到1.8ZB( ...

  6. a人工智能b大数据c云计算_你清楚5G物联网、大数据、云计算、人工智能之间的关联吗?...

    同属于高新技术发展领域的物联网.大数据.云计算.人工智能之间有着割舍不开的联系,成其一都离不开其他技术的支撑辅佐,特别是落地应用的时候,在不同的场景中,这个几个技术之间不同的方式配合,成就了现如今的高 ...

  7. 大数据和云计算技术周报(第101期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:Spring熔断降级方 ...

  8. 大数据与云计算技术周报(第150期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:hiva.Flink. ...

  9. 大数据与云计算技术周报(第148期)

    导语 "大数据" 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算.存储.网络都涉及,知识点广.学习难度高. 本期会给大家奉献上精彩的:实时数据.ELK.re ...

最新文章

  1. 国内ntp时间服务器ip地址
  2. 使用 .NET CLI 构建项目脚手架
  3. css3 menu 手机菜单3
  4. 进入Docker容器的4种方式
  5. =、:=、?=、+=
  6. [Microsoft][ODBC 驱动程序管理器] 在指定的 DSN 中,驱动程序和应用程序之间的体系结构不匹配...
  7. 条件随机场(CRF)小结
  8. 单片机c语言程序翻译软件,单片机音乐盒翻译小程序MusicEncode软件下载
  9. JS-获取当前URL的参数
  10. CGLIB 动态代理使用
  11. HTML+CSS项目实践五:使用纯CSS实现点击文字切换图片效果(不使用JS)
  12. 置换检验 配对秩和检验
  13. 【Nginx服务优化与防盗链】
  14. nodejs+Koa2实现小程序的微信支付请求(一)
  15. 【dp】LGTB 玩THD
  16. Android高仿苹果计算器
  17. inprivate浏览是什么意思_保护Internet隐私,打开IE浏览器InPrivate浏览默认情况下...
  18. 计算机操作系统的发展过程
  19. mysql的主句与从句_英语语法总结---二、英语中的从句是怎么回事
  20. USASCII7字符集导入ZHS16GBK字符集

热门文章

  1. go语言快速学习指南
  2. Vue------入离场动画
  3. 在国内使用Google Voice通话及短信功能
  4. 最新全国火车列车时刻查询数据库20090309下载
  5. 迅雷,快车,旋风,飞速地址转换原理分析
  6. R软件的rattle安装指南
  7. heartbleed漏洞利用
  8. 红外目标图像中阈值切割方法的比較与研究
  9. 我给塞班写的的墓志铭(作者:塞班創始人)
  10. ASP.NET--配置开发环境