Hadoop快速入门(一)##

####几个概念:
#####大数据:无法在一定时间内用常规软件工具对其内容进行撞去、管理和处理的数据集合。
#####大数据技术:从各种各样类型的数据中,快速获得由价值信息的能力。
#####配套技术:大规模并行处理数据库(MPP),数据挖掘,分布式文件系统,分布式数据库,云计算平台,互联网和可扩展的存储系统。
Hadoop:以HDFS和mapreduce为核心。
#####Hadoop生态:

Hive,HBase,Pig,Sqoop,Flume,Zookeeper,Mahout,Spark,Storm,Shark,Phoenix,Tez,Ambari。

Hive:用于Hadoop的一个数据仓库系统,他提供了类似于SQL的查询语言
HBase:一种分布的,可伸缩的,大数据存储库,,支持随机、实时读/写访问
Pig:分析大数据集的一个平台
Sqoop:为高校传输批量数据而设计的一种工具,其用于Hadoop和结构化数据存储库如关系数据库之间的数据传输
Flume:一种分布式的、可靠的、可用的服务,其用于高效搜集,汇总,移动大量日志数据
Zookeeper:一种集中服务,其用于维护配置信息,命名,提供分布式同步,以及提供分组服务
Mahout:一种基于Hadoop及其学习和数据挖掘的分布式计算框架算法集,实现了多种MapReduce模式的数据挖掘算法
Spark:一个开源的数据分析集群计算框架,采用Scala语言实现,使用Scala作为应用框架
Storm:一个分布式的、容错的实时计算系统。属于流处理平台,多用于实时计算,并更新数据库。可对数据流做连续查询。还可以用于“分布式RPC”,以并行的方式运行大型的运算。
Shark:一个专为Spark打造的大规模数据仓库系统,兼容Hive。可以用100倍的速度执行Hive QL。
Phoenix:一个构建在HBase之上的一个SQL中间层,完全使用java编写,提供了一个客户端可嵌入的JDBC驱动。
Tez:一个基于YARN之上的DAG。拆分子过程,合并子过程。加快运算速度。
Ambari:一个供应、管理和监视Hadoop集群的开源框架,它提供一个直观的操作工具和一个健壮的Hadoop API,可以隐藏复杂的Hadoop操作,使集群操作大大简化。

####安装与配置
操作系统:CentOS6.464bitCentOS 6.4 64 bitCentOS6.464bit
虚拟机:VMware9.0VMware 9.0VMware9.0
Hadoop:2.X2.X2.X
JDK:1.71.71.7

安装过程:
1、配置VMware网络
2、安装操作系统,安装完成后,添加一个新用户hadoop,设置密码并授予其sudo权限。
3、设置静态ip(基于局域网内):

1)修改/etc/sysconfig/network-scripts/ifcfg-eth0
2)修改/etc/sysconfig/network
3)修改DNS信息
4)关闭防火墙并修改其启动策略为不开机启动

4、安装JDK
5、配置ssh免登陆
6、安装Hadoop

下次讲部署细节

Hadoop快速入门(一)相关推荐

  1. Hadoop快速入门——入门考试(伪分布式60+编码25+执行jar15)

    Hadoop快速入门--入门考试(伪分布式60+编码25+执行jar15) 目录 一.伪分布式搭建(60分) 1.创建1台Linux虚拟机,并打开对应的网络连接(VMnet8)(5分) 2.通过xsh ...

  2. Hadoop快速入门——第三章、MapReduce案例(字符统计)

    Hadoop快速入门--第三章.MapReduce案例 目录 环境要求: 1.项目创建: 2.修改Maven 3.编码 4.本地文件测试 5.修改[Action]文件(修改测试文件路径) 6.导出ja ...

  3. Hadoop快速入门——第四章、zookeeper安装

    Hadoop快速入门--第四章.zookeeper安装 压缩包下载地址:[https://download.csdn.net/download/feng8403000/85227883] 目录 1.上 ...

  4. 大数据技术之Hadoop(快速入门)

    目录 第一章 Hadoop概述 1.1 什么是Hadoop 1.2  Hadoop 产生背景 Hadoop之父:Doug cutting 1.3  Hadoop 三大发行版本 Hadoop 三大发行版 ...

  5. 【Hadoop快速入门】Hdfs、MapReduce、Yarn

    1. Hahoop概述 1.1 Hodoop是什么 1) Hadoop是一个有Apache基金会所开发的分布式系统基础架构 2) 主要解决海量数据的存储和海量数据的分析计算问题 3) 广义上来说,Ha ...

  6. 4.2.Hadoop快速入门

    python编程快速上手(持续更新中-) 推荐系统基础 文章目录 python编程快速上手(持续更新中-) 推荐系统基础 1 HADOOP概述 1.1 什么是Hadoop Hadoop名字的由来 Ha ...

  7. hadoop快速入门之DKH安装准备

    2019独角兽企业重金招聘Python工程师标准>>> 前几天去参加了一个线下的聚会,参加聚会的基本都是从事互联网工作的.会上有人提到了区块链,从而引发了一场关于大数据方面的探讨.我 ...

  8. Hadoop快速入门——第一章、认识Hadoop

  9. Apache Hive 快速入门 (CentOS 7.3 + Hadoop-2.8 + Hive-2.1.1)

    2019独角兽企业重金招聘Python工程师标准>>> 本文节选自<Netkiller Database 手札> 第 63 章 Apache Hive 目录 63.1. ...

  10. 150页书籍《PyTorch 深度学习快速入门指南》附PDF电子版

    为什么说是极简教程,首先本书只涵盖了150页.内容比较精简,特别适合作为 PyTorch 深度学习的入门书籍.为什么这么说呢?因为很多时候,一份厚重的书籍往往会削弱我们学习的积极性,在学习一门新的语言 ...

最新文章

  1. html 常用方法,jquery的常用方法有哪些?
  2. 网页的一般布局(标题和脚注100%,内容宽度固定宽度px)
  3. 记使用WaitGroup时的一个错误
  4. python2的idle打不开了
  5. Kubernetes系列之Helm介绍篇
  6. 特别引人注目的头像_设计样式指南:构建引人注目的产品的要素
  7. 网络压缩《network pruning 浅析》
  8. oracle 德文符号处理_南沙区专业高效的化妆废水处理操作简单
  9. JavaScript知识(二)
  10. 腾讯 Tars-Go 服务获取自定义模版(配置)值
  11. html 字体图标 颜色怎么改,关于css:如何设置Font Awesome Icons的图标颜色,大小和阴影的样式...
  12. 软件图标显示不正常的问题
  13. Android CameraX 仿一甜相机(录像、拍照、可调节尺寸、聚焦、照明、网格线),最全的CameraX教程
  14. Spring Security 官方文档学习路径
  15. LODOP.ADD_PRINT_TEXT 参数解释说明
  16. MNIST数据集学习
  17. IND-CPA(选择明文攻击下的不可区分性)
  18. 淋巴细胞转化中PHP的作用,淋巴细胞转化试验范围|意义
  19. Cadence Allegro如何修改栅格大小
  20. Arduino大师练成手册 -- 初识Arduino和开发环境搭建

热门文章

  1. 转载自Kevin-Tong
  2. 电子技术基础(数字部分)(第六版) 康华光 课后习题答案
  3. 利用excel做简单的曲线拟合并生成公式
  4. python反编译软件下载_python批量反编译软件
  5. turtle画动态时钟
  6. c 语言万年历算法,【C语言】第一个C语言小程序 —— 日期算法和万年历
  7. Ubuntu下定时重启程序
  8. MSN Messenger协议
  9. carrot2_热门的错误人类天气机器人CARROT终于在Android上推出
  10. 第一至第七次人口普查县级人口普查GIS数据集(1953-2010)