阅读须知

本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程

一.HBase简介

二.HBASE伪分布式搭建

一.解压hbase

二.配置环境变量

三.配置 hbase-env.sh

四.配置 hbase-site.xml

五.启动HBase

三.hbase shell

四.基本任务1使用 HBase Shell 命令完成下列任务

1.创建表

2.列出信息

3.向已经创建好的表添加和删除指定的列族或列

4.清空指定表的所有记录数据

5.统计表的行数

6.输出指定表的所有记录数据

阅读须知

本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程

除hbase配置文件与环境变量是博主自己配好复制自己配置文件过来的

其余Hbase语句均为手打，如果报错可能是引号是中文引号，如有发现可以留言提醒我，谢谢大家

编程代码之后会上传至资源中

一.HBase简介

HBase是一个基于Hadoop的分布式、可扩展、支持大数据存储的数据库。

数据模型
HBase采用表来组织数据，采用命名空间（NameSpace）对表进行逻辑分组。

NameSpace: 命名空间，类似于mysql中的database，默认有default和hbase，用户表默认在default中

表：HBase采用表来组织数据，表由行和列组成，列划分为若干个列族。

行：每个HBase表都由若干行组成，每个行由可排序的**行键（row key）**来标识。

列：采用列族:列限定符的形式确定具体的一列。

列族：一个HBase表被分组成许多“**列族”（Column Family）**的集合，它是基本的访问控制单元。列族可以动态添加，但在定义表时需要指定至少一个列族，在使用某个列族时要事先定义。
列限定符：表在水平方向由一个或者多个列族组成，一个列族中可以包含任意多个列，同一个列族里面的数据存储在一起。列族里的数据通过**“列限定符”（Column qualifier）**来定位。
单元格：在HBase表中，通过行、列族和列限定符确定一个“单元格”（cell），单元格中存储的数据没有数据类型，总被视为字节数组byte[]，所以在定义表时无需定义数据的类型，使用时用户需要自行进行数据类型转换

时间戳：每个单元格都保存着同一份数据的多个版本，这些版本采用时间戳进行索引， HBase中执行更新操作时，并不会删除数据旧的版本，而是生成一个新的版本，旧有的版本仍然保留（这是和HDFS只允许追加不允许修改的特性相关的）

二.HBASE伪分布式搭建

一.解压hbase

hbase-0.98.12.1-hadoop2-bin.tar.gz 提取码SY99https://pan.baidu.com/s/13CTkNC5XjV3wuNjifF69QQ1.通过xftp将此压缩包传到虚拟机中

2.解压
tar -zxvf hbase-0.98.12.1-hadoop2-bin.tar.gz -C /etc

二.配置环境变量

vi /etc/profile
#修改配置文件export HBASE_HOME=/etc/hbase-0.98.12.1-hadoop2 #此处跟自己的解压路径
export PATH=$PATH:$HBASE_HOME/binsource /etc/profile
#重新加载配置文件

三.配置 hbase-env.sh

cd /etc/hbase-0.98.12.1-hadoop2/conf
#进入conf目录
#可以使用重命名指令将hbase-0.98.12.1-hadoop2换为hbase
# cd /etc
# cp hbase-0.98.12.1-hadoop2  hbasevim hbase-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_67
export HBASE_MANAGES_ZK=true
#修改此配置文件
#java路径使用自己/etc/profile中配置的路径

四.配置 hbase-site.xml

<property><name>hbase.rootdir</name><value>hdfs://自己的伪分布式主机名:9000/hbase</value>   //或：file:///home/testuser/hbase</property><property><name>hbase.cluster.distributed</name><value>true</value></property><property><name>hbase.zookeeper.quorum</name><value>自己的伪分布式主机名</value></property><property><name>hbase.master.info.port</name><value>60010</value></property><property><name>hbase.zookeeper.property.dataDir</name><value>/root/zk</value></property>

五.启动HBase

start-hbase.sh
#如果该命令提示找不到命令，则可以进入hbase的bin目录启动#启动方式2：
cd /etc/hbase/bin
sh start-hbase.shjps  //查看进程

三.hbase shell

#练习常用指令hbase shell  //ctrl+Backspace:后退hbase(main):001:0>helphbase(main):001:0>statushbase(main):001:0>whoamihbase(main):001:0>list   //列出表hbase(main):001:0>describe 'psn'  //查看psn表hbase(main):001:0>disable 'psn'hbase(main):001:0>drop 'psn'hbase(main):001:0>create //创建表，列出各种用法hbase(main):001:0>create 'student', 'info'hbase(main):001:0>describe 'student'hbase(main):001:0>create 'techer', 'info1','info2'hbase(main):001:0>put 'student','0001','info:name','xiaohua'hbase(main):001:0>put 'student','0001','info:age','22'hbase(main):001:0>get 'student','0001'  //取数据hbase(main):001:0>scan 'student'hbase(main):001:0>put 'student','0001','info:age','25'  //修改age(2) ctrl+alt+]:退出hbase shellexit:回到shell//如果hbase.rootdir设置：file:///home/testuser/hbase, cd /home/testuser/hbase/data/default/student   ls  1a1bbe7d2cf952cdc97d172136c05ad5   //region名称//如果hbase.rootdir设置：hdfs://node01:9000/hbase，可以在浏览器node01:9000查看//在浏览器(node01:60010)，查看region名称cd  1a1bbe7d2cf952cdc97d172136c05ad5lsinfo   //列簇//info里无内容，上面输入的数据还在内存里(3)  hbase(main):001:0>flush 'student' //将内存数据保存到磁盘//查看info里面的文件hbase hfile -p -f 文件hbase(main):001:0>delete 'student','0001','info:name'  //删除数据hbase(main):001:0>truncate  /删除所有数据

四.基本任务1使用 HBase Shell 命令完成下列任务

1.创建表

create ‘Student' ,'info'

2.列出信息

list

3.向已经创建好的表添加和删除指定的列族或列

put 'Student','20192697','info:name','xxx'

4.清空指定表的所有记录数据

truncate ‘student‘

5.统计表的行数

count ‘student’
#因为之前清空了数据，可以先查看清空的的行数是不是0
#再重新插入数据
#在使用上述命令查看行数，这样更直观

6.输出指定表的所有记录数据

scan 'Student'

(大数据方向）分布式实验七：HBase数据库搭建以及常用命令相关推荐

大数据平台安装实验: ZooKeeper、Kafka、Hadoop、Hbase、Hive、Scala、Spark、Storm
文章目录实验1:Hadoop大数据平台安装实验 1. 实验目的 2. 实验环境 3. 实验过程 3.1 虚拟机的搭建 3.1.1 安装虚拟机 3.1.2 基本linux命令 3.2 准备工作 3.2 ...
大数据的分布式数据库相关知识
现如今,大数据的发展得到了越来越多人的关注,当然,很多企业也开始关注大数据,通过大数据可以从数据中挖掘出有价值的数据,从而找出隐藏的商机,而大数据的分布式数据库是一个十分重要的内容.我们在这篇文章中就 ...
大数据技术原理与应用——NoSQL数据库
大数据技术原理与应用--NoSQL数据库 5.1 NoSQL 简介特点 1.灵活的可扩展性传统的关系型数据库由于自身设计机理的原因,通常很难实现"横向扩展",在面对数据库负载大 ...
大数据课程综合实验案例：网站用户行为分析
大数据课程综合实验案例 1 案例简介 1.1 案例目的 1.2 适用对象 1.3 时间安排 1.4 预备知识 1.5 硬件要求 1.6 软件工具 1.7 数据集 1.8 案例任务 1.9 实验步骤 2 ...
人工智能与大数据就业前景_电子信息（人工智能与大数据方向）专业介绍
一.学科介绍计算机科学与技术学院目前拥有计算机系.软件工程系.信息安全系.计算机基础教学部和实验教学中心5个教学单位,承担着计算机科学与技术专业.计算机科学与技术(电力企业信息化方向).软件工程.信 ...
【2022持续更新】大数据最全知识点整理-HBase篇
大数据最全知识点整理-HBase篇基础问题: 1.Hbase是什么 2.Hbase架构 3.Hbase数据模型 4.Hbase和hive的区别 5.Hbase特点 6.数据同样存在HDFS,为什么H ...
应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案
应用统计学专业(大数据方向)人才培养方案学科门类:理学二级类:统计学类专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案上课讲义...
应用统计学专业(大数据方向)人才培养方案学科门类:理学二级类:统计学类专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案..doc...
应用统计学专业(大数据方向)人才培养方案学科门类:理学二级类:统计学类专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
应用统计学大数据方向报名自述_应用统计学专业(大数据方向)人才培养方案
应用统计学专业(大数据方向)人才培养方案学科门类:理学二级类:统计学类专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...

(大数据方向）分布式实验七：HBase数据库搭建以及常用命令

阅读须知

本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程

一.HBase简介

二.HBASE伪分布式搭建

一.解压hbase

二.配置环境变量

三.配置 hbase-env.sh

四.配置 hbase-site.xml

五.启动HBase

三.hbase shell

四.基本任务1使用 HBase Shell 命令完成下列任务

1.创建表

2.列出信息

3.向已经创建好的表添加和删除指定的列族或列

4.清空指定表的所有记录数据

5.统计表的行数

6.输出指定表的所有记录数据

(大数据方向）分布式实验七：HBase数据库搭建以及常用命令相关推荐

最新文章

热门文章