(大数据方向)分布式实验七:HBase数据库搭建以及常用命令
目录
阅读须知
本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程
一.HBase简介
二.HBASE伪分布式搭建
一.解压hbase
二.配置环境变量
三.配置 hbase-env.sh
四.配置 hbase-site.xml
五.启动HBase
三.hbase shell
四.基本任务1使用 HBase Shell 命令完成下列任务
1.创建表
2.列出信息
3.向已经创建好的表添加和删除指定的列族或列
4.清空指定表的所有记录数据
5.统计表的行数
6.输出指定表的所有记录数据
阅读须知
本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程
除hbase配置文件与环境变量是博主自己配好复制自己配置文件过来的
其余Hbase语句均为手打,如果报错可能是引号是中文引号,如有发现可以留言提醒我,谢谢大家
编程代码之后会上传至资源中
一.HBase简介
HBase是一个基于Hadoop的分布式、可扩展、支持大数据存储的数据库。
数据模型
HBase采用表来组织数据,采用命名空间(NameSpace)对表进行逻辑分组。NameSpace: 命名空间,类似于mysql中的database,默认有default和hbase,用户表默认在default中
表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族。
行:每个HBase表都由若干行组成,每个行由可排序的**行键(row key)**来标识。
列:采用列族:列限定符的形式确定具体的一列。
列族:一个HBase表被分组成许多“**列族”(Column Family)**的集合,它是基本的访问控制单元。列族可以动态添加,但在定义表时需要指定至少一个列族,在使用某个列族时要事先定义。
列限定符:表在水平方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起。列族里的数据通过**“列限定符”(Column qualifier)**来定位。
单元格:在HBase表中,通过行、列族和列限定符确定一个“单元格”(cell),单元格中存储的数据没有数据类型,总被视为字节数组byte[],所以在定义表时无需定义数据的类型,使用时用户需要自行进行数据类型转换时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引, HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留(这是和HDFS只允许追加不允许修改的特性相关的)
二.HBASE伪分布式搭建
一.解压hbase
hbase-0.98.12.1-hadoop2-bin.tar.gz 提取码SY99https://pan.baidu.com/s/13CTkNC5XjV3wuNjifF69QQ1.通过xftp将此压缩包传到虚拟机中
2.解压
tar -zxvf hbase-0.98.12.1-hadoop2-bin.tar.gz -C /etc
二.配置环境变量
vi /etc/profile
#修改配置文件export HBASE_HOME=/etc/hbase-0.98.12.1-hadoop2 #此处跟自己的解压路径
export PATH=$PATH:$HBASE_HOME/binsource /etc/profile
#重新加载配置文件
三.配置 hbase-env.sh
cd /etc/hbase-0.98.12.1-hadoop2/conf
#进入conf目录
#可以使用重命名指令将hbase-0.98.12.1-hadoop2换为hbase
# cd /etc
# cp hbase-0.98.12.1-hadoop2 hbasevim hbase-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_67
export HBASE_MANAGES_ZK=true
#修改此配置文件
#java路径使用自己/etc/profile中配置的路径
四.配置 hbase-site.xml
<property><name>hbase.rootdir</name><value>hdfs://自己的伪分布式主机名:9000/hbase</value> //或:file:///home/testuser/hbase</property><property><name>hbase.cluster.distributed</name><value>true</value></property><property><name>hbase.zookeeper.quorum</name><value>自己的伪分布式主机名</value></property><property><name>hbase.master.info.port</name><value>60010</value></property><property><name>hbase.zookeeper.property.dataDir</name><value>/root/zk</value></property>
五.启动HBase
start-hbase.sh
#如果该命令提示找不到命令,则可以进入hbase的bin目录启动#启动方式2:
cd /etc/hbase/bin
sh start-hbase.shjps //查看进程
三.hbase shell
#练习常用指令hbase shell //ctrl+Backspace:后退hbase(main):001:0>helphbase(main):001:0>statushbase(main):001:0>whoamihbase(main):001:0>list //列出表hbase(main):001:0>describe 'psn' //查看psn表hbase(main):001:0>disable 'psn'hbase(main):001:0>drop 'psn'hbase(main):001:0>create //创建表,列出各种用法hbase(main):001:0>create 'student', 'info'hbase(main):001:0>describe 'student'hbase(main):001:0>create 'techer', 'info1','info2'hbase(main):001:0>put 'student','0001','info:name','xiaohua'hbase(main):001:0>put 'student','0001','info:age','22'hbase(main):001:0>get 'student','0001' //取数据hbase(main):001:0>scan 'student'hbase(main):001:0>put 'student','0001','info:age','25' //修改age(2) ctrl+alt+]:退出hbase shellexit:回到shell//如果hbase.rootdir设置:file:///home/testuser/hbase, cd /home/testuser/hbase/data/default/student ls 1a1bbe7d2cf952cdc97d172136c05ad5 //region名称//如果hbase.rootdir设置:hdfs://node01:9000/hbase,可以在浏览器node01:9000查看//在浏览器(node01:60010),查看region名称cd 1a1bbe7d2cf952cdc97d172136c05ad5lsinfo //列簇//info里无内容,上面输入的数据还在内存里(3) hbase(main):001:0>flush 'student' //将内存数据保存到磁盘//查看info里面的文件hbase hfile -p -f 文件hbase(main):001:0>delete 'student','0001','info:name' //删除数据hbase(main):001:0>truncate /删除所有数据
四.基本任务1使用 HBase Shell 命令完成下列任务
1.创建表
create ‘Student' ,'info'
2.列出信息
list
3.向已经创建好的表添加和删除指定的列族或列
put 'Student','20192697','info:name','xxx'
4.清空指定表的所有记录数据
truncate ‘student‘
5.统计表的行数
count ‘student’
#因为之前清空了数据,可以先查看清空的的行数是不是0
#再重新插入数据
#在使用上述命令查看行数,这样更直观
6.输出指定表的所有记录数据
scan 'Student'
(大数据方向)分布式实验七:HBase数据库搭建以及常用命令相关推荐
- 大数据平台安装实验: ZooKeeper、Kafka、Hadoop、Hbase、Hive、Scala、Spark、Storm
文章目录 实验1:Hadoop大数据平台安装实验 1. 实验目的 2. 实验环境 3. 实验过程 3.1 虚拟机的搭建 3.1.1 安装虚拟机 3.1.2 基本linux命令 3.2 准备工作 3.2 ...
- 大数据的分布式数据库相关知识
现如今,大数据的发展得到了越来越多人的关注,当然,很多企业也开始关注大数据,通过大数据可以从数据中挖掘出有价值的数据,从而找出隐藏的商机,而大数据的分布式数据库是一个十分重要的内容.我们在这篇文章中就 ...
- 大数据技术原理与应用——NoSQL数据库
大数据技术原理与应用--NoSQL数据库 5.1 NoSQL 简介 特点 1.灵活的可扩展性 传统的关系型数据库由于自身设计机理的原因,通常很难实现"横向扩展",在面对数据库负载大 ...
- 大数据课程综合实验案例:网站用户行为分析
大数据课程综合实验案例 1 案例简介 1.1 案例目的 1.2 适用对象 1.3 时间安排 1.4 预备知识 1.5 硬件要求 1.6 软件工具 1.7 数据集 1.8 案例任务 1.9 实验步骤 2 ...
- 人工智能与大数据就业前景_电子信息(人工智能与大数据方向)专业介绍
一.学科介绍 计算机科学与技术学院目前拥有计算机系.软件工程系.信息安全系.计算机基础教学部和实验教学中心5个教学单位,承担着计算机科学与技术专业.计算机科学与技术(电力企业信息化方向).软件工程.信 ...
- 【2022持续更新】大数据最全知识点整理-HBase篇
大数据最全知识点整理-HBase篇 基础问题: 1.Hbase是什么 2.Hbase架构 3.Hbase数据模型 4.Hbase和hive的区别 5.Hbase特点 6.数据同样存在HDFS,为什么H ...
- 应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案
应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
- 应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案上课讲义...
应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
- 应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案..doc...
应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
- 应用统计学大数据方向报名自述_应用统计学专业(大数据方向)人才培养方案
应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...
最新文章
- 2007年100款最佳安全工具谱
- postgres循环sql
- 12月25号 Category类别
- bootstrap 总结
- 无人驾驶(再谈基于camera的高精度地图)
- 记录:Linux 设置文件夹 0777 权限失效问题
- html动画人物走路,动画人物走路教程
- 淘宝与拍拍的世纪之战!(庄帅)
- zuk z2 android 8,【2018-12-13】ZUK Z2/Z2Pro ZUI 10 尝鲜 Android 8.1 By YouLinw
- windows系统背景淡绿护眼色设置
- 第八届2005汕头国际音响大展
- 感动,我终于学会了用Java对数组求和
- 二叉树构建的各种方法
- JAVA 18 拥有 9 个新特性,JDK18
- 1 - 概率论与数理统计
- Android 从底层实现让应用杀不死(1)
- jQuery画布以及拖拽事件
- 星级推荐,列举一下2018年购入的书籍
- IoT入门:拆解物联网全栈开发工作
- pageadmin CMS网站建设:母版页的制作及语法说明