目录

阅读须知

本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程

一.HBase简介

二.HBASE伪分布式搭建

一.解压hbase

二.配置环境变量

三.配置 hbase-env.sh

四.配置 hbase-site.xml

五.启动HBase

三.hbase shell

四.基本任务1使用 HBase Shell 命令完成下列任务

1.创建表

2.列出信息

3.向已经创建好的表添加和删除指定的列族或列

4.清空指定表的所有记录数据

5.统计表的行数

6.输出指定表的所有记录数据


阅读须知

本篇博客是Hbase的搭建教程以及基础Hbase语句的使用教程

除hbase配置文件与环境变量是博主自己配好复制自己配置文件过来的

其余Hbase语句均为手打,如果报错可能是引号是中文引号,如有发现可以留言提醒我,谢谢大家

编程代码之后会上传至资源中

一.HBase简介

HBase是一个基于Hadoop的分布式、可扩展、支持大数据存储的数据库。

数据模型
HBase采用表来组织数据,采用命名空间(NameSpace)对表进行逻辑分组。

NameSpace: 命名空间,类似于mysql中的database,默认有default和hbase,用户表默认在default中

表:HBase采用表来组织数据,表由行和列组成,列划分为若干个列族。

行:每个HBase表都由若干行组成,每个行由可排序的**行键(row key)**来标识。

列:采用列族:列限定符的形式确定具体的一列。

列族:一个HBase表被分组成许多“**列族”(Column Family)**的集合,它是基本的访问控制单元。列族可以动态添加,但在定义表时需要指定至少一个列族,在使用某个列族时要事先定义。
列限定符:表在水平方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起。列族里的数据通过**“列限定符”(Column qualifier)**来定位。
单元格:在HBase表中,通过行、列族和列限定符确定一个“单元格”(cell),单元格中存储的数据没有数据类型,总被视为字节数组byte[],所以在定义表时无需定义数据的类型,使用时用户需要自行进行数据类型转换

时间戳:每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引, HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留(这是和HDFS只允许追加不允许修改的特性相关的)

二.HBASE伪分布式搭建

一.解压hbase

hbase-0.98.12.1-hadoop2-bin.tar.gz 提取码SY99https://pan.baidu.com/s/13CTkNC5XjV3wuNjifF69QQ1.通过xftp将此压缩包传到虚拟机中

2.解压

tar -zxvf hbase-0.98.12.1-hadoop2-bin.tar.gz -C /etc

二.配置环境变量

vi /etc/profile
#修改配置文件export HBASE_HOME=/etc/hbase-0.98.12.1-hadoop2 #此处跟自己的解压路径
export PATH=$PATH:$HBASE_HOME/binsource /etc/profile
#重新加载配置文件

三.配置 hbase-env.sh

cd /etc/hbase-0.98.12.1-hadoop2/conf
#进入conf目录
#可以使用重命名指令将hbase-0.98.12.1-hadoop2换为hbase
# cd /etc
# cp hbase-0.98.12.1-hadoop2  hbasevim hbase-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_67
export HBASE_MANAGES_ZK=true
#修改此配置文件
#java路径使用自己/etc/profile中配置的路径

 

四.配置 hbase-site.xml

<property><name>hbase.rootdir</name><value>hdfs://自己的伪分布式主机名:9000/hbase</value>   //或:file:///home/testuser/hbase</property><property><name>hbase.cluster.distributed</name><value>true</value></property><property><name>hbase.zookeeper.quorum</name><value>自己的伪分布式主机名</value></property><property><name>hbase.master.info.port</name><value>60010</value></property><property><name>hbase.zookeeper.property.dataDir</name><value>/root/zk</value></property>

五.启动HBase

start-hbase.sh
#如果该命令提示找不到命令,则可以进入hbase的bin目录启动#启动方式2:
cd /etc/hbase/bin
sh start-hbase.shjps  //查看进程

三.hbase shell

#练习常用指令hbase shell  //ctrl+Backspace:后退hbase(main):001:0>helphbase(main):001:0>statushbase(main):001:0>whoamihbase(main):001:0>list   //列出表hbase(main):001:0>describe 'psn'  //查看psn表hbase(main):001:0>disable 'psn'hbase(main):001:0>drop 'psn'hbase(main):001:0>create //创建表,列出各种用法hbase(main):001:0>create 'student', 'info'hbase(main):001:0>describe 'student'hbase(main):001:0>create 'techer', 'info1','info2'hbase(main):001:0>put 'student','0001','info:name','xiaohua'hbase(main):001:0>put 'student','0001','info:age','22'hbase(main):001:0>get 'student','0001'  //取数据hbase(main):001:0>scan 'student'hbase(main):001:0>put 'student','0001','info:age','25'  //修改age(2) ctrl+alt+]:退出hbase shellexit:回到shell//如果hbase.rootdir设置:file:///home/testuser/hbase, cd /home/testuser/hbase/data/default/student   ls  1a1bbe7d2cf952cdc97d172136c05ad5   //region名称//如果hbase.rootdir设置:hdfs://node01:9000/hbase,可以在浏览器node01:9000查看//在浏览器(node01:60010),查看region名称cd  1a1bbe7d2cf952cdc97d172136c05ad5lsinfo   //列簇//info里无内容,上面输入的数据还在内存里(3)  hbase(main):001:0>flush 'student' //将内存数据保存到磁盘//查看info里面的文件hbase hfile -p -f 文件hbase(main):001:0>delete 'student','0001','info:name'  //删除数据hbase(main):001:0>truncate  /删除所有数据

四.基本任务1使用 HBase Shell 命令完成下列任务

1.创建表

create ‘Student' ,'info'

2.列出信息

list

3.向已经创建好的表添加和删除指定的列族或列

put 'Student','20192697','info:name','xxx'

4.清空指定表的所有记录数据

truncate ‘student‘

5.统计表的行数

count ‘student’
#因为之前清空了数据,可以先查看清空的的行数是不是0
#再重新插入数据
#在使用上述命令查看行数,这样更直观

6.输出指定表的所有记录数据

scan 'Student'

(大数据方向)分布式实验七:HBase数据库搭建以及常用命令相关推荐

  1. 大数据平台安装实验: ZooKeeper、Kafka、Hadoop、Hbase、Hive、Scala、Spark、Storm

    文章目录 实验1:Hadoop大数据平台安装实验 1. 实验目的 2. 实验环境 3. 实验过程 3.1 虚拟机的搭建 3.1.1 安装虚拟机 3.1.2 基本linux命令 3.2 准备工作 3.2 ...

  2. 大数据的分布式数据库相关知识

    现如今,大数据的发展得到了越来越多人的关注,当然,很多企业也开始关注大数据,通过大数据可以从数据中挖掘出有价值的数据,从而找出隐藏的商机,而大数据的分布式数据库是一个十分重要的内容.我们在这篇文章中就 ...

  3. 大数据技术原理与应用——NoSQL数据库

    大数据技术原理与应用--NoSQL数据库 5.1 NoSQL 简介 特点 1.灵活的可扩展性 传统的关系型数据库由于自身设计机理的原因,通常很难实现"横向扩展",在面对数据库负载大 ...

  4. 大数据课程综合实验案例:网站用户行为分析

    大数据课程综合实验案例 1 案例简介 1.1 案例目的 1.2 适用对象 1.3 时间安排 1.4 预备知识 1.5 硬件要求 1.6 软件工具 1.7 数据集 1.8 案例任务 1.9 实验步骤 2 ...

  5. 人工智能与大数据就业前景_电子信息(人工智能与大数据方向)专业介绍

    一.学科介绍 计算机科学与技术学院目前拥有计算机系.软件工程系.信息安全系.计算机基础教学部和实验教学中心5个教学单位,承担着计算机科学与技术专业.计算机科学与技术(电力企业信息化方向).软件工程.信 ...

  6. 【2022持续更新】大数据最全知识点整理-HBase篇

    大数据最全知识点整理-HBase篇 基础问题: 1.Hbase是什么 2.Hbase架构 3.Hbase数据模型 4.Hbase和hive的区别 5.Hbase特点 6.数据同样存在HDFS,为什么H ...

  7. 应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案

    应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...

  8. 应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案上课讲义...

    应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...

  9. 应用统计学大数据方向报名自述_应用统计学专业大数据方向人才培养方案..doc...

    应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...

  10. 应用统计学大数据方向报名自述_应用统计学专业(大数据方向)人才培养方案

    应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二 级 类:统计学类 专业代码: 071202 英文名称: Applied Statistics ( Big data ) 一.专业培养目标 ...

最新文章

  1. 2007年100款最佳安全工具谱
  2. postgres循环sql
  3. 12月25号 Category类别
  4. bootstrap 总结
  5. 无人驾驶(再谈基于camera的高精度地图)
  6. 记录:Linux 设置文件夹 0777 权限失效问题
  7. html动画人物走路,动画人物走路教程
  8. 淘宝与拍拍的世纪之战!(庄帅)
  9. zuk z2 android 8,【2018-12-13】ZUK Z2/Z2Pro ZUI 10 尝鲜 Android 8.1 By YouLinw
  10. windows系统背景淡绿护眼色设置
  11. 第八届2005汕头国际音响大展
  12. 感动,我终于学会了用Java对数组求和
  13. 二叉树构建的各种方法
  14. JAVA 18 拥有 9 个新特性,JDK18
  15. 1 - 概率论与数理统计
  16. Android 从底层实现让应用杀不死(1)
  17. jQuery画布以及拖拽事件
  18. 星级推荐,列举一下2018年购入的书籍
  19. IoT入门:拆解物联网全栈开发工作
  20. pageadmin CMS网站建设:母版页的制作及语法说明

热门文章

  1. 思科网络安全解决方案
  2. 报表生成器FastReport.Net常见问题解答
  3. RapidMiner介绍与实践(二)贝叶斯分类器
  4. 开源绘图工具drawio
  5. 欢乐时光病毒原码分析
  6. android otg dac,随身HiFi 安卓OTG功能在音频上的妙用
  7. ETL数据抽取 全量 增量
  8. SPI FLASH与NOR FLASH的区别
  9. 数据库加密乱码_加密数据库中的密码
  10. iperf3 万兆测试