大数据开发hive数据库常用命令汇总
在大数据学习当中,尤其是Hadoop生态的学习当中,Hive是必备的,也是相对门槛较低,比较好入手的一个组件。今天的大数据开发分享,和大家分享Hive的基础知识点。
Hive简介
根据官方文档的定义,Hive是一种用类SQL语句来协助读写、管理那些存储在分布式存储系统上大数据集的数据仓库软件
1、进入hive数据库:
hive
2、查看hive中的所有数据库:
show databases;
3、用default数据库:
use default;
4、查看所有的表:
show tables;
5、查询表结构:
desc table_name(表名);
6、查询表数据:
select * from table_name(表名);
7、创建数据库:
hive> create schema shop_db;
8、验证数据库表:
hive> show databases;
9、删除数据库:
hive> drop database if exists shop_db;
drop schema shop_db;
全部删除相应的表在删除数据库之前:
hive> drop dataBASE if exists shop_db cascade;
10、创建表tb_employee
hive> create table if not exists tb_employee (id int,name string,salary string,destination string)
> comment '员工信息详情表'> row format DELIMITED
> fields terminated by '\t'> lines terminated by '\n'> stored as textfile;
如果增加分区必须在创建表的时候就创建分区,不然就会报错,创建分区的命令>partition by ‘根据哪个字段分区’,
hive> create table tb_employee (id int, name string, dept string)
> PARTITIONED BY (year int)
> row format delimited
> fields terminated by '\t'
> lines terminated by '\n'
> stored as textfile;
stored as textfile文件格式,文件格式在hive中有三种: textfile、Sequencefile、Rcfile。
11、添加数据到表中
hive> load data local inpath '/usr/hadoop/hive/employee.txt' overwrite into table tb_employee;
如果table是个分区表则必须在hql中指定分区
hive> load data local inpath '/usr/hadoop/hive/employee.txt' overwrite into table tb_employee partition(year=2022);
load data:加载数据;
local:本地数据
inpath:文件的地址
overwrite:覆盖表中的数据,注意加overwrite是重写表的数据,不加是追加数据
插入表数据:insert into tb_employee(id,name) values (1,'洪生鹏');hive只支持插入不支持修改和删除
12、重命名表名:
hive> alter table tb_employee rename to emp;
13、修改tb_employee表中字段name为user_name:
hive> alter table tb_employee change name user_name string;
14、修改tb_employee表中字段salary的数据类型从float改为double:
hive> alter table tb_employee change salary salary double;
15、删除表
hive> drop table table_name;
16、创建视图
hive> create view employee_view as select * from tb_employee where salary>3000;
17、不同类型的连接 join 、left outer join 、right outer join 、full outer join
18、创建外部表:用external关键字
hive> create external table outside_table_name(name string comment '姓名',addr string comment '地址');
19、查询表信息:
desc formatted outside_table_name;
关于大数据开发,Hive基础知识点是必须要掌握的。
唐山徐敏被捕,事件再次反转,“保护伞”要现形了?
大数据开发hive数据库常用命令汇总相关推荐
- hive mysql命令,Hive数据库常用命令
收藏一些Hive数据库常用命令,方便平时准备测试数据集. 查看库.创建普通Hive表: show databases; user lch_databases; show tables; create ...
- 猿创征文|大数据开发必备的数据采集工具汇总
文章目录 前言 1.Flume 适用场景 工作方式 2.Flink CDC 适用场景 工作方式 3.Sqoop 适用场景 工作方式 4.Canal 适用场景 工作方式 5.Kettle 适用场景 工作 ...
- 大数据学习笔记——linux常用命令整理
1.常用操作 查看当前目录下的所有文件及目录 ls/ll 进入目录 cd 查看当前目录 pwd 结束当前进程 ctrl+c/ctrl+z ctrl + z可以将一个正在前台执行的命令放到后台,并且 ...
- 小学生 自学大数据 第一章linux常用命令 (一)
目录 1.vi/vim 1.1 是什么 1.2 一般模式 1.3 编辑模式 1.4 指令模式 2.帮助命令 2.1 man 2.2 help 2.3 type 3.文件目录类 3.1 pwd 3.2 ...
- MySQL数据库常用命令汇总
-- 查看mysql的当前登陆用户 select user(); -- 列出数据库 show databases; -- 使用数据库 use mysql; describe mysql.user; s ...
- 大数据之-Hadoop3.x_Yarn_常用命令---大数据之hadoop3.x工作笔记0147
可以看到我们执行wordcount案例,然后可以通过yarn命令查看任务运行情况 首先我们去启动集群. 可以看到yarn也启动好了,集群启动好了以后
- 大数据开发——Hive实战案例
文章目录 1. 创建表结构 1.1 视频表结构 1.2 用户表结构 2. 准备工作 2.1 创建临时表 2.2 创建最终使用表 2.3 对创建表进行解读 3. 业务分析 1. 创建表结构 1.1 视频 ...
- 大数据之Linux(一):常用命令之cat和head,tail命令结合
目录 1.查看文件所有内容(如果太长一般只显示后面一部分) 2.查看某个文件指定行信息(前n行,后n行) 3.从多少行开始查看文件 tail -n +行号 4.直接用sed命令 1.查看文件所有内容( ...
- 大数据系列(3)-HDFS 常用命令
目录 1.服务端命令 1.1 appendToFile 追加到文件 1.2 copyFromLocal 从本地拷贝 1.3 copyToLocal 下载文件到本地 1.4 count 统计文件目录. ...
最新文章
- 导出勾选密码永不过期的AD账户信息
- java描述常用的集合类_Java常用的三大集合类
- Spring 中策略模式的 2 个经典应用,可以用来怼面试官了
- Python的单例模式
- 七夕福利 | 拒绝狗粮,给你全部的AI(爱)
- ROS2学习(三).ROS2环境配置
- 手机音频通道被占用_关于凯叔讲故事APP的音频导出下载
- 前端有用JavaScript技巧
- win10如何关闭Windows Defender安全保护程序
- Could not find a version that satisfies the requirement Twisted=13.1.0 (from Scrapy)
- 程序员的自我修养 pdf_软件特攻队|C/C++程序员的自我修养(5)
- Python gmpy2 mpz Methods
- 华为机试HJ105:记负均正II
- CSS实现三角形的方法--拓展
- 高等代数第3版下 [丘维声 著] 2015年版_义务教育数学课程标准(2011年版)(部分内容)...
- (5)air202读取串口数据并上传到阿里云显示
- 一、14.猜码游戏:每一轮里,程序随机生成两个数字,一个是码数,0到5,一个是猜数,码数到10。用户也输入码数和猜数。若这一轮程序的猜数等于两个码数之和,输出“电脑胜”,若都没猜对或都猜对了,公布双方
- android前置拍照镜像代码,在Android中镜像前置摄像头
- python 图片二值化后 判断图片是白底黑字,还是黑底白字
- android P-sensor (Proximity Sensor)
热门文章
- 高性能RabbitMQ消息队列介绍 及 SpringBoot整合
- [ 操作系统 ] 假定在单CPU条件下有下列要执行的作业,用一个执行时间图描述在采用非抢占优先级算法时执行这些作业的情况;对于上述算法,各个作业的周转时间是多少?平均周转时间是多少?
- Spark分布式计算框架之SparkStreaming+kafka
- 韦东山嵌入式第一期学习笔记DAY_3——7_1_裸机开发步骤简介
- php开启websocket服务,php实现简单的websocket服务
- 毕业设计-基于MATLAB的含噪语音信号降噪处理系统
- 深入理解 Base64 底层原理
- 数据论《西游记》关系网:猪八戒最主动喜欢别人
- python:matplotlib.pyplot绘制散点图(基础一)
- 数据,数据元素,数据项,数据对象的区别