2019独角兽企业重金招聘Python工程师标准>>>

操作hive库时,发现发现它的sql与平时使用的sql有一定区别,做一些操作时,各种尝试,严重影响效率,决定总结,方便查阅。

hive是基于hdfs为文件系统的数据库,mapReduce为运算核心。

创建数据库(文本格式存储):

CREATE TABLE test(  `a` bigint,   `b` bigint,   `url` STRING)
ROW FORMAT DELIMITED  FIELDS TERMINATED BY '分隔符' 
STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION  '存储路径'

orc统一为:org.apache.hadoop.hive.ql.io.orc.OrcInputFormat

修改存储路径:

alter table 库名.表名 set location '存储路径'

查找表:

show tables like '*name*';

添加字段:

alter table 库名.表名 add columns(字段名 字段类型);

修改字段:

alter table 库名.表名 change 旧字段名 新字段名 类型;

说明:压缩格式存储的表,修改字段类型,原有数据不可使用,慎重

删除字段:

ALTER TABLE test REPLACE COLUMNS ( `a` bigint,   `b` bigint);

即删除原表url字段。

hive删除字段和平时不太一样,不能drop字段,我使用的版本不支持。

修改空值null为默认值0

alter table 库名.表名 set serdeproperties('serialization.null.format' = '0');

修改表名:

alter table 库名.旧表名 to 库名.新表名

删除分区:

alter table 库名.表名 DROP IF EXISTS PARTITION (分区名='值',分区名='值');

添加分区:

alter table 库名.表名 if not exists add partition (分区名='值',分区名=‘值’);

转载于:https://my.oschina.net/wangzonghui/blog/2872806

hive sql操作相关推荐

  1. Hive SQL操作与函数自定义(二)

    9 Operators and UDFs 9.1 内置运算符 9.1.1 关系运算符 操作符 运算对象的类型 描述 A <=> B ALL 都是NULL时,返回TRUE,有一为NULL时, ...

  2. Hive是如何让MapReduce实现SQL操作的?

    learn from 从0开始学大数据(极客时间) 1. MapReduce 实现 SQL 的原理 SELECT pageid, age, count(1) FROM pv_users GROUP B ...

  3. Spark SQL操作Hive表

    Spark SQL支持从Hive存储中读写数据.然而,Hive存在很多的依赖,而这些依赖又不包含在默认的各类Spark发型版本中.如果将Hive的依赖放入classpath中,Spark将自动加载它们 ...

  4. Hive基本SQL操作

    Hive基本SQL操作 库的创建与删除 建库语句 删除库 修改 表的建删改查 建表语句的结构 表相关的SQL语句 建表语句 创建普通表 创建字段限制的表 创建hive表 create like语法 创 ...

  5. Hadoop Hive sql 语法详细解释

    Hive 是基于Hadoop 构建的一套数据仓库分析系统.它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  6. beeline执行sql语句_由“Beeline连接HiveServer2后如何使用指定的队列(Yarn)运行Hive SQL语句”引发的一系列思考...

    背景 我们使用的HiveServer2的版本为0.13.1-cdh5.3.2,目前的任务使用Hive SQL构建,分为两种类型:手动任务(临时分析需求).调度任务(常规分析需求),两者均通过我们的We ...

  7. Hadoop Hive sql语法详解

    Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  8. python应用中调用spark_在python中使用pyspark读写Hive数据操作

    1.读Hive表数据 pyspark读取hive数据非常简单,因为它有专门的接口来读取,完全不需要像hbase那样,需要做很多配置,pyspark提供的操作hive的接口,使得程序可以直接使用SQL语 ...

  9. hive hql文档_30分钟入门 Hive SQL(HQL 入门篇)

    Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...

最新文章

  1. 高职信息安全比赛攻防思路_30.LNGZ2020-30:2020年辽宁省职业院校技能大赛(高职组)“信息安全管理与评估”赛项规程...
  2. 《强化学习周刊》第39期:近似最优深度、多智能体广义、角色动画强化学习...
  3. Thrift Java Servers Compared
  4. proteus仿真micropython_[MicroPython]TurniBit开发板DIY自动窗帘模拟系统
  5. 进化:一个平庸人的互联网之路
  6. boost::mp11::mp_transform_q相关用法的测试程序
  7. WinExec, ShellExecute,CreateProcess的对比
  8. 【Python生成readme文件】——Markdown语法
  9. pat 乙级 1008 数组元素循环右移问题(C++)
  10. 解析什么是绝对定位,相对定位与浮动
  11. 和吴昊一起玩推理 Round 2 —— 蚂蚁爬杆问题
  12. XP系统桌面图标透明问题的解决办法
  13. Kali Linux终端命令大全(建议收藏!)
  14. 00002__Proxyee-down__百度网盘下载加速软件
  15. 虚拟机无法启动(与设备不兼容)或者启动蓝屏
  16. 笔记本摄像头计算机,如何解决笔记本电脑摄像头异常问题
  17. iphone邮件服务器 263,在iphone上怎么设置263邮箱
  18. 高可用、高可扩展的原生WebView通信架构的思考
  19. 人生把我当成了戏子,我只好把你们当成婊子
  20. 谈谈小弟最近暗自干些什么勾当(LGame WP版开发进度汇报)

热门文章

  1. #研发解决方案#智慧的太空桥管理智慧设备
  2. MyBatis -- Spring -- SqlSessionFactoryBean
  3. UE4链接第三方库(lib和dll)
  4. (转)类库 框架 模式
  5. What should we do when meet a crash in android?
  6. android 锁屏
  7. cctype 头文件定义函数实例
  8. latex中插入visio矢量图的方法
  9. html列表的列选择事件,html5 datalist 选中option选项后的触发事件
  10. vba移动文件_Excel VBA 之 按需求移动、复制文件