一文读懂Hive(架构原理,DDL,常用函数,优化技巧)
1.HIVE简介
1.什么是HIVE
hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:
可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;
可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。
2.HIVE特点
可扩展: Hive可以自由的扩展集群的规模,一般情况下不需要重启服务。
延展性: Hive支持用户自定义函数,用户可以根据自己需求来实现自己的函数。
容错:良好的容错性,节点出现问题SQL仍可完成执行。
2.HIVE架构
1.架构图
用户接口:Client
CLI(hive shell)
JDBC/ODBC(java访问hive)
WEBUI(浏览器访问hive)
元数据:Metastore
元数据包括:表名、表所属的数据库(默认是default
一文读懂Hive(架构原理,DDL,常用函数,优化技巧)相关推荐
- 一文读懂贝叶斯原理(Bayes‘ theorem)
一文读懂贝叶斯原理(Bayes' theorem) 前言:贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论.以下摘一段 wikipedia 上的简介: 一. ...
- 一文读懂CDN加速原理
一文读懂CDN加速原理 什么是 CDN 工作原理 传统访问过程 CDN 访问过程 组成要素 智能调度 DNS 缓存功能服务 负载均衡设备 内容 Cache 服务器 共享存储 名词解释 CNAME记录( ...
- 一文读懂 SOA 架构和微服务架构的区别
点击关注公众号,回复"1024"获取2TB学习资源! 场景 如果我们打开支付宝首页,去看我们的余额,它会展示你的总资产,昨日收益.累计收益等信息.假如这个页面所展示的信息,都来自各 ...
- HDFS原理 | 一文读懂HDFS架构与设计
1 前言 HDFS(Hadoop Distributed File System)是我们熟知的Hadoop分布式文件系统,是一个高容错的系统,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.H ...
- 从单体到Flink:一文读懂数据架构的演变
导读:近年来随着开源社区的发展,越来越多新的技术被开源,例如雅虎的Hadoop分布式计算框架.UC伯克利分校的Apache Spark等,而伴随着这些技术的发展,促使着企业数据架构的演进,从传统的关系 ...
- 一文读懂分布式架构知识体系(内含超全核心知识大图)
作者 | 晓土 阿里巴巴高级工程师 姊妹篇阅读推荐:<云原生时代,分布式系统设计必备知识图谱(内含22个知识点)> 导读:本文力求从分布式基础理论.架构设计模式.工程应用.部署运维.业界方 ...
- 一文读懂遗传算法工作原理(附Python实现)
Datawhale干货 选自:AnalyticsVidhya,编译:机器之心 近日,Analyticsvidhya 上发表了一篇题为<Introduction to Genetic Algori ...
- 一文读懂扩散模型原理、推断加速和可控生成
在刚刚过去的2022年,扩散模型(Diffusion Models)成为了深度生成模型中新的SOTA.近期,中国人民大学助理教授李崇轩和清华大学博士生鲍凡在由智源社区主办的"2022大模型创 ...
- 入门必备 | 一文读懂神经架构搜索
作者 | Md Ashiqur Rahman 编译 | 刘静 转载自图灵TOPIA(ID: turingtopia) 近期谷歌大脑团队发布了一项新研究:只靠神经网络架构搜索出的网络,不训练,不调参,就 ...
最新文章
- 越卖越涨?腾讯股票3月后大涨45%,超越“阿里”成中国第一,市值相当于14.3个百度!...
- Incorrect usage of DB GRANT and GLOBAL PRIVILEGES
- 5.3.3 TCP可靠传输
- 2019年山西计算机二级报名入口,2019年下半年山西省计算机二级考试教程:Web程序设计...
- apache 服务器概述--安装(一)
- 启明云端分享|一款方便、实用的且适用于ESP32/ESP8266的USB-TTL转接板开发工具推荐
- 强制删除tfs未迁入项的两个方法。
- 一步步Notepad变Word
- MappingException:class com.zsn.crm.Model.user not found whie looking for property user id
- 将SQL Server数据库备份到多个文件或从多个文件还原
- vuecli3修改项目启动端口
- oracle监听器启动停止,Oracle 10g 监听器启动后停止的解决办法
- 解决问题--修改weblogic密码后无法启动以及如何解密weblogic的3DES密文
- TCP/IP协议保留地址一览表
- FSEC大学生电动方程式赛车电气系统设计
- Linux面试基础知识--汇总
- 写给那些进步缓慢却全然不知的IT人
- 绕过磊科路由器登录密码
- Html help安装步骤,Doxgen+Graphiz+htmlhelp配置
- hacking 麦步手表之(1)精简模拟界面
热门文章
- pythonrandom rand_Python np.random.rand()和np.random.randn()
- vue安装jsencrypt_vue使用JSEncrypt实现rsa加密及挂载方法
- python 生成器对象_Python 生成器, 迭代器, 可迭代对象的区别
- android 血压计开发,智能血压计方案开发
- c语言计蒜客成绩排序,计蒜客 排序后的数组删除重复数字
- python爬虫淘宝视频_Python2爬虫:以抓取淘宝MM为例(实战)
- BUUCTF Web [GXYCTF2019]Ping Ping Ping
- 以管理员权限运行程序需注意
- Xopsed的编译与安装
- go语言实现ssh打隧道