HiveSql常用的时间维度计算方法(月初、月末、周几)及时间维度 表生成
目录
0 基础函数
trunc()
last_day()
add_months()
current_date()/current_date
next_day
pmod()
to_date
year
month
hour
dayofweek
weekofyear
quarter
datediff
date_add
date_sub
add_months
months_between
date_format
1 关于月的计算
1.1上月末
1.2上月初
1.3本月初
1.4 本月末
2 关于周计算
2.1 本周一
2.2 本周末
2.3 上周一
2.4上周末
2.5 根据当前日期得出星期几
3 关于季度计算
3.1季度初方法一
3.2 季度初方法二
3.3 获取季度末的方法
4 关于年计算
4.1 年开始日期
4.2 年结束的日期
5 时间日期维度表生成
0 基础函数
trunc()
trunc(string date,string format) — 返回日期的最开始日期
目前格式支持:MM(月)YYYY(年)Hive3.0后支持Q表示季度
select trunc(current_date,'MM') --月初
select trunc(current_date,'YY') --年初
last_day()
last_day(string date) — 返回该月最后一天的日期
select last_day(current_date());
add_months()
add_months(string date,int months) — 返回months月之后的date,months可以是负数
select add_months(current_date(),1);
current_date()/current_date
当前日期(天)
select current_date
next_day
next_day(string date,string dayOfWeek) — 返回date之后的下一个周的dayOfWeek的天
求当前日期的下周一时间
select next_day(current_date,'MO')
pmod()
pmod(int a, int b)
pmod(double a, double b)
返回a除以b的余数的绝对值
select pmod(10,4)
to_date
语法:to_date(string timestamp)
返回值: 2.1.0版本前返回string,2.1.0版本后返回date
描述: 将一个字符串date按照"yyyy-MM-dd"格式转成日期值.
select to_date(current_timestamp)
year
语法:year(string date)
返回值:int
描述:提取日期中的年份部分
select year(current_timestamp)
month
语法:month(string date)
返回值: int
描述:提取日期中的月份部分
select month(current_timestamp)
hour
语法:hour(string date)
返回值:int
描述:提取日期中的小时部分
select hour(current_timestamp)
dayofweek
获取当前日期的星期几。这里本周的第一天是周日,使用时候注意转换。Hive低版本没有该函数,Hive2.1版本之后才有,如果版本较低建议使用pmod方法获取当前日期的星期几,参考下文。
select dayofweek('2022-05-29 20:21:22')
weekofyear
语法:weekofyear(string date)
返回值:int
描述: 返回指定日期处于当年的第几周
select weekofyear('2022-05-29') as weekofyear;
quarter
获取当前日期所处的季度
select quarter('2022-05-29 20:21:22')
低版本没有该函数,可以用ceil(month(date) / 3)来代替
select CEIL(month('2022-05-29 20:21:22') / 3)
datediff
语法:datediff(string enddate, string startdate)
返回值: int
描述: 返回两指定日期之间的天数
select datediff('2022-05-30', '2022-05-15')
date_add
语法:date_add(date/timestamp/string startdate, tinyint/smallint/int days)
返回值: 2.1.0版本前返回string,2.1.0版本后返回date
描述:返回开始日期startdate增加天数days后的日期
select date_add('2022-05-15', 5);
date_sub
语法: date_sub(date/timestamp/string startdate, tinyint/smallint/int days)
返回值: 2.1.0版本前返回string,2.1.0版本后返回date
描述: 返回开始日期startdate减少天数days后的日期
select date_sub('2022-05-15', 5)
add_months
语法: add_months(string start_date, int num_months, output_date_format)
返回值: string
描述: 返回开始日期start_date增加num_months月后的日期,output_date_format做为可选参数只在Hive 4.0.0版本后可用。
select add_months('2022-05-15', 5)
months_between
语法:months_between(date1, date2)
返回值: double
描述: 返回两日期的间隔月份
select months_between('2022-05-15', '2022-01-15')
date_format
格式化日期:date_format函数将字符串或者日期转化为指定格式的日期
select date_format('2022-05-29 20:21:22', 'yyyy-MM-dd')
1 关于月的计算
关于月的计算主要使用trunc()函数的计算
1.1上月末
select date_sub(trunc(current_date,'MM'),1);
1.2上月初
select trunc(add_months(current_date,-1),'MM')
1.3本月初
select trunc(current_date,'MM')
1.4 本月末
select last_day(current_date());
2 关于周计算
关于周的计算主要是使用next_day()函数的计算
使用函数next_day获取日期下个星期几的日期,参数周一:MO;周二:TU;周三:WE ;周四:TH ;周五:FR ;周六:SA;周日SU
2.1 本周一
select date_sub(next_day(current_date,'MO'),7) ;
2.2 本周末
select date_sub(next_day(current_date,'MO'),1);
2.3 上周一
select date_sub(next_day(current_date,'MO'),14) ;
2.4上周末
select date_sub(next_day(current_date,'MO'),8) ;
2.5 根据当前日期得出星期几
主要使用pmod()函数
select pmod(datediff(current_date, '2012-01-01'), 7) = 0 --当等于0是当前天为星期日 select pmod(datediff(current_date, '2012-01-01'), 7) = 1 --当等于1是当前天为星期1 select pmod(datediff(current_date, '2012-01-01'), 7) = 2 --当等于2是当前天为星期2 select pmod(datediff(current_date, '2012-01-01'), 7) = 3 --当等于3是当前天为星期3 select pmod(datediff(current_date, '2012-01-01'), 7) = 4 --当等于4是当前天为星期4 select pmod(datediff(current_date, '2012-01-01'), 7) = 5 --当等于5是当前天为星期5 select pmod(datediff(current_date, '2012-01-01'), 7) = 6 --当等于6是当前天为星期6
3 关于季度计算
3.1季度初方法一
利用季度的小公式计算
select concat_ws('-', cast(year(current_date) as string), cast(ceil(month(current_date()) / 3) * 3 - 2 as string), '1');
3.2 季度初方法二
利用quater()函数+case when转换
select case quarter(current_date)when 1 then concat(year(current_date), '-01-01')when 2 then concat(year(current_date), '-04-01')when 3 then concat(year(current_date), '-07-01')when 4 then concat(year(current_date), '-10-01')end as q_first_day
3.3 获取季度末的方法
季度算法小公式:
ceil(当前月份 / 3 ):获取当前时间所处的季度(Hive高版本可用quater()函数代替)
一个季度有3个月:
- ceil(当前月份 / 3 ) *3:得到当前月份所处的季度末月份
- ceil(当前月份 / 3 ) *3 -2 :获取当前月份所处的季度初的月份
- ceil(当前月份 / 3 ) *3 + 1 :获取当前月份所处的季度的下一个季度初的月份
当前日期所处的季度末就是:下一个季度月初的时间减去1
select date_sub(concat_ws('-', cast(year(current_date) as string), cast(ceil(month(current_date()) / 3) * 3 + 1 as string), '1')
,1)
4 关于年计算
4.1 年开始日期
select trunc(current_date, 'YYYY')
4.2 年结束的日期
明年的第一天减去1就是今年的结束日期
select date_sub(trunc(add_months(current_date, 12), 'YYYY'), 1)
5 时间日期维度表生成
根据以上时间的计算方法,我们来生成一张时间维度表,基本上改维度表把以上所有的知识都串起来了。
使用SQL 实现一张日期维度表,包含以下字段:
drop table if exists dim_date;
create table if not exists dim_date(
`date` string comment '日期',
d_week string comment '年内第几周',
weeks string comment '周几',
w_start string comment '周开始日',
w_end string comment '周结束日',
d_month string comment '第几月',
m_start string comment '月开始日',
m_end string comment '月结束日',
d_quarter int comment '第几季',
q_start string comment '季开始日',
q_end string comment '季结束日',
d_year int comment '年份',
y_start string comment '年开始日',
y_end string comment '年结束日'
);--自然月: 指每月的1 号到那个月的月底,它是按照阳历来计算的。就是从每月1 号到月底,不管这个月
有30 天,31 天,29 天或者28 天,都算是一个自然月。
Hive低版本使用
select `date`, d_week --年内第几周, case weekidwhen 0 then '周日'when 1 then '周一'when 2 then '周二'when 3 then '周三'when 4 then '周四'when 5 then '周五'when 6 then '周六'end as weeks -- 周, date_sub(next_day(`date`, 'MO'), 7) as w_start --周一, date_sub(next_day(`date`, 'MO'), 1) as w_end -- 周日_end
-- 月份日期, monthid as d_month, m_start, m_end
-- 季节, quarterid as d_quart, concat_ws('-', cast(d_year as string), cast(quarterid * 3 - 2 as string), '1') as q_start --季开始日, date_sub(concat_ws('-', cast(d_year as string), cast(quarterid * 3 + 1 as string), '1'), 1) as q_end --季结束日, d_year, y_start, y_end
from (select `date`, pmod(datediff(`date`, '2012-01-01'), 7) as weekid
--获取周几, month(`date`) as monthid
--获取月份, ceil(month(`date`) / 3) as quarterid
--获取季节id, year(`date`) as d_year
-- 获取年份, trunc(`date`, 'YYYY') as y_start
--年开始日, date_sub(trunc(add_months(`date`, 12), 'YYYY'), 1) as y_end --年结束日, trunc(`date`, 'MM') as m_start
--当月第一天, last_day(`date`) as m_end
--当月最后一天, weekofyear(`date`) as d_week
--年内第几周from (-- '2021-01-01'是开始日期, '2022-05-31'是截止日期select date_add('2021-01-01', t0.pos) as `date`from (select posexplode(split(repeat('o', datediff('2022-05-31', '2021-01-01')), 'o'))) t0) t1) t2;
或Hive高版本使用
select `date`, d_week --年内第几周, case weekidwhen 0 then '周日'when 1 then '周一'when 2 then '周二'when 3 then '周三'when 4 then '周四'when 5 then '周五'when 6 then '周六'end as weeks -- 周, date_sub(next_day(`date`, 'MO'), 7) as w_start --周一, date_sub(next_day(`date`, 'MO'), 1) as w_end -- 周日_end
-- 月份日期, monthid as d_month, m_start, m_end
-- 季节, quarterid as d_quart, concat_ws('-', cast(d_year as string), lpad(cast(quarterid * 3 - 2 as string),2,0), '1') as q_start --季开始日, date_sub(concat_ws('-', cast(d_year as string), cast(quarterid * 3 + 1 as string), '1'), 1) as q_end --季结束日, d_year, y_start, y_end
from (select `date`, dayofweek(`date`) -1 as weekid
--获取周几, month(`date`) as monthid
--获取月份, quarter(`date`) as quarterid
--获取季节id, year(`date`) as d_year
-- 获取年份, trunc(`date`, 'YYYY') as y_start
--年开始日, date_sub(trunc(add_months(`date`, 12), 'YYYY'), 1) as y_end --年结束日, trunc(`date`, 'MM') as m_start
--当月第一天, last_day(`date`) as m_end
--当月最后一天, weekofyear(`date`) as d_week
--年内第几周from (-- '2021-01-01'是开始日期, '2022-05-31'是截止日期select date_add('2021-01-01', t0.pos) as `date`from (select posexplode(split(repeat('o', datediff('2022-05-31', '2021-01-01')), 'o'))) t0) t1) t2;
6 小结
本文总结了关于Hive中时间函数的使用及时间维度表的生成方法,时间维度表及时间函数在数据开发中经常被用到,这块需要切实掌
HiveSql常用的时间维度计算方法(月初、月末、周几)及时间维度 表生成相关推荐
- 获取指定日期的常用前后节点(月初月末周一周末等等)
获取指定日期的常用前后节点(月初月末周一周末等等) 原文:获取指定日期的常用前后节点(月初月末周一周末等等) 注:周节点方面是根据中国习惯,视周一为起,周日为末. /*---------------- ...
- 电容充放电时间的计算方法(重点是对于恒流充放电的常用公式:⊿Vc=I*⊿t/C,其出自公式:Vc=Q/C=I*t/C。)电荷泵(无电感)中电容恒流放电的滤波可以参考4-20毫安的采集中RC滤波电路
电容充放电时间的计算方法 电子发烧友网•来源:fqj • 2019-05-29 14:55 • 45861次阅读 0 1L.C元件称为"惯性元件",即电感中的电流.电容器两端的电 ...
- Js获取当前时间的月初月末
// 获取当前时间的月初月末 let currentDay = new Date() currentDay.setDate(1)console.info('firstDay:', currentDay ...
- HiveSQL常用优化方法全面总结
转载自 HiveSQL常用优化方法全面总结 Hive作为大数据领域常用的数据仓库组件,在平时设计和查询时要特别注意效率.影响Hive效率的几乎从不是数据量过大,而是数据倾斜.数据冗余.job或I/O ...
- HiveSQL常用数据处理语句
HiveSQL运行优化参数配置 HiveSQL常用数据处理语句 HiveSQL中复杂数据类型操作 Hive 采用了类似SQL 的查询语言 HQL(Hive Query Language),因此很容易将 ...
- 数据分析常用五个方法三个模型(逻辑分析、多维度拆解、对比分析、假设验证、相关性分析、RFM模型、漏斗分析模型、AARRR模型)
目录 一.逻辑树分析法 二.多维度拆解分析法 三.对比分析法 四.假设检验法/归因分析法 五. 相关性分析法 六. RFM分析模型 七. 漏斗分析模型 八. AARRR模型 一.逻辑树分析法 定义:将 ...
- Postman:常用的Pre-request Script方法【MD5+时间戳+获取当前时间】
postman:请求前脚本常用的三种方法: 一.获取当前时间的13位时间戳 二.字段MD5加密 三.获取接口请求的时间 一.获取当前时间的13位时间戳 // 1.变量time接收获取的时间戳 var ...
- JS获取某月天数、月初是周几、月末是周几
JS获取某月天数.月初是周几.月末是周几 获取某月的天数 获取月初是周几 获取月末是周几 //测试数据 let arr = [[2020, 1], [2020, 2], [2020, 3], [202 ...
- 常用的空间形状相似性计算方法有哪些,它们之间有什么不同
常用的空间形状相似性计算方法包括: 欧氏距离:计算空间中两个点之间的距离,适用于点集的相似性计算. 曼哈顿距离:计算空间中两个点在各个坐标轴上的距离之和,适用于点集的相似性计算. 余弦相似度:计算两个 ...
- java hh24miss_时间日期转换工具类,获取当前时间YYYYMMDD24HHMISS、YYYYMMDDHHMISS
packagecom.ztesoft.iotcmp.util;importcom.ztesoft.zsmart.core.log.ZSmartLogger;importjava.sql.Timesta ...
最新文章
- ansible 非root 用户 批量修改用户密码
- python中if错误-Python中错误和异常
- 清除距今天7天的日志
- ASP.NET Core 登录登出 - ASP.NET Core 基础教程 - 简单教程,简单编程
- docker 镜像修改的配置文件自动还原_Docker 基础与实战,看这一篇就够了
- Codeforces Round #215 (Div. 2) D. Sereja ans Anagrams
- emmx文件用什么软件打开电脑_emmx文件怎么打开
- 2021第四届全国大学生IT技能大赛“传智杯”AK
- 计算机网络flash实训报告,flash动画实训总结精选 .doc
- 【软件设计】BDD由内而外采用策略
- 初始vue脚手架的项目文件中mian.js文件
- 种草拔草.......人生就是酱紫
- Android开发笔记(一百四十八)自定义输入法软键盘
- 求最大公因数的两种方法(高效方法)
- MongoDB副本详解
- CLA not signed yet
- java并发编程2-一起看Happens-Before 规则的前因后果
- 表格(HTML和CSS属性)
- 分期的秘密:名义利率和实际利率
- 《初等数论》:最大公因数与最小公倍数