项目场景:

通过hivesql进行指标计算


求同比:

创建hive内表

create table ccic_dev.test_yoy(
yearmonth string,
city string,
count int
)STORED AS PARQUET; 

插入数据

insert into ccic_dev.test_yoy values ('2020-01-01','上海',1000);
insert into ccic_dev.test_yoy values ('2020-02-01','杭州',1200);
insert into ccic_dev.test_yoy values ('2020-03-01','深圳',1300);
insert into ccic_dev.test_yoy values ('2020-04-01','广州',1400);
insert into ccic_dev.test_yoy values ('2019-01-01','上海',900);
insert into ccic_dev.test_yoy values ('2019-02-01','杭州',1300);
insert into ccic_dev.test_yoy values ('2019-03-01','深圳',700);
insert into ccic_dev.test_yoy values ('2019-04-01','广州',600);

求同比

SELECT
t1.year_month,
t1.city,
CASE WHEN t1.now_count IS NULL
OR t1.now_count = 0 THEN
0 ELSE t1.now_count
END now_count,
CASE
WHEN t2.last_count IS NULL OR t2.last_count = 0 THEN 0 ELSE last_count
END last_count,
CASE WHEN t2.last_count IS NULL OR t2.last_count = 0 THEN 0 ELSE( t1.now_count - t2.last_count )
END count_yoy
FROM
(
SELECT
DATE_FORMAT( yearmonth, 'yyyy-MM' ) AS year_month,
sum( count ) AS now_count ,
city
FROM ccic_dev.test_yoy
GROUP BY
DATE_FORMAT( yearmonth, 'yyyy-MM' ),
city
) t1
LEFT JOIN (
SELECT
DATE_FORMAT( DATE_ADD( yearmonth, 366 ), 'yyyy-MM' ) AS year_month,
sum( count ) AS last_count ,
city
FROM ccic_dev.test_yoy
GROUP BY
DATE_FORMAT( DATE_ADD( yearmonth, 366 ), 'yyyy-MM' ),
city
) AS t2 ON t1.year_month = t2.year_month and t1.city=t2.city;

结果:


hive指标计算:同比相关推荐

  1. 技术实践 | 如何基于 Flink 实现通用的聚合指标计算框架

    导读:网易云信作为一个 PaaS 服务,需要对线上业务进行实时监控,实时感知服务的"心跳"."脉搏"."血压"等健康状况.通过采集服务拿到 ...

  2. 2021-09-14指标计算

    指标计算 学习目标 掌握数据指标的概念 知道常见的业务指标含义 掌握常用数据指标计算方法 ​ 在之前的课程中,我们学习了Excel, Tableau, SQL, Python, 机器学习,它们都属于数 ...

  3. pandas多场景业务实战-指标计算

    指标计算 学习目标 掌握数据指标的概念 知道常见的业务指标含义 掌握常用数据指标计算方法 ​ 在之前的课程中,我们学习了Excel, Tableau, SQL, Python, 机器学习,它们都属于数 ...

  4. 为多模型寻找模型最优参数、多模型交叉验证、可视化、指标计算、多模型对比可视化(系数图、误差图、混淆矩阵、校正曲线、ROC曲线、AUC、Accuracy、特异度、灵敏度、PPV、NPV)、结果数据保存

    使用randomsearchcv为多个模型寻找模型最优参数.多模型交叉验证.可视化.指标计算.多模型对比可视化(系数图.误差图.classification_report.混淆矩阵.校正曲线.ROC曲 ...

  5. R语言glm拟合logistic回归模型:模型评估(计算模型拟合的统计显著性)、模型评估(赤信息AIC指标计算)

    R语言glm拟合logistic回归模型:模型评估(计算模型拟合的统计显著性).模型评估(赤信息AIC指标计算) 目录

  6. R语言临床预测模型的评价指标与验证指标实战:C-index指标计算

    R语言临床预测模型的评价指标与验证指标实战:C-index指标计算 目录 R语言临床预测模型的评价指标与验证指标实战:C-index指标计算

  7. 海量数据的实时指标计算

      最近看了一本书叫<风控要略-互联网业务反欺诈之路>,这本书主要是讲互联网产品安全防范的,我之前做过一年情报数据分析的工作,当时觉得这方面工作很机密,网络上几乎没什么相关的资料,这本书让 ...

  8. sperling指标 matlab,sperling指标计算实验报告

    sperling指标计算实验报告 Sperling 指标计算实验报告 一. 计算原理: 数据给出的信息为时域中的加速度信号.时间的单位为 sec,加速度单位为 m/s^2 1.将时域的信号转化为频域下 ...

  9. 解读混淆矩阵在语义分割FCN指标计算中的应用(含代码实现)

    一.混淆矩阵的概念 混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示.具体评价指标有总体精度.制图精度.用户精度等,这些精度指标从不同的侧面反映了图像分类的精度. 在人工 ...

最新文章

  1. C语言中的关键字详略
  2. java质因数算法_Java分解任意输入数的质因数算法的实现示例
  3. 【CyberSecurityLearning 67】Metasploit(MSF)
  4. 在同一基准下对前端框架进行比较(2019年更新)
  5. Linux学习之CentOS(二十二)--单用户模式下修改Root用户的密码
  6. Linux网络配置 CentOS 6/7
  7. Python客户端syn连接
  8. 滚动文字Marquee属性及参数设置
  9. 在Magento首页显示新产品怎么设置
  10. Speaking of the impact of the epidemic
  11. 分布式发布订阅模型网络的实现有哪些
  12. 20220513-rk3568编译linux4.19的buildroot-2(kernel)
  13. java计算机毕业设计跨境电商网站源码+系统+数据库+lw文档+mybatis+运行部署
  14. 解决Linux连不上外国软件源或者软件源失效
  15. 太方便了!告别复制粘贴,Python 轻松实现 PDF 转文本!
  16. python如何实现手眼定标_kafka基础和python如何操作kafka
  17. 基于docker实现人人影视CVNT虚拟化多开,基于selinum实现自动化点击程序
  18. 决斗吧4G LTE:联发科helio步步紧逼,高通裁员步步惊心---国际电子商情
  19. 在PHP中全面阻止SQL注入式攻击之三
  20. 伤寒杂病论.辨太阳病脉证并治(中)

热门文章

  1. UEFI学习4-我的第一个UEFI程序
  2. 达美乐中国IPO遇挫:延迟全球发售 原计划上周上市敲钟
  3. 如何做超级链接?如何做网页链接
  4. inter酷睿后缀含义
  5. 国内电子商务网站分析报告
  6. 自动绘制公路工程纵断面的AutoLisp程序
  7. python中的repr_python中的 __repr__和__str__
  8. Android Studio 使用Profiler时App崩溃闪退
  9. 如何基于用户生命周期分析,寻找新的增长点
  10. Mac安装Mysql卡在最后一步