下面的数据分别是:日期,用户,关键词,地址,平台,型号

2017-03-13,leo,barbecue,beijing,android,1.0
2017-03-13,leo,barbecue,beijing,android,1.0
2017-03-13,leo,barbecue,beijing,android,1.0
2017-03-13,leo,cloth,beijing,android,1.0
2017-03-13,leo2,cloth,beijing,android,1.0
2017-03-13,jack,barbecue,shanghai,android,1.1
2017-03-13,leo,paper,beijing,ios,1.0
2017-03-13,tom,barbecue,beijing,android,1.2
2017-03-13,leo,cup,beijing,android,1.0
2017-03-13,mary,barbecue,beijing,android,1.2
2017-03-13,leo,barbecue,beijing,ios,1.3
2017-03-13,leo,cup,beijing,android,1.0
2017-03-13,leo1,cup,beijing,android,1.0
2017-03-13,leo2,cup,beijing,android,1.2
2017-03-13,leo3,cup,beijing,android,1.2
2017-03-13,leo4,cup,beijing,android,1.3

使用sparksql完成,查看每个关键词的uv量

CREATE TABLE IF NOT EXISTS UVTEST (
sdate date,
suser String,
keyword String,
address String,
platform String,
version double
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
LOAD DATA LOCAL INPATH '/data/uvtest.txt' OVERWRITE INTO TABLE UVTEST;

答案

select keyword,count(distinct suser ) as uv
from uvtest
group by keyword;

sparksql

import org.apache.spark.sql.{DataFrame, SparkSession}object HiveDemo extends App{private val session: SparkSession = SparkSession.builder().enableHiveSupport().config("hive.exec.dynamic.partition.mode","nonstrict").master("local").appName("hive").getOrCreate()private val frame: DataFrame = session.table("default.uvtest")frame.createTempView("a")val sql="""|select|keyword,count(distinct suser) as uv|from uvtest|group by keyword|""".stripMarginsession.sql(sql).show()
}

执行结果

| keyword| uv|
+--------+---+
|barbecue|  4|
|   paper|  1|
|     cup|  5|
|   cloth|  2|
+--------+---+

sqark sql练习之统计UV相关推荐

  1. 浅谈SQL Server中统计对于查询的影响

    简介 SQL Server查询分析器是基于开销的.通常来讲,查询分析器会根据谓词来确定该如何选择高效的查询路线,比如该选择哪个索引.而每次查询分析器寻找路径时,并不会每一次都去统计索引中包含的行数,值 ...

  2. SQL Server 查找统计信息的采样时间与采样比例

    SQL Server 查找统计信息的采样时间与采样比例 原文:SQL Server 查找统计信息的采样时间与采样比例 有时候我们会遇到,由于统计信息不准确导致优化器生成了一个错误的执行计划(或者这样表 ...

  3. 【Java】使用MapReduce程序统计UV数量

    1.UV的概念 UV:unique view->一天内访问网站的用户数 下面是统计UV的代码: 首先是MapReduce类的代码 package com.huadian.bigdata.webl ...

  4. sql server表分区_介绍分区表SQL Server增量统计信息

    sql server表分区 If you are maintaining a very large database, you might be well aware of the pain to p ...

  5. 使用数据库维护计划SQL Server更新统计信息

    This article explores SQL Server Update Statistics using the database maintenance plan. 本文探索使用数据库维护计 ...

  6. 牛客网数据库SQL实战60—— 统计salary的累计和running_total

    牛客网数据库SQL实战60-- 统计salary的累计和running_total 题目描述 按照salary的累计和running_total,其中running_total为前两个员工的salar ...

  7. mysql语句统计总数_一条sql语句实现统计查询_MySQL

    bitsCN.com 一条sql语句实现统计查询 如图:程序员在进行如下的统计时,现在提供两种实现方案: 方案一:运用 SEKECT CASE WHEN EXPLAIN SELECT count(*) ...

  8. mysql查询数量语句_mysql语句统计总数_一条sql语句实现统计查询_MySQL

    bitsCN.com 一条sql语句实现统计查询 如图:程序员在进行如下的统计时,现在提供两种实现方案: 方案一:运用 SEKECT CASE WHEN EXPLAIN SELECT count(*) ...

  9. 优雅的利用Mybatis插件实现sql查询耗时统计

    优雅的利用Mybatis插件实现sql查询耗时统计 一. Mybatis反射机制讲解 二. 代理模式讲解 静态代理 动态代理 JDK动态代理参考代码 Proxy.newProxyInstance(xx ...

最新文章

  1. 拥有2000家门店,他如何晋升为服装界的新宠?
  2. redis 漏洞利用与防御
  3. 编写UEditor插件
  4. eclipse奇淫技巧 (转)
  5. MySQL ORDER BY:对查询结果进行排序
  6. python自动化测试平台github_GitHub - DangKaio/FXTest: 接口自动化测试平台——python+flask版,支持http协议...
  7. python整形怎么切片_python 切片操作 slice
  8. 第11篇:Flowable-BPMN部署常见问题没有对ACT_RE_PROCDEF表进行插入操作
  9. 建筑电气工程设计常用图形和文字符号_想要识图无忧?电气工程图图形符号全能图解,电工最爱识图助手...
  10. 华为P50系列外观正式官宣:双圆形后置相机模组实锤
  11. javaweb:域对象的属性操作setAttribute(),getAttribute()及其作用范围
  12. 路径规划算法3.1 人工势场法APF
  13. hmcl启动器怎么联机_HMCL 启动器教程 #1 安装启动器
  14. fw313r手机登录_迅捷(FAST)fw313r路由器初始密码_登录密码是多少?-192路由网
  15. Two Cylinders (辛普森公式处理积分)
  16. 英语拼写鉴别器_CodingPark编程公园
  17. win10下注册MSCOMM32控件
  18. LCD6210字符型液晶显示器 (1)
  19. 打破FTTR布线标准瓶颈,让千兆光纤网络走进千家万户
  20. MIKE与SMS网格的区别

热门文章

  1. 订阅号获取openid_小程序订阅消息
  2. ubuntu linux配置bond 网卡绑定 多个bond配置多网关
  3. python post 参数_python爬虫——requests库使用代理
  4. aes 结尾 特殊字符_乔迁庆典主持词开头及结尾
  5. fat linux 链接,FAT格式磁盘镜像制作方法
  6. @scheduled注解配置时间_「玩转SpringBoot」用好条件相关注解,开启自动配置之门...
  7. 筛选数据库_快速研读国外专利,轻松筛选核心技术…研发人必看6大数据库实用功能盘点!...
  8. angular 强制更新视图_angular,vue,react数据双向绑定原理分析
  9. 74ls161中rco是什么_什么是催化燃烧?如何选择催化燃烧设备?RCO和RTO有什么关系?...
  10. shiro-cas------配置从数据库获取用户