sql取每组最新数据
引用https://blog.csdn.net/cs_hnu_scw/article/details/105397337
文章目录
- 情景引入
- 基础知识介绍
- 需求
- 预热准备
- 定义测试“书”表的DDL
- 随便插入几条测试数据的DML
- 方案设计
- 错误方案一
- 结果
- 分析
- 错误方案二
- 结果
- 分析
- 正确方案一
- 结果
- 分析
- 正确方案二
- 结果
- 分析
- 正确方案三
- 结果
- 分析
- 总结
- 彩蛋
情景引入
- 旁白:今天的天气好晴朗,处处好风光!!好风光!!今天的我没有睡懒觉,而是与小白手牵手在逛街!!!
- 小白:你看你看,那个店子有好多的书呀!知识的海洋,我来了!
- 我:翻了个白眼,知识的海洋,对你不应该是知识的地狱吗?今天怎么像变了一个人呢?
- 旁白:我和小白走进了琳琅满目的书店,各色各样的书籍展示在眼前!
- 小白:好奇怪,你快看,那边有好多重复的书,书名和作者都是一样的,可是却有新有旧的。
- 我:这不是很正常吗?总不能同样的书籍就那么一本书吧。
- 小白:可是,这相同的书名和编码的书,我都只想看最新的一本,这个可怎么办呢?
- 我:很简单呀,你一一对比每种相同的书,然后拿最新的不就好了吗?不就多花点时间而已嘛,用时间换复杂度也行啦!
- 小白:那多难整啊。。。我就是要每种书的最新的那一本,你快帮我想更好的办法;
- 我:既然,你都说了,要每组书名和编码一样的最新的一本,那么就认真听我给你分析分析。
基础知识介绍
需求
预热准备
定义测试“书”表的DDL
CREATE TABLE `book` (`id` bigint(20) NOT NULL AUTO_INCREMENT,`name` varchar(255) DEFAULT NULL COMMENT '书名',`code` varchar(64) DEFAULT NULL COMMENT '书编码',`create_time` datetime DEFAULT NULL COMMENT '创建时间',`version` int(11) DEFAULT NULL COMMENT '版本号',PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=utf8;
PS:简简单单的数据字段,如有不严谨的地方请不要在意,这里仅仅用于说明本文需要讲解的场景哦!!!
随便插入几条测试数据的DML
INSERT INTO `book` VALUES ('1', '小白', '0001', '2020-04-07 21:07:44', '1');
INSERT INTO `book` VALUES ('2', '小白', '0001', '2020-04-08 21:07:59', '2');
INSERT INTO `book` VALUES ('3', '小黑', '0002', '2020-04-08 21:08:16', '1');
INSERT INTO `book` VALUES ('4', '小明', '0003', '2020-04-01 21:08:28', '2');
INSERT INTO `book` VALUES ('5', '小明', '0003', '2020-04-08 21:08:40', '3');
方案设计
根据上面的样本数据再结合对应的需求,那么,**在理想状态下,**就是获取得到如下情况的数据:
PS:为了让各位看的清楚,就特意按照id从小到大的排序了哈!!
错误方案一
select *
FROM
book
GROUP BY name,code
order by version desc, id asc
结果
结论:这样的方案是错误的
对比,理想情况和实际情况,只能说,这种方案当然不行啦。那么为何不行呢?请继续看。。。。。
分析
- 首先,确实是将相同的name和code的内容进行了分组,即同样的name和code的数据只存在一条,说明group by没有毛病,是分组了。
- order by:其中id asc是升序,那么结果确实也是升序这个没问题;假设,觉得没用,那么大家可以试试没有加id asc的情况就如下,说明id asc 是生效了。
- order by:其中version desc是倒序,那么再看下实际情况,确实也是按照version倒序进行排序,那么说version desc也是有效果的。那么到底哪里有问题呢?
错误方案二
经过上面错误方案的解析,那么这一种肯定可以。。自信满满!!!
select *
from
(
select *
from
book
ORDER BY version desc
)as t1
GROUP BY t1.name,t1.code
order by id asc
结果
分析
- 通过实际结果观察,id确实是升序,但是每条数据的version字段却不是最大的呀。
- 通过第一种错误方案说到,要先根据version排序,然后再group by 分组。那看看SQL,确实是先排序,再分组了。可是为什么不行?
=======================================
好气呀,这两种方案都不行,那到底怎么写呢。
别慌,继续往下面看
=======================================
正确方案一
select *
from
(
select *
from
book
ORDER BY version desc
limit 100000
)as t1
GROUP BY t1.name,t1.code
order by id asc
结果
分析
正确方案二
select t1.*
from
book as t1
INNER JOIN
(
SELECT name,code,max(version) as version
from
book
GROUP BY name,code
)as t2
on
t1.code = t2.code
and
t1.name = t2.name
and
t1.version = t2.version
order by id asc
结果
分析
该SQL实现的方式主要是用到了max函数的作用。
(1)我们逐步的拆分来看:
首先,
SELECT name,code,max(version) as version
from
book
GROUP BY name,code
正确方案三
select t1.*
from
bookas t1
,
(
SELECT name,code,max(version) as version
from
book
GROUP BY name,code
)as t2
where
t1.code = t2.code
and
t1.name = t2.name
and
t1.version = t2.version
order by id asc
结果
分析
总结
- 当然,上面的例子是非常简单的,但是实际就是能够表明这种相似场景会存在的问题,而在我们实际中,也不过是限制条件多了一点,然后表的字段多了一些,而要关联的表多一点而已。所以,还是希望各位能够明白上述几种正确和错误方案的原因和原理;
- 分组取数是相对常见的需求,那么,我们应该多注重这方面的隐藏问题,否则,只是简单的想或者数据量少时,那几种错误的方案可能就被误以为是正确的了。所以,要多多的思考问题;
- 建议大家可以看看Mysql的执行流程以及底层时,引擎到底是如何工作等等内容,比如,Mysql执行语句是一条链还是多分支?Mysql执行的时候是哪一层判断语法是否正确或错误的呢?。所以,路漫漫兮,共同学习!
附加mysql函数SUBSTRING_INDEX(GROUP_CONCAT())
select project_id, project_name, SUBSTRING_INDEX(GROUP_CONCAT(id order by update_time desc),',',1) as id from table1 where status=4and parent_project_id in()group by project_id
sql取每组最新数据相关推荐
- group by 取每组最新的一条
单表操作 select mac(a),b,max(time) from test group by b; 多表关联group by 取每组最新一条 select max(a.b_id),max(a.t ...
- sql 取两条相邻数据之间的时间差
取两条相邻数据之间的时间差 SELECT A.id,A.createDate,B.createDate, TIMESTAMPDIFF(MINUTE,A.createDate,B.createDate) ...
- 分组后取每组最新的数据
select * from members m where m.id in (select SUBSTRING_INDEX(GROUP_CONCAT(id ORDER BY age desc),',' ...
- stream实现list根据对象中多个属性分组,并取分组后最新数据
业务场景:定时任务同步中间表数据到业务表,如果中间表中存在相同维度的多条数据(未创建唯一索引),取最新一条数据,并对查询的中间表数据进行更新. 方式1 // 根据结果表唯一索引分组,取中间表重复最新一 ...
- 朋友股票亏惨了,我一怒用Python爬取了证券最新数据
大家好,我是辣条. 抓取目标: url:http://webapi.cninfo.com.cn/#/marketDataDate 数据目标: 获取 证券代码 证券简称 交易日期 开盘价 最高价 最低 ...
- mysql分组取出每组地一条数据_基于mysql实现group by取各分组最新一条数据
基于mysql实现group by取各分组最新一条数据 前言: group by函数后取到的是分组中的第一条数据,但是我们有时候需要取出各分组的最新一条,该怎么实现呢? 本文提供两种实现方式. 一.准 ...
- mysql分组取所有数据_mysql 分组后取每个组内最新的一条数据
首先,将按条件查询并排序的结果查询出来. mysql> select accepttime,user,job from tuser_job where user =8 order by acce ...
- sql分组查询每组最新的一条数据
原文地址:https://www.cnblogs.com/java-spring/p/11498457.html 开发中经常会遇到,分组查询最新数据的问题,比如下面这张表(查询每个地址最新的一条记录) ...
- Mysql分组查询每组最新的一条数据(三种实现方法)
MySQL分组查询每组最新的一条数据 前言 注意事项 准备SQL 错误查询 错误原因 方法一 方法二(适用于自增ID和创建时间排序一致) 方法三(适用于自增ID和创建时间排序一致) 总结 MAX()函 ...
最新文章
- 无需数据线,在Windows电脑上就可以浏览和编辑华为的手机文件
- c语言调用hzk16,C语言使用HZK16显示每个像素的代码
- 【SSL】错误java.security.UnrecoverableKeyException: Cannot recover key
- mysql创建用户报错ERROR 1290
- Jerry带您了解Restful ABAP Programming模型系列之二:Action和Validation的实现
- 13 SD配置-企业结构-分配-给销售办公室分配销售组
- 判断一个字符(小写变为大写,大写变小写,数字不变,空格输出space,其他字符输出other)C语言
- 敢问北极熊,路在何方?
- Flutter进阶—创建有状态控件
- 腾讯云 AI 在新基建领域下一盘什么大棋
- WinCE的USB驱动开发
- myeclipse包导入项目lib下无效
- 用JavaScript实现用户登录验证、注册信息格式检验(附代码)
- 深度学习 DEEP LEARNING 1-2章
- 防御DDoS措施抓住这一要点,让你从此不再为DDoS头疼
- AH快递单打印查询软件V3.68
- ImproperlyConfigured: mysqlclient 1.4.0 or newer is required; you have 0.10.1.
- TO DO ... ...
- 简报 | 菲律宾中央银行已经将数十家数字货币交易所合法化
- Docker Cgroup资源配置(CPU、内存、磁盘)