系列文章目录

【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事
【SQL开发实战技巧】系列(二):简单单表查询
【SQL开发实战技巧】系列(三):SQL排序的那些事
【SQL开发实战技巧】系列(四):从执行计划讨论UNION ALL与空字符串&UNION与OR的使用注意事项
【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS 和 INNER JOIN效率,我们要分场景不要死记网上结论
【SQL开发实战技巧】系列(六):从执行计划看NOT IN、NOT EXISTS 和 LEFT JOIN效率,记住内外关联条件不要乱放
【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起
【SQL开发实战技巧】系列(八):聊聊如何插入数据时比约束更灵活的限制数据插入以及怎么一个insert语句同时插入多张表
【SQL开发实战技巧】系列(九):一个update误把其他列数据更新成空了?Merge改写update!给你五种删除重复数据的写法!
【SQL开发实战技巧】系列(十):从拆分字符串、替换字符串以及统计字符串出现次数说起
【SQL开发实战技巧】系列(十一):拿几个案例讲讲translate|regexp_replace|listagg|wmsys.wm_concat|substr|regexp_substr常用函数
【SQL开发实战技巧】系列(十二):三问(如何对字符串字母去重后按字母顺序排列字符串?如何识别哪些字符串中包含数字?如何将分隔数据转换为多值IN列表?)
【SQL开发实战技巧】系列(十三):讨论一下常用聚集函数&通过执行计划看sum()over()对员工工资进行累加
【SQL开发实战技巧】系列(十四):计算消费后的余额&计算银行流水累计和&计算各部门工资排名前三位的员工
【SQL开发实战技巧】系列(十五):查找最值所在行数据信息及快速计算总和百之max/min() keep() over()、fisrt_value、last_value、ratio_to_report
【SQL开发实战技巧】系列(十六):数据仓库中时间类型操作(初级)日、月、年、时、分、秒之差及时间间隔计算
【SQL开发实战技巧】系列(十七):数据仓库中时间类型操作(初级)确定两个日期之间的工作天数、计算—年中周内各日期出现次数、确定当前记录和下一条记录之间相差的天数
【SQL开发实战技巧】系列(十八):数据仓库中时间类型操作(进阶)INTERVAL、EXTRACT以及如何确定一年是否为闰年及周的计算
【SQL开发实战技巧】系列(十九):数据仓库中时间类型操作(进阶)如何一个SQL打印当月或一年的日历?如何确定某月内第一个和最后—个周内某天的日期?
【SQL开发实战技巧】系列(二十):数据仓库中时间类型操作(进阶)获取季度开始结束时间以及如何统计非连续性时间的数据
【SQL开发实战技巧】系列(二十一):数据仓库中时间类型操作(进阶)识别重叠的日期范围,按指定10分钟时间间隔汇总数据


文章目录

  • 系列文章目录
  • 前言
    • 一、组合相关的行
    • 二、从执行计划看IN、EXISTS 和 INNER JOIN效率
    • 三、INNER JOIN、LEFT JOIN、RIGHT JOIN 、FULL JOIN、自关联解析
      • 1、INNER JOIN 的 特点
      • 2、LEFTJOIN的特点
      • 3、RIGHT JOIN的特点
      • 4、FULL JOIN的特点
      • 6、自关联
  • 总结

前言

本篇文章讲解的主要内容是:从执行计划角度分析IN、EXISTS 和 INNER JOIN效率而不是死记网上结论、表的5种关联:INNER JOIN、LEFT JOIN、RIGHT JOIN 和 FULL JOIN 解析
【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。


一、组合相关的行

相对查询单表中的数据来说,平时更常见的需求是要在多个表中返回数据。比如,显示部门10的员工编码、姓名及所在部门名称和工作地址。

select a.empno,a.deptno,b.dname
from emp a inner join dept b
on(a.deptno=b.deptno)
where a.deptno=10;
EMPNO DEPTNO DNAME
----- ------ --------------7782     10 ACCOUNTING7839     10 ACCOUNTING7934     10 ACCOUNTING

另外有下面写法:

select a.empno,a.deptno,b.dname
from emp a,dept b
where a.deptno=b.deptno
EMPNO DEPTNO DNAME
----- ------ --------------7369     20 RESEARCH7499     30 SALES7521     30 SALES7566     20 RESEARCH7654     30 SALES7698     30 SALES7782     10 ACCOUNTING7788     20 RESEARCH7839     10 ACCOUNTING7844     30 SALES7876     20 RESEARCH7900     30 SALES7902     20 RESEARCH7934     10 ACCOUNTING14 rows selected

其中,JOIN的写法是SQL-92的标准,当有多个表关联时,JOIN方式的写法能更清楚地看清各表之间的关系,因此,建议大家写查询语句时优先使用JOIN的写法。

二、从执行计划看IN、EXISTS 和 INNER JOIN效率

下面先 创建一个表 emp2.

drop index IDX_ENAME;
DROP TABLE emp2 PURGE ;
CREATE TABLE emp2 AS
SELECT ename,job,sal,comm FROM emp WHERE job ='CLERK';

要求返回与表emp2(empno,job,sal)中数据相匹配的emp(empno,ename,job,sal,deptno)
信息。
IN、EXISTS、INNER JOIN三种写法。为了加强理解,请大家看一下三种写法及其PLAN(此处用的是Oracle 11g)。

  • in写法
SQL> explain plan for select empno,ename,job,sal,deptno from emp where (ename,job,sal) in(select ename,job,sal from emp2);ExplainedSQL> select * from table(dbms_xplan.display());PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
Plan hash value: 4039873364
---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |     1 |    67 |     6   (0)| 00:00:01 |
|*  1 |  HASH JOIN SEMI    |      |     1 |    67 |     6   (0)| 00:00:01 |
|   2 |   TABLE ACCESS FULL| EMP  |    15 |   780 |     3   (0)| 00:00:01 |
|   3 |   TABLE ACCESS FULL| EMP2 |     4 |    60 |     3   (0)| 00:00:01 |
---------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------1 - access("ENAME"="ENAME" AND "JOB"="JOB" AND "SAL"="SAL")
Note
------ dynamic statistics used: dynamic sampling (level=2)19 rows selected
  • exists写法
SQL>  EXPLAIN PLAN FOR SELECT empno,ename,job,sal,deptno FROM emp a2  WHERE EXISTS (SELECT NULL3  FROM emp2 b4  WHERE b.ename = a.ename AND b.job = a.job5  AND b.sal = a.sal) ;ExplainedSQL> select * from table(dbms_xplan.display());PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
Plan hash value: 4039873364
---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |     1 |    67 |     6   (0)| 00:00:01 |
|*  1 |  HASH JOIN SEMI    |      |     1 |    67 |     6   (0)| 00:00:01 |
|   2 |   TABLE ACCESS FULL| EMP  |    15 |   780 |     3   (0)| 00:00:01 |
|   3 |   TABLE ACCESS FULL| EMP2 |     4 |    60 |     3   (0)| 00:00:01 |
---------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------1 - access("B"."ENAME"="A"."ENAME" AND "B"."JOB"="A"."JOB" AND"B"."SAL"="A"."SAL")
Note
------ dynamic statistics used: dynamic sampling (level=2)20 rows selected
  • 因为子查询的JOIN列(emp2.ename,emp2.job,ernp2.sal)没有重复行,所以这个查询可以直接改为INNER JOIN。
SQL> EXPLAIN PLAN  FOR  SELECT a.empno,a.ename,a.job,a.sal,a.deptno from emp a2  INNER JOIN emp2 b ON (b.ename = a.ename AND b.job = a.job AND b.sal =a.sal);ExplainedSQL> select * from table(dbms_xplan.display());PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
Plan hash value: 166525280
---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |     4 |   268 |     6   (0)| 00:00:01 |
|*  1 |  HASH JOIN         |      |     4 |   268 |     6   (0)| 00:00:01 |
|   2 |   TABLE ACCESS FULL| EMP2 |     4 |    60 |     3   (0)| 00:00:01 |
|   3 |   TABLE ACCESS FULL| EMP  |    15 |   780 |     3   (0)| 00:00:01 |
---------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------1 - access("B"."ENAME"="A"."ENAME" AND "B"."JOB"="A"."JOB" AND"B"."SAL"="A"."SAL")
Note
------ dynamic statistics used: dynamic sampling (level=2)20 rows selected

或许与大家想象的不一样,以上三个PLAN中JOIN写法利用了HASH JOIN(哈希连接),其他两种运用的都是HASH JOIN SEMI(哈希半连接),说明在这个语句中的IN与EXISTS效率是一样的。所以,在不知哪种写法高效时应查看PLAN,而不是去记固定的结论

三、INNER JOIN、LEFT JOIN、RIGHT JOIN 、FULL JOIN、自关联解析

有很多人对这几种连接方式,特别是LEFT JOIN与RIGHT JOIN分不清,下面通过案例来解析一下。
首先建立两个测试用表。

DROP TABLE L PURGE ; DROP TABLE R PURGE;
--左表
CREATE TABLE L AS
SELECT 'left_1'  AS  str ,  '1' AS  v  FROM  dual  UNION  ALL
SELECT 'left_2'  AS  str ,  '2' AS  v  FROM  dual  UNION  ALL
SELECT 'left_3'  AS  str ,  '3' AS  v  FROM  dual  UNION  ALL
SELECT 'left_4'  AS  str ,  '4' AS  v  FROM  dual;
--右表
CREATE TABLE R AS
SELECT 'right_3'  AS  str ,  '3' AS  v,1 as status  FROM  dual  UNION  ALL
SELECT 'right_4'  AS  str ,  '4' AS  v,0 as status  FROM  dual  UNION  ALL
SELECT 'right_5'  AS  str ,  '5' AS  v,0 as status  FROM  dual  UNION  ALL
SELECT 'right_6'  AS  str ,  '6' AS  v,0 as status  FROM  dual;

1、INNER JOIN 的 特点

该方式返回两表相匹配的数据,左表的"1、2"以及右表的"5、6"都没有显示。
JOIN写法

SQL>
SQL> select l.str as left_str, r.str as right_str2    from l3   inner join r4      on (l.v = r.v)5   order by 1, 2;LEFT_STR RIGHT_STR
-------- ---------
left_3   right_3
left_4   right_4

2、LEFTJOIN的特点

该方式的左表为主表,左表返回所有的数据,右表中只返回与左表匹配的数据,"5、6"都没有显示。
join写法:

select l.str as left_str, r.str as right_strfrom lleft join ron (l.v = r.v)order by 1, 2;
LEFT_STR RIGHT_STR
-------- ---------
left_1
left_2
left_3   right_3
left_4   right_4

加(+)写法

select l.str as left_str, r.str as right_strfrom l, rwhere l.v = r.v(+)order by 1, 2;

3、RIGHT JOIN的特点

该方式的右表为主表,左表中只返回与右表匹配的数据"3、4",而"1、2"都没有显示,右表返回所有的数据。
join写法

select l.str as left_str, r.str as right_strfrom lright join ron (l.v = r.v)order by 1, 2;
LEFT_STR RIGHT_STR
-------- ---------
left_3   right_3
left_4   right_4right_5right_6

加(+)写法

select l.str as left_str, r.str as right_strfrom l, rwhere l.v(+) = r.vorder by 1, 2;

4、FULL JOIN的特点

该方式的左右表均返回所有的数据,但只有相匹配的数据显示在同一行,非匹配的行只显示一个表的数据。
JOIN写法

select l.str as left_str, r.str as right_strfrom lfull join ron (l.v = r.v)order by 1, 2;
LEFT_STR RIGHT_STR
-------- ---------
left_1
left_2
left_3   right_3
left_4   right_4right_5right_66 rows selected

FULL JOIN 无(+ )的写法。

6、自关联

表emp中有一个字段mgr,其中是主管的编码(对应于emp.empno),如:
(EMPNO:7698,ENAME:BLAKE)-->(MGR:7839)-->(EMPNO:7839,ENAME:KING),说明BLAKE的主管就是KING
如何根据这个信息返回主管的姓名呢?
这里用到的就是自关联。也就是两次查询表emp,分别取不同的别名,这样就可以当作是两个表,后面的任务就是将这两个表和JOIN连接起来就可以。
为了方便理解,这里用汉字作为别名,并把相关列一起返回。

SELECT 员工.empno AS 职工编码,员工.ename AS 职工姓名,员工.job   AS 工作,员工.mgr   AS 员工表_主管编码,主管.empno AS 主管表_主管编码,主管.ename AS 主管姓名FROM emp 员工LEFT JOIN emp 主管ON (员工.mgr = 主管.empno)ORDER BY 1;职工编码 职工姓名   工作      员工表_主管编码 主管表_主管编码 主管姓名
----- ---------- --------- -------- -------- ----------1001 test                                   7369 SMITH      CLERK         7902     7902 FORD7499 ALLEN      SALESMAN      7698     7698 BLAKE7521 WARD       SALESMAN      7698     7698 BLAKE7566 JONES      MANAGER       7839     7839 KING7654 MARTIN     SALESMAN      7698     7698 BLAKE7698 BLAKE      MANAGER       7839     7839 KING7782 CLARK      MANAGER       7839     7839 KING7788 SCOTT      ANALYST       7566     7566 JONES7839 KING       PRESIDENT                   7844 TURNER     SALESMAN      7698     7698 BLAKE7876 ADAMS      CLERK         7788     7788 SCOTT7900 JAMES      CLERK         7698     7698 BLAKE7902 FORD       ANALYST       7566     7566 JONES7934 MILLER     CLERK         7782     7782 CLARK15 rows selected

总结

这一章主要介绍两块,之所以拿出来这两块说是因为:

  • IN、EXISTS 和 INNER JOIN这三者或则说前两者的效率,博主在日常工作和面试过程中,经常遇到大家斩钉截铁的说in效率远远低于EXISTS 和 INNER JOIN,这类人大都是自己没有亲测,从网上搜了相关信息就记下来了,有些时候,网上的内容并不代表绝对正确,就像网上很多文章说scala的入参不能超过22个参数一样~
  • 其次,表的INNER JOIN、LEFT JOIN、RIGHT JOIN 、FULL JOIN、自关联这5种关联和简写方式,在工作中也很容易出错,所以在写这篇文章时候,博主自己也做个总结~

【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS 和 INNER JOIN效率,我们要分场景不要死记网上结论相关推荐

  1. 【SQL开发实战技巧】系列(六):从执行计划看NOT IN、NOT EXISTS 和 LEFT JOIN效率,记住内外关联条件不要乱放

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  2. 【SQL开发实战技巧】系列(十五):查找最值所在行数据信息及快速计算总和百之max/min() keep() over()、fisrt_value、last_value、ratio_to_report

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  3. 【SQL开发实战技巧】系列(四):从执行计划讨论UNION ALL与空字符串UNION与OR的使用注意事项

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  4. 【SQL开发实战技巧】系列(十三):讨论一下常用聚集函数通过执行计划看sum()over()对员工工资进行累加

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  5. 【SQL开发实战技巧】系列(九):一个update误把其他列数据更新成空了?Merge改写update!给你五种删除重复数据的写法!

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  6. 【SQL开发实战技巧】系列(十):从拆分字符串、替换字符串以及统计字符串出现次数说起

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  7. 【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  8. 【SQL开发实战技巧】系列(三):SQL排序的那些事

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  9. 【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

最新文章

  1. Hello World
  2. java正则学习笔记三
  3. makefile入门
  4. 关于java同步包中ConcurrentLinkedQueue类的深入分析与理解
  5. Thrown KeeperErrorCode = Unimplemented for /services exception
  6. V-rep学习笔记:vrep中的实用工具
  7. 普通java程序怎样用cron_java – Spring cron vs普通cron?
  8. 平安 开源 数据库 实践_刻意的实践-成为开源
  9. windows 安装 zabbix agent 客户端
  10. 一本书看懂数字化转型|全新《2021年度案例观察》限时免费送
  11. 云顶之弈小程序 置顶工具(附源码)
  12. 同济保研计算机,同济大学保研率28%,保研高校前四:复旦、北大、交大、清华...
  13. 关于三个概念:ActiveX、OLE和COM
  14. 麒麟系统常见问题详解
  15. 4、wpf 打包为exe或者msi的安装程序
  16. POI设置excel格式为文本格式
  17. 浙江咪咕MGV3200_KLH_国科GK6323_2+8_免拆机卡刷固件包
  18. LeetCode——110,判断平衡二叉树
  19. kodi android 目录,如何在xbmc / kodi插件中创建多个目录?
  20. 基于人工智能的滚动轴承PHM方法综述

热门文章

  1. 三大运营商个人轨迹证明方法
  2. 计算机英语广播,计算机专业英语词汇7-英语文章阅读-大耳朵英语 - 免费在线英语学习 口语练习 四级听力资料 在线翻译 网络课堂 英语社区...
  3. 计算机设置用户权限的风险,电脑安全设置_当前安全设置会使计算机有风险怎么关掉...
  4. PyQt5+eric6之旅(三) - 多线程应用 - 追加显示
  5. 分布式和集中式版本控制的区别
  6. 初级会计难吗,用不用报班,自学可以吗?速看!
  7. 基于神经网络的人脸识别,神经网络实现人脸识别
  8. ubuntu系统怎么使用ifconfig和开启远程连接
  9. sizeof关键字使用方法及实例演示
  10. python matplotlib 绘制二维数据中某些列到折线图,没有线的解决方法