Oracle 优化器_表连接
概述
在写SQL的时候,有时候涉及到的不仅只有一个表,这个时候,就需要表连接了。Oracle优化器处理SQL语句时,根据SQL语句,确定表的连接顺序(谁是驱动表,谁是被驱动表及 哪个表先和哪个表做链接)、连接方法(下文有详细介绍)及访问单表的方法(是否走索引,及走哪个索引)。
类型
表连接的类型分为两种:内连接和外连接。表连接的类型不同,得到的结果也不相同。不同的SQL语句使用不同的表连接。演示表连接我们用两个表t1和t2 。建表语句及数据如下:
-- 建表语句 CREATE TABLE T1(col1 number,col2 VARCHAR2(1)); CREATE TABLE T2(col2 VARCHAR2(1),col3 VARCHAR2(2)); -- 表1数据 INSERT INTO t1 VALUES(1,'A'); INSERT INTO t1 VALUES(2,'B'); INSERT INTO t1 VALUES(3,'C'); -- 表2 数据 INSERT INTO t2 VALUES('A','A2'); INSERT INTO t2 VALUES('B','B2'); INSERT INTO t2 VALUES('D','D2');
内连接
内连接,表的连接只包含满足条件的记录,Oracle数据库默认的链接方式,只要在SQL语句中没有(+),这里的(+)是Oracle特有的连接符号。或者 left outer join 、 right outer join 、full outer join 那么SQL的连接类型就是内连接。
内连接的写法:
1.Oracle自带(最常用):
SELECT T1.COL1,T1.COL2,T2.COL3 FROM T1,T2 WHERE T1.COL2 = t2.col2;
得到结果如下:
2.标准SQL写法:
SELECT T1.COL1,T1.COL2,T2.COL3 FROM T1 JOIN T2 ON (t1.col2= t2.col2);
结果如下:
3.标准SQL写法2:(这里需要注意的是SQL语句的红色部分,col2 字段前不能加表名)
SELECT T1.COL1,COL2,T2.COL3 FROM t1 join t2 using (col2);
结果如下:
可以看出,三种内连接的写法得到的结果是一样的。运行执行计划,得出的执行计划也是相同的 :
Plan hash value: 1838229974--------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 3 | 30 | 6 (0)| 00:00:01 | |* 1 | HASH JOIN | | 3 | 30 | 6 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL| T1 | 3 | 15 | 3 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL| T2 | 3 | 15 | 3 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------1 - access("T1"."COL2"="T2"."COL2")
关于join using 标准SQL中有一种特殊的join using ,写法如下:
SELECT t1.col1,col2,t2.col3 FROM t1 NATURAL JOIN t2;
它在当前表结构下,执行结果跟上面的SQL语句执行结果一样,执行计划也相同,但是在其他情况下就不一定相同了。因为它是取两个表中所有表名相同的列进行内连接,有可能有的列仅仅是命名相同,但是我们并不希望按照字段中内容进行过滤,那么这样写的话,就有可能得到一个错误的结果。所以开发中并不常用。
外连接
外连接是对内连接的扩展,执行时,除了将满足内连接条件的值查出来之外,还会包含驱动表中所有不满足连接条件的记录。外连接分为:左外连接、右外连接、全连接三种。下面分别介绍下:
左外连接
语法:
目标表1 left outer join 目标表2 on (连接条件) 或 目标表1 left outer join 目标表2 using(连接列集合)
SQL举例:
SELECT t1.col1,t1.col2,t2.col3 from t1 left outer join t2 on (t1.col2 = t2.col2); -- 或 SELECT t1.col1,col2,t2.col3 from t1 left outer join t2 using (col2); -- 或 SELECT T1.COL1,T1.COL2,T2.COL3 FROM T1,T2 WHERE T1.COL2 = t2.col2(+);
这里的第三种写法是Oracle特有的写法。这三种写法的执行结果一样:
执行计划也相同:
Plan hash value: 1823443478--------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 3 | 60 | 6 (0)| 00:00:01 | |* 1 | HASH JOIN OUTER | | 3 | 60 | 6 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL| T1 | 3 | 45 | 3 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL| T2 | 3 | 15 | 3 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------1 - access("T1"."COL2"="T2"."COL2"(+))
这里因为表1作为驱动表,而表2中不包含col2 为C 的数据,所以在第三行结果中,col3 的值为null。
右外链接
右外链接跟左外连接类似,语法为:
目标表1 right outer join 目标表2 on (连接条件) 或 目标表1 right outer join 目标表2 using(连接列集合)
SQL 举例:
SELECT t1.col1,t2.col2,t2.col3 from t1 right outer join t2 on (t2.col2 = t1.col2); -- 或 SELECT t1.col1,col2,t2.col3 from t1 right outer join t2 using (col2); -- 或 SELECT T1.COL1,T2.COL2,T2.COL3 FROM T1,T2 WHERE T1.COL2(+) = t2.col2;
SQL查询得到的结果和执行计划也是一致的:
执行计划:
Plan hash value: 1426054487--------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 3 | 60 | 6 (0)| 00:00:01 | |* 1 | HASH JOIN OUTER | | 3 | 60 | 6 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL| T2 | 3 | 15 | 3 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL| T1 | 3 | 45 | 3 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------1 - access("T1"."COL2"(+)="T2"."COL2")
全连接
语法为:
目标表1 full outer join 目标表2 on (连接条件) 或 目标表1 full outer join 目标表2 using(连接列集合)
SQL举例:
SELECT t1.col1,t1.col2,t2.col3 from t1 full outer join t2 on (t1.col2 = t2.col2); -- 或 SELECT t1.col1,col2,t2.col3 from t1 full outer join t2 using (col2);
执行结果为:
因为第一个语句限定了col2段的值为t1表,所以第三条结果的col2 字段为空。
执行计划相同:
Plan hash value: 53297166---------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | ---------------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 3 | 54 | 6 (0)| 00:00:01 | | 1 | VIEW | VW_FOJ_0 | 3 | 54 | 6 (0)| 00:00:01 | |* 2 | HASH JOIN FULL OUTER| | 3 | 60 | 6 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL | T1 | 3 | 45 | 3 (0)| 00:00:01 | | 4 | TABLE ACCESS FULL | T2 | 3 | 15 | 3 (0)| 00:00:01 | ---------------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------2 - access("T1"."COL2"="T2"."COL2")
全连接的效果为左连接+右链接,SQL如下:
SELECT t1.col1,t1.col2,t2.col3 from t1 right outer join t2 on (t1.col2 = t2.col2) union SELECT t1.col1,t1.col2,t2.col3 from t1 left outer join t2 on (t1.col2 = t2.col2);
执行结果如下;
可以看出得到的执行结果顺序不同,内容一致。但是,执行的时候,数据库的执行计划并不是这样的,下面是这条SQL的执行计划,通过对比跟全连接SQL的执行计划,可以看出,当前SQL是先查出左连接,再查出右连接,最后做了一个取并集的操作。而全连接是在取数据的时候,直接做的是取外连接的操作。
Plan hash value: 2747422401----------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | ----------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 6 | 120 | 14 (15)| 00:00:01 | | 1 | SORT UNIQUE | | 6 | 120 | 14 (15)| 00:00:01 | | 2 | UNION-ALL | | | | | | |* 3 | HASH JOIN OUTER | | 3 | 60 | 6 (0)| 00:00:01 | | 4 | TABLE ACCESS FULL| T2 | 3 | 15 | 3 (0)| 00:00:01 | | 5 | TABLE ACCESS FULL| T1 | 3 | 45 | 3 (0)| 00:00:01 | |* 6 | HASH JOIN OUTER | | 3 | 60 | 6 (0)| 00:00:01 | | 7 | TABLE ACCESS FULL| T1 | 3 | 45 | 3 (0)| 00:00:01 | | 8 | TABLE ACCESS FULL| T2 | 3 | 15 | 3 (0)| 00:00:01 | ----------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------3 - access("T1"."COL2"(+)="T2"."COL2")6 - access("T1"."COL2"="T2"."COL2"(+))
·特例:natural 在外连接中同样适用,和内连接的方法和弊端也相同。
反连接
见下文
半连接
见下文
方法
在Oracle优化器确定执行计划中表连接的类型之后,就会决定表连接的方法。表连接的方法有四种:1.排序合并连接、2.嵌套循环连接、3.哈希连接、4.笛卡尔积连接。下面我们分别介绍下这四种连接:
1.排序合并连接
排序合并连接,两个表做连接时,用排序和合并两种操作来得到结果集的连接方法。
sql举例(当前SQL只是为了演示排序合并连接而写的SQL,我还没有想好具体的使用场景,欢迎大家给出):
select t1.col1 ,t1.col2,t2.col2,t2.col3 from t2,t1 where t1.col2>t2.col2
执行结果:
执行计划:
Plan hash value: 412793182---------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | ---------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 3 | 30 | 8 (25)| 00:00:01 | | 1 | MERGE JOIN | | 3 | 30 | 8 (25)| 00:00:01 | | 2 | SORT JOIN | | 3 | 15 | 4 (25)| 00:00:01 | | 3 | TABLE ACCESS FULL| T2 | 3 | 15 | 3 (0)| 00:00:01 | |* 4 | SORT JOIN | | 3 | 15 | 4 (25)| 00:00:01 | | 5 | TABLE ACCESS FULL| T1 | 3 | 15 | 3 (0)| 00:00:01 | ---------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------4 - access(INTERNAL_FUNCTION("T1"."COL2")>INTERNAL_FUNCTION("T2"."COL2"))filter(INTERNAL_FUNCTION("T1"."COL2")>INTERNAL_FUNCTION("T2"."COL2"))
通过执行计划可以看出,排序合并连接执行过程为(先执行t1还是t2的排序跟具体情况相关,当前SQL的执行顺序取决于from 关键字后 t1和t2的位置):
①首先对t1表中的数据按照where条件中的连接列来进行排序(Id 为4 那行的 SORT 操作),排序得到结果集1;
②然后对t2 执行类似的操作(Id 为2 那行的 SORT 操作)。
③最后,对两个结果集进行合并操作(Id为 1 的行的 MERGE 操作),将满足条件的记录作为最终结果。
2.嵌套循环连接
循环嵌套连接,两个表做连接的时候,靠两层嵌套循环(内循环和外循环)来得到连接结果的表连接方法。
举例:
-- 首先,创建一个索引在t2表create index idx_t2 on t2(col2); -- 然后执行SQLselect /*+ ordered use_n1(t2)*/ t1.col1 ,t1.col2,t2.col3 from t1,t2 where t1.col2= t2.col2
得到执行结果:
Plan hash value: 1054738919--------------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 3 | 30 | 6 (0)| 00:00:01 | | 1 | NESTED LOOPS | | 3 | 30 | 6 (0)| 00:00:01 | | 2 | NESTED LOOPS | | 3 | 30 | 6 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL | T1 | 3 | 15 | 3 (0)| 00:00:01 | |* 4 | INDEX RANGE SCAN | IDX_T2 | 1 | | 0 (0)| 00:00:01 | | 5 | TABLE ACCESS BY INDEX ROWID| T2 | 1 | 5 | 1 (0)| 00:00:01 | --------------------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------4 - access("T1"."COL2"="T2"."COL2")
其执行过程类似于两个for循环的感觉 :
①首先,确定哪个表做外循环,哪个表做内循环。
②然后,访问外循环的表数据,得到结果集1;
③最后,遍历结果集1中的每一条记录,然后每条记录作为匹配条件去遍历一遍表2去查看是否有存在匹配的数据。得到返回的数据。
总结:
对于嵌套循环连接,外循环中有多少条记录,内循环就要做多少次遍历数据的操作。适用于外循环的结果集较少,同时内循环建立有索引,且索引选择率较高的场景。
嵌套循环可以快速响应,它可以第一时间返回满足条件的记录,而不用等整个循环执行完毕。
3.哈希连接
哈希链接可以简单理解为(t1,t2表为例):
①根据谓语条件判断两个表哪个表的结果集较小就作为驱动表。
②根据驱动表的列,计算出一个哈希值,进行缓存。
③计算被驱动表,每一行对应列的哈希值,判断是否在缓存中存在该哈希值,如果存在,进一步判断是否对应列内容一致。
⑤将对应的内容输出。
哈希链接实际情况要更加复杂,这里只是大概介绍下。
4.笛卡尔连接
两个表的积成,在两个表做连接时,没有任何连接条件时的表连接方法。
SQL举例:
select t1.col1 ,t1.col2,t2.col3 from t1,t2
执行结果:
执行计划:
Plan hash value: 787647388----------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | ----------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 9 | 72 | 9 (0)| 00:00:01 | | 1 | MERGE JOIN CARTESIAN| | 9 | 72 | 9 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL | T1 | 3 | 15 | 3 (0)| 00:00:01 | | 3 | BUFFER SORT | | 3 | 9 | 6 (0)| 00:00:01 | | 4 | TABLE ACCESS FULL | T2 | 3 | 9 | 2 (0)| 00:00:01 | ----------------------------------------------------------------------------- Note
执行步骤:
①访问表t1,得到结果集1
②访问表t2,得到结果集2
③对结果集1和结果集2做合并操作。因为没有表连接条件,所以每一条结果集2都可以合并结果集1中的每一条数据,所以得到的结果集总数为:t1表行数* t2表行数
注:笛卡尔积一般都是因为SQL语句中where条件漏写导致的。笛卡尔积中两表数据很大那么SQL效率会受到严重影响。
反连接
反连接,一种特殊连接类型。查询出表1中不等于表2中某些字段数据的值。
SQL举例:
-- not in select * from t1 where col2 not in (select col2 from t2);-- <> all select * from t1 where col2 <> all (select col2 from t2);-- not existsselect * from t1 where not exists (select 1 from t2 where col2= t1.col2);
执行计划分别为:
-- not inPlan hash value: 1275484728--------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 1 | 7 | 6 (0)| 00:00:01 | |* 1 | HASH JOIN ANTI NA | | 1 | 7 | 6 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL| T1 | 3 | 15 | 3 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL| T2 | 3 | 6 | 3 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------1 - access("COL2"="COL2")Note
-- <> all Plan hash value: 1275484728--------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 1 | 7 | 6 (0)| 00:00:01 | |* 1 | HASH JOIN ANTI NA | | 1 | 7 | 6 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL| T1 | 3 | 15 | 3 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL| T2 | 3 | 6 | 3 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------1 - access("COL2"="COL2")
-- not existsPlan hash value: 2706079091--------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 1 | 7 | 6 (0)| 00:00:01 | |* 1 | HASH JOIN ANTI | | 1 | 7 | 6 (0)| 00:00:01 | | 2 | TABLE ACCESS FULL| T1 | 3 | 15 | 3 (0)| 00:00:01 | | 3 | TABLE ACCESS FULL| T2 | 3 | 6 | 3 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------1 - access("COL2"="T1"."COL2")
对比执行计划,可以看出,not in 和 <> all 的写法,执行计划完全一样,虽然 not exists 的写法的执行计划id为1的行没有NA的字符。但是他们都有 HASH JOIN ANTI 的关键字。说明Oracle都将他们转化为了 如下的等价形式:
select t1.* from t1,t2 where t1.col2 anti= t2.col2;
这里的NA的区别为:当表字段中出现null值后,两者的返回结果就不一致了。
在t1表添加一行:
INSERT into t1 VALUES (4,null); commit;
执行结果:
not in 和 not exists
not exists
这是因为,前两个对null敏感,一旦遇到null,则当前行记录直接认为不符合。而not exists 对null不敏感,将null作为普通数据处理。
半连接
半连接的关键词为:in any exists ;
SQL举例:
-- in select * from t1 where col2 in (select col2 from t2);-- anyselect * from t1 where col2 = any (select col2 from t2);--existsselect * from t1 where exists (select 1 from t2 where col2= t1.col2);
执行结果都是
半连接逻辑:
①扫描t1,得到结果集1
②根据结果集1的每条记录扫描t2,只要在t2中找到符合条件的结果,那么立马停止扫描t2,将结果放入待返回的结果集
③ 返回结果集
注:当前博客Oracle 版本为11g,其他版本执行计划可能不一致。
转载于:https://www.cnblogs.com/liyasong/p/oracle_biaolianjie.html
Oracle 优化器_表连接相关推荐
- Oracle 优化器_访问数据的方法_单表
Oracle 在选择执行计划的时候,优化器要决定用什么方法去访问存储在数据文件中的数据.我们从数据文件中查询到相关记录,有两种方法可以实现:1.直接访问表记录所在位置.2.访问索引,拿到索引中对应的r ...
- Oracle 优化器
什么是优化器 优化器是Oracle中的一个核心模块,它的作用是为用户输入的SQL选择一个它计算出来的最高效的执行计划.SQL语句在Oracle中的执行过程如下图所示: 基于规则优化器RBO 基于规则的 ...
- Oracle优化器:星型转换
Oracle 8i中引入了星型转换(star transformation)的优化器新特性以便更有效地处理星型查询.星型查询语句多用于基于星型模型设计的数据仓库应用中.星型模型的称谓源于该种模型以图形 ...
- Oracle优化器:星型转换(Star Query Transformation )
Oracle优化器:星型转换(Star Query Transformation ) Star query是一个事实表(fact table)和一些维度表(dimension)的join.每个维度 ...
- 将oracle优化器改为CBO,【DB.Oracle】Oracle 优化器 (RBO, CBO)
Oracle优化器 Oracle数据库中的优化器又叫查询优化器(Query Optimizer).它是SQL分析和执行的优化工具,它负责生成.制定SQL的执行计划.Oracle的优化器有两种,基于规则 ...
- 【云和恩墨大讲堂】从执行计划洞察ORACLE优化器的“小聪明”
作者简介 黄浩 惠普 十年一剑,十年磨砺.3年通信行业,写就近3万条SQL:5年制造行业,遨游在ETL的浪潮:2年性能优化,厚积薄发自成一家 主题介绍: Oracle执行计划的另类解读:调皮的执行计 ...
- ORACLE优化器RBO与CBO介绍总结
RBO和CBO的基本概念 Oracle数据库中的优化器又叫查询优化器(Query Optimizer).它是SQL分析和执行的优化工具,它负责生成.制定SQL的执行计划.Oracle的优化器有两种,基 ...
- mysql和oracle优化器_Oracle 优化器
一.优化器基本知识 Oracle在执行一个SQL之前,首先要分析一下语句的执行计划,然后再按执行计划去执行.分析语句的执行计划的工作是由优化器(Optimizer)来完成的.不同的情况,一条SQL可能 ...
- oracle stalestats_深入理解oracle优化器统计数据(Optimizer Statistics)
理解oracle优化器统计数据 首先来介绍oracle数据库使用基于规则优化器(RBO)来决定如何执行一个sql语句.基于规则优化器顾名思义,它是遵循一组规则来判断一个sql语句的执行计划.这组规则是 ...
最新文章
- squid与varnish
- 活动报名 | 第三届中国法研杯司法人工智能挑战赛颁奖会日程出炉
- Volatile可见性
- [BZOJ1322]Destroying The Graph
- Eclipse开发C/C++之使用技巧小结,写给新手
- STM32学习之路-SysTick的应用(时间延迟)
- php 订单状态如何_如何编写程序实现图书管理系统当中的借书功能
- 在SQL Server中使用architectureid
- 【344天】我爱刷题系列103(2018.01.15)
- oracle数据库文件dbf复制#ocp试验#
- 使用jQuery来创建平滑的页面滚动
- lnmp一键安装包 mysql_lnmp一键安装包搭建lnmp环境
- CMake中cmake_minimum_required的使用
- java: java mina ——基于TCP/IP、UDP/IP协议栈的通信框架
- 【深信服】Python 开发工程师(云计算、网络安全) 【已offer】
- jsp简易的图书管理系统
- 机器学习中precision和accuracy区别
- C语言实现PTA题目--跳一跳
- 微软发布InstaLoad电池技术 不考虑极性
- 学术论文--论文查看的网站/快速查看中英文文献/不怕难
热门文章
- 从博客园博问站点迁移ASP.NET Core展望.NET Core
- 户外生活--西湖林至千军台
- 【原】使用Json作为Python和C#混合编程时对象转换的中间文件
- 【转】ASP.NET中页面传值
- centos 定时删除文件_CentOS自动删除n天前日志命令
- Vivado下几条 Verilog 综合规则
- boot spring 打印请求参数_SpringBoot打印请求参数与响应参数
- 计算机count的功能是,全国计算机二级Access每日练习4
- 9个点的所有解锁图_黔隆科技刷机教程酷派C1068忘记密码刷机解锁降级救砖解屏幕锁账户锁教程...
- python-pptx