oracle中直方图的使用
本文从不绑定变量和绑定变量两种情况讨论直方图的作用
一、不绑定变量
SQL> create table test(name varchar2(10));
表已创建。
SQL> insert into test select 'A' from table1;
已创建25064行。
SQL> insert into test values('B');
已创建 1 行。
SQL> insert into test values('C');
已创建 1 行。
SQL> select name,count(1) from test group by name;
NAME COUNT(1)
---------- ----------
A 25064
B 1
C 1
SQL> create index i_test on test(name);
索引已创建。
SQL> analyze table test compute statistics;
表已分析。
SQL> select * from test where name='A';
已选择25064行。
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 8355 | 8355 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 8355 | 8355 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"='A')
统计信息
----------------------------------------------------------
32 recursive calls
0 db block gets
1720 consistent gets
0 physical reads
0 redo size
337843 bytes sent via SQL*Net to client
18770 bytes received via SQL*Net from client
1672 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
25064 rows processed
SQL> select * from test where name='B';
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 8355 | 8355 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 8355 | 8355 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"='B')
统计信息
----------------------------------------------------------
1 recursive calls
0 db block gets
47 consistent gets
0 physical reads
0 redo size
407 bytes sent via SQL*Net to client
400 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed
只需返回一条数据,但做了全表扫描。
因为,oracle只知道name列有3个不同的值,但不知道每个不同的值分别有多少记录,oracle默认这些数据是完全均匀的,
所以,当用name做条件时,oracle认为会返回总记录的三分之一(从Rows=8355可以看出)
对test表生成直方图后再做同样的查询
SQL> analyze table test compute statistics for table for all indexes for all indexed columns;
表已分析。
SQL> select * from test where name='A';
已选择25064行。
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 25064 | 25064 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 25064 | 25064 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"='A')
统计信息
----------------------------------------------------------
1 recursive calls
0 db block gets
1717 consistent gets
0 physical reads
0 redo size
337843 bytes sent via SQL*Net to client
18770 bytes received via SQL*Net from client
1672 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
25064 rows processed
SQL> select * from test where name='B';
执行计划
----------------------------------------------------------
Plan hash value: 3559141341
---------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 1 | 1 (0)| 00:00:01 |
|* 1 | INDEX RANGE SCAN| I_TEST | 1 | 1 | 1 (0)| 00:00:01 |
---------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - access("NAME"='B')
统计信息
----------------------------------------------------------
1 recursive calls
0 db block gets
3 consistent gets
0 physical reads
0 redo size
407 bytes sent via SQL*Net to client
400 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed
可见,生成了直方图后,oracle会根据数据的实际分布情况选择合适的执行计划。
###############################################################
二、绑定变量的情况下
SQL> analyze table test compute statistics;
表已分析。
SQL> var o varchar2(10)
SQL> exec :o:='A'
PL/SQL 过程已成功完成。
SQL> select * from test where name=:o;
已选择25064行。
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 8355 | 8355 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 8355 | 8355 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"=:O)
统计信息
----------------------------------------------------------
1 recursive calls
0 db block gets
1717 consistent gets
0 physical reads
0 redo size
337843 bytes sent via SQL*Net to client
18770 bytes received via SQL*Net from client
1672 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
25064 rows processed
SQL> exec :o:='B'
PL/SQL 过程已成功完成。
SQL> select * from test where name=:o;
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 8355 | 8355 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 8355 | 8355 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"=:O)
统计信息
----------------------------------------------------------
0 recursive calls
0 db block gets
47 consistent gets
0 physical reads
0 redo size
407 bytes sent via SQL*Net to client
400 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed
从以上测试可以看出,在绑定变量的情况下,如果没有分析直方图,两个查询都使用了相同的执行计划——全表扫描。
在第一次解析SQL的时候,因为oracle不知道数据的具体分布,所以它认为会返回三分之一的数据,所以选择了全表扫描。
在以后执行同样的SQL时会重用该SQL,都会使用第一次解析生成的执行计划。
在本例中,无论:o是'A'还是'B',都会使用全表扫描,那么,我们是否可以得出这样一个结论:
如果分析了直方图,那么如果第一次硬解析SQL时:o是'A'时,会使用全表扫描;:o是'B'时,会使用索引扫描呢?看如下的测试:
SQL> alter system flush shared_pool;
系统已更改。
SQL> analyze table test delete statistics;
表已分析。
SQL> analyze table test compute statistics for table for all indexes for all indexed columns;
表已分析。
SQL> exec :o:='A'
PL/SQL 过程已成功完成。
SQL> select * from test where name=:o;
已选择25064行。
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 8355 | 8355 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 8355 | 8355 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"=:O)
统计信息
----------------------------------------------------------
32 recursive calls
0 db block gets
1720 consistent gets
0 physical reads
0 redo size
337843 bytes sent via SQL*Net to client
18770 bytes received via SQL*Net from client
1672 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
25064 rows processed
SQL> alter system flush shared_pool;
系统已更改。
SQL> analyze table test delete statistics;
表已分析。
SQL> analyze table test compute statistics for table for all indexes for all indexed columns;
表已分析。
SQL> exec :o:='B'
PL/SQL 过程已成功完成。
SQL> select * from test where name=:o;
执行计划
----------------------------------------------------------
Plan hash value: 1357081020
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 8355 | 8355 | 14 (8)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 8355 | 8355 | 14 (8)| 00:00:01 |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("NAME"=:O)
统计信息
----------------------------------------------------------
32 recursive calls
0 db block gets
6 consistent gets
0 physical reads
0 redo size
407 bytes sent via SQL*Net to client
400 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed
从这个结果可以看出,分析了直方图后,无论:o的值是'A'还是'B',第一次执行该sql时,使用的都是全表扫描,这与刚才的推论不一致了。
如果真是这样的话,使用绑定变量对表做直方图还有什么意义呢?其实这应该算是oracl的一个bug,在这里autotrace的结果是不对的,我们可以用10046看
启用 Oracle 10046 调试事件
SQL> alter system flush shared_pool;
SQL> analyze table test delete statistics;
SQL> analyze table test compute statistics for table for all indexes for all indexed columns;
SQL> exec :o:='A'
SQL> ALTER SESSION SET EVENTS '10046 trace name context forever, level 12';
SQL> select * from test where name=:o;
SQL> ALTER SESSION SET EVENTS '10046 trace name context off';
将C:\oracle\product\10.2.0\admin\orcl\udump下的最新trc文件copy至桌面
C:\Users\LEE\Desktop> tkprof orcl_ora_4516.trc orcla.sql
查看orcla.sql
select *
from
test where name=:o
call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 2 0.04 0.11 0 3 0 0
Execute 2 0.00 0.02 0 0 0 0
Fetch 1674 0.14 0.14 0 1720 0 25065
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 1678 0.18 0.28 0 1723 0 25065
Misses in library cache during parse: 2
Optimizer mode: ALL_ROWS
Parsing user id: 58
Rows Row Source Operation
------- ---------------------------------------------------
25064 TABLE ACCESS FULL TEST (cr=1717 pr=0 pw=0 time=100367 us)
——————————————————
SQL> alter system flush shared_pool;
SQL> analyze table test delete statistics;
SQL> analyze table test compute statistics for table for all indexes for all indexed columns;
SQL> exec :o:='B'
SQL> ALTER SESSION SET EVENTS '10046 trace name context forever, level 12';
SQL> select * from test where name=:o;
SQL> ALTER SESSION SET EVENTS '10046 trace name context off';
将C:\oracle\product\10.2.0\admin\orcl\udump下的最新trc文件copy至桌面
C:\Users\LEE\Desktop> tkprof orcl_ora_4516.trc orclb.sql
查看orclb.sql
select *
from
test where name=:o
call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.04 0 0 0 0
Execute 1 0.00 0.01 0 0 0 0
Fetch 2 0.00 0.00 0 3 0 1
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 4 0.00 0.05 0 3 0 1
Misses in library cache during parse: 1
Optimizer mode: ALL_ROWS
Parsing user id: 58
Rows Row Source Operation
------- ---------------------------------------------------
1 INDEX RANGE SCAN I_TEST (cr=3 pr=0 pw=0 time=51 us)(object id 57877)
到此为止可以可以得出如下结论:
1、无论是否绑定变量,对数据分布不均的情况下柱状图都是很有效的。假如数据是均衡的,没有必要使用直方图。
2、对数据分布不均匀的情况下,使用绑定变量可能会造成恶果,就算对表做了柱状图也一样
3、使用绑定变量,sql第一次执行决定了以后同样的sql执行的执行计划
4、AUTOTRACE的信息不一定准确,必要时要用10046查看需要的信息
本文转自:http://blog.csdn.net/narutobing/article/details/7881082
转载于:https://www.cnblogs.com/nizuimeiabc1/p/4812822.html
oracle中直方图的使用相关推荐
- ORACLE的直方图的一些试验
一.何谓直方图: 直方图是一种统计学上的工具,并非Oracle专有.通常用于对被管理对象的某个方面的质量情况进行管理,通常情况下它会表现为一种几何图形表,这个图形表是根据从实际环境中所收集来的被管理对 ...
- Oracle列直方图的问题隐患
点击上方"蓝字" 关注我们,享更多干货! 第一章 Oracle列直方图介绍 众所周知 ,列的直方图主要用于针对数据倾斜的情况,能帮助数据库更准确的了解数据的分布情况,从而选择更高效 ...
- oracle数据库直方图,[转] oracle统计信息(statistics)和直方图(histogram)
oracle统计信息和直方图的理解 以前一直对统计信息的理解就是对行的数据分布的,提供改CBO来选择高效的执行计划.这段时间看了不少资料,对统计有了一个更清晰的认识 统计信息: 1,表中的统计信息 2 ...
- 在Oracle中,如何得到真实的执行计划?
在Oracle中,如何得到真实的执行计划? Oracle查看执行计划的几种方法:http://blog.itpub.net/26736162/viewspace-2136865/ 一. 如何得到真实 ...
- Oracle中索引的创建和使用
OLTP系统索引创建 创建索引的作用 1.通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性. 2.可以大大加快数据的检索速度,这也是创建索引的最主要的原因. 3.可以加速表和表之间的连接 ...
- 【DB笔试面试639】在Oracle中,什么是多列统计信息(Extended Statistics)?
♣ 题目部分 在Oracle中,什么是多列统计信息(Extended Statistics)? ♣ 答案部分 Oracle优化器对于基数值的估算是否准确关系到能否生成最优的执行计划,而基数值估算的准确 ...
- Oracle中常用表和视图
一.Oracle表明细及说明 1.dba_开头表 dba_users 数据库用户信息 dba_segments 表段信息 dba_extents ...
- Oracle中的优化器--CBO和RBO
Oracle中的优化器--CBO和RBO Oracle数据库中的优化器又叫查询优化器(Query Optimizer).它是SQL分析和执行的优化工具,它负责生成.制定SQL的执行计划.Oracle的 ...
- oracle 存储过程 状态,查看ORACLE中正在运行的存储过程 | 学步园
1.如何查看ORACLE中正在运行的存储过程 select owner,name from v$db_object_cache where type like '%PROCE%' and locks ...
最新文章
- 应用层级时空记忆模型(HTM)实现对时序数据的异常检测
- linux下短链接出现TIME_WAIT耗尽端口号的解决方法
- SpringMVC返回Map类型转换成JSON失败
- C# WinForm获取 当前执行程序路径的几种方法
- 使用Maven Jenkins和JMeter自动化测试
- 【转】SVM入门(一)SVM的八股简介
- c++友元模板单例模式
- ue4打包问题的巧妙解决——二分回退大法!
- Response.Redirect在新窗口打开
- HTML仿小米官网登陆
- 关于STM32使用RTC唤醒停止模式的设置
- matlab做误差棒图,科学网—Matlab误差棒、图例、颜色配比,很有用的代码 - 周锋的博文...
- js getday()获取值不对
- Dota 2 with Large Scale Deep Reinforcement Learning翻译
- 线程池 ExecutorService 的使用例子
- 安卓开发自己写的刻度尺测量,精确到mm.
- vue H5页面制作微信公众号前期准备
- python设置坐标轴刻度宽度_使用轴网格matplotlib时设置刻度宽度
- 西门子标准报文1常用_西门子S7-1200 V90 扭矩控制,750附加报文
- L2-021 点赞狂魔 c++结构体排序