[20170612]FOR ALL COLUMNS SIZE repeat(12c).txt

--//昨天看了https://jonathanlewis.wordpress.com/2017/06/01/histogram-upgrade-2/,提到了直方图的问题,
--//特别是FOR ALL COLUMNS SIZE repeat引起的问题,在一些特殊情况要注意.

1.环境:
SCOTT@test01p> @ ver1
PORT_STRING                    VERSION        BANNER                                                                       CON_ID
------------------------------ -------------- ---------------------------------------------------------------------------- ------
IBMPC/WIN_NT64-9.1.0           12.1.0.1.0     Oracle Database 12c Enterprise Edition Release 12.1.0.1.0 - 64bit Production      0

create table t (id number,pad varchar2(20),flag varchar2(1));
insert into t select rownum,lpad('a',20,'a') ,'a' from dual connect by level<=2e4;
insert into t select rownum+2e4,lpad('d',20,'d') ,'d' from dual connect by level<=2;
commit ;

SCOTT@test01p> exec dbms_stats.Gather_table_stats(ownname => user, tabname => 'T',method_opt => 'FOR ALL COLUMNS ');
PL/SQL procedure successfully completed.

SCOTT@test01p> SELECT flag, COUNT(*) FROM t GROUP BY flag;
F   COUNT(*)
- ----------
d          2
a      20000

select * from DBA_TAB_COL_STATISTICS where owner=user and table_name='T' and column_name='FLAG';

Record View
As of: 2017/6/12 20:38:56

OWNER:          SCOTT
TABLE_NAME:     T
COLUMN_NAME:    FLAG
NUM_DISTINCT:   2
LOW_VALUE:      61
HIGH_VALUE:     64
DENSITY:        0.000024997500249975
NUM_NULLS:      0
NUM_BUCKETS:    2
LAST_ANALYZED:  2017/6/12 20:37:55
SAMPLE_SIZE:    20002
GLOBAL_STATS:   YES
USER_STATS:     NO
NOTES:          
AVG_COL_LEN:    2
HISTOGRAM:      FREQUENCY
SCOPE:          SHARED

--//建立了直方图.bucket=2.

SCOTT@test01p> set numw 36
SCOTT@test01p> select * from USER_TAB_HISTOGRAMS where column_name='FLAG';
TABLE_NAME COLUMN_NAME ENDPOINT_NUMBER                       ENDPOINT_VALUE ENDPOINT_A ENDPOINT_ACTUAL_VALU ENDPOINT_REPEAT_COUNT SCOPE
---------- ----------- --------------- ------------------------------------ ---------- -------------------- --------------------- -------
T          FLAG                  20000 503652795277878000000000000000000000                                                     0 SHARED
T          FLAG                  20002 519229685853483000000000000000000000                                                     0 SHARED
--//如果应用模式发生变化,加入了2种值.

insert into t select rownum+2e4+2,lpad('b',20,'b') ,'b' from dual connect by level<=2e4;
insert into t select rownum+4e4+2,lpad('c',20,'c') ,'c' from dual connect by level<=2;
commit ;

SCOTT@test01p> exec dbms_stats.Gather_table_stats(ownname => user, tabname => 'T',method_opt => 'FOR ALL COLUMNS size repeat',No_Invalidate => false);
PL/SQL procedure successfully completed.
--//加入No_Invalidate => false,主要使执行计划能马上使用新的统计信息.

select * from DBA_TAB_COL_STATISTICS where owner=user and table_name='T' and column_name='FLAG';

Record View
As of: 2017/6/12 20:42:29

OWNER:          SCOTT
TABLE_NAME:     T
COLUMN_NAME:    FLAG
NUM_DISTINCT:   4
LOW_VALUE:      61
HIGH_VALUE:     64
DENSITY:        0.25
NUM_NULLS:      0
NUM_BUCKETS:    2
LAST_ANALYZED:  2017/6/12 20:42:01
SAMPLE_SIZE:    5463
GLOBAL_STATS:   YES
USER_STATS:     NO
NOTES:          
AVG_COL_LEN:    2
HISTOGRAM:      HYBRID
SCOPE:          SHARED

--//因为bucket桶没有变化,直方图变成了HYBRID.

SCOTT@test01p> select * from USER_TAB_HISTOGRAMS where table_name='T' and column_name='FLAG';
TABLE_NAME COLUMN_NAME ENDPOINT_NUMBER                       ENDPOINT_VALUE ENDPOINT_A ENDPOINT_ACTUAL_VALU ENDPOINT_REPEAT_COUNT SCOPE
---------- ----------- --------------- ------------------------------------ ---------- -------------------- --------------------- -------
T          FLAG                   2760 503652795277878000000000000000000000                                                  2760 SHARED
T          FLAG                   5463 519229685853483000000000000000000000                                                     1 SHARED

SCOTT@test01p> alter session set statistics_level=all;
Session altered.

SCOTT@test01p> SELECT flag, COUNT(*) FROM t GROUP BY flag order by 1;
F  COUNT(*)
- ---------
a     20000
b     20000
c         2
d         2

SCOTT@test01p> select * from t where flag='c';
   ID PAD                  F
----- -------------------- -
40003 cccccccccccccccccccc c
40004 cccccccccccccccccccc c

SCOTT@test01p> @ dpc '' ''
PLAN_TABLE_OUTPUT
--------------------------------------
SQL_ID  g3pmd0h5vnw5r, child number 0
-------------------------------------
select * from t where flag='c'
Plan hash value: 1601196873
--------------------------------------------------------------------------------------------------------------------
| Id  | Operation         | Name | Starts | E-Rows |E-Bytes| Cost (%CPU)| E-Time   | A-Rows |   A-Time   | Buffers |
--------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      |      1 |        |       |    68 (100)|          |      2 |00:00:00.01 |     205 |
|*  1 |  TABLE ACCESS FULL| T    |      1 |   6598 |   180K|    68   (0)| 00:00:01 |      2 |00:00:00.01 |     205 |
--------------------------------------------------------------------------------------------------------------------
Query Block Name / Object Alias (identified by operation id):
-------------------------------------------------------------
   1 - SEL$1 / T@SEL$1
Predicate Information (identified by operation id):
---------------------------------------------------
   1 - filter("FLAG"='c')
23 rows selected.

--//可以发现E-rows 与 A-rows 存在很大的差距,正是业务模式发生了变化,导致method_opt => 'FOR ALL COLUMNS size repeat'存在问题.
--//而这个问题在11G是不存在的,在使用method_opt => 'FOR ALL COLUMNS size repeat',会增加bucket的数量.
--//如果应用不存在这样的问题,估计关系不大.

--//简单的使用如下命令可以确定,"可能"有问题的直方图.
SELECT *
  FROM DBA_TAB_COL_STATISTICS
 WHERE     owner = USER
       AND table_name = 'T'
       AND num_distinct < 255
       AND histogram NOT LIKE '%FREQUENCY%';

Record View
As of: 2017/6/12 20:46:36

OWNER:          SCOTT
TABLE_NAME:     T
COLUMN_NAME:    FLAG
NUM_DISTINCT:   4
LOW_VALUE:      61
HIGH_VALUE:     64
DENSITY:        0.25
NUM_NULLS:      0
NUM_BUCKETS:    2
LAST_ANALYZED:  2017/6/12 20:42:01
SAMPLE_SIZE:    5463
GLOBAL_STATS:   YES
USER_STATS:     NO
NOTES:          
AVG_COL_LEN:    2
HISTOGRAM:      HYBRID
SCOPE:          SHARED

--//如果不指定repeat.
SCOTT@test01p> exec dbms_stats.Gather_table_stats(ownname => user, tabname => 'T',method_opt => 'FOR ALL COLUMNS ',No_Invalidate => false);
PL/SQL procedure successfully completed.

SCOTT@test01p> select * from USER_TAB_HISTOGRAMS where table_name='T' and column_name='FLAG';
TABLE_NAME COLUMN_NAME          ENDPOINT_NUMBER                       ENDPOINT_VALUE ENDPOINT_A ENDPOINT_ACTUAL_VALU ENDPOINT_REPEAT_COUNT SCOPE
---------- -------------------- --------------- ------------------------------------ ---------- -------------------- --------------------- -------
T          FLAG                           20000 503652795277878000000000000000000000                                                     0 SHARED
T          FLAG                           40000 508845092136413000000000000000000000                                                     0 SHARED
T          FLAG                           40002 514037388994948000000000000000000000                                                     0 SHARED
T          FLAG                           40004 519229685853483000000000000000000000                                                     0 SHARED
--//分析使用No_Invalidate => false,这样重新执行会重新分析.

select * from DBA_TAB_COL_STATISTICS where owner=user and table_name='T' and column_name='FLAG';

Record View
As of: 2017/6/12 20:49:27

OWNER:          SCOTT
TABLE_NAME:     T
COLUMN_NAME:    FLAG
NUM_DISTINCT:   4
LOW_VALUE:      61
HIGH_VALUE:     64
DENSITY:        0.0000124987501249875
NUM_NULLS:      0
NUM_BUCKETS:    4
LAST_ANALYZED:  2017/6/12 20:47:21
SAMPLE_SIZE:    40004
GLOBAL_STATS:   YES
USER_STATS:     NO
NOTES:          
AVG_COL_LEN:    2
HISTOGRAM:      FREQUENCY
SCOPE:          SHARED
--//这样建立的直方图=FREQUENCY.

SCOTT@test01p> select * from t where flag='c';
   ID PAD                  F
----- -------------------- -
40003 cccccccccccccccccccc c
40004 cccccccccccccccccccc c

SCOTT@test01p> @ dpc '' ''
PLAN_TABLE_OUTPUT
-------------------------------------
SQL_ID  g3pmd0h5vnw5r, child number 0
-------------------------------------
select * from t where flag='c'
Plan hash value: 1601196873
--------------------------------------------------------------------------------------------------------------------
| Id  | Operation         | Name | Starts | E-Rows |E-Bytes| Cost (%CPU)| E-Time   | A-Rows |   A-Time   | Buffers |
--------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      |      1 |        |       |    68 (100)|          |      2 |00:00:00.01 |     205 |
|*  1 |  TABLE ACCESS FULL| T    |      1 |      2 |    56 |    68   (0)| 00:00:01 |      2 |00:00:00.01 |     205 |
--------------------------------------------------------------------------------------------------------------------
Query Block Name / Object Alias (identified by operation id):
-------------------------------------------------------------
   1 - SEL$1 / T@SEL$1

Predicate Information (identified by operation id):
---------------------------------------------------
   1 - filter("FLAG"='c')

--//这样就ok了.
--//对于这样的情况最佳的方式手工设置分析方式

BEGIN
dbms_stats.Set_table_prefs(user, 'T', 'METHOD_OPT'=>'FOR ALL COLUMNS SIZE 1, FOR COLUMNS SIZE AUTO flag');
END;
/

--//避免这个问题. 总之12c要注意分析方法METHOD_OPT'=>'FOR ALL COLUMNS SIZE repeat'带来的问题.
--//特别是一些应用模式发生变化的情况.而11g前面的测试不存在这个问题.

[20170612]FOR ALL COLUMNS SIZE repeat12c相关推荐

  1. [20170612]FOR ALL COLUMNS SIZE repeat(11g).txt

    [20170612]FOR ALL COLUMNS SIZE repeat(11g).txt --//昨天看了https://jonathanlewis.wordpress.com/2017/06/0 ...

  2. cannot set a row with mismatched columns

    错误:cannot set a row with mismatched columns 错误背景 原错误情况 错误原因 解决方法 错误背景 在希望将dataframe a 中的特定行移至datafra ...

  3. 记录一次没有收集直方图优化器选择全表扫描导致CPU耗尽

    场景:数据库升级第二天,操作系统CPU使用率接近100%. 查看ash报告: 再看TOP SQL 具体SQL: select count(1) as chipinCount, sum(bets) as ...

  4. [20180317]12c TABLE ACCESS BY INDEX ROWID BATCHED2.txt

    [20180317]12c TABLE ACCESS BY INDEX ROWID BATCHED2.txt --//简单探究12c TABLE ACCESS BY INDEX ROWID BATCH ...

  5. Utilize Sql Tuning Advisor from Script

    Sql Tuning Advisor是10g以后出现的一个十分有用的调优工具,大多数情况下我们可以通过dbconsole或者Grid Control的web界面调用SQL Advisor:但如果系统中 ...

  6. 「数据分析」之零基础入门数据挖掘

    Datawhale 作者:王瑞楠,Datawhale优秀学习者 摘要:对于数据挖掘项目,本文将学习应该从哪些角度分析数据?如何对数据进行整体把握,如何处理异常值与缺失值,从哪些维度进行特征及预测值分析 ...

  7. 银行选型和排坑实战:用开源软件自建分布式数据服务平台

    来自:DBAplus社群 之前设计篇讲了数据拆分的方式.场景.优缺点以及实施步骤,偏方法与理论.技术篇会介绍分布式数据服务平台设计与实现,讲述如何通过技术手段解决数据拆分带来的各种问题,以及各中间件的 ...

  8. matlab动力学方程,机器人动力学方程(二):拉格朗日法

    1.拉格朗日法 拉格朗日法是一种基于能量的动力学方法,从拉格朗日函数L(系统动能和势能的差值)出发来建立机器人动力学方程: Lagrange 方程 应用于机器人动力学模型推导(详细过程可参考霍伟编写的 ...

  9. 4、python简单线性回归代码案例(完整)_4、python简单线性回归代码案例(完整)...

    第一.回归分析的步骤 01 根据预测目标,确定自变量和因变量 02 绘制散点图,确定回归模型类型 03 估计模型参数,建立回归模型 04 对回归模型进行检验 回归方程的精度就是用来表示实际观测点和回归 ...

  10. datax底层原理_手把手实现Datax3.0中的传输通道

    Datax的整体框架我们已经大体了解.这次来分析一下reader到writer中间数据的传输层. 这次采取另外一种方式,我们把代码抽取,自己实现一个通道 1-首先是定义一个接口代表传输的每一条数据pu ...

最新文章

  1. 通过命令行在Python中测试以太坊RPC客户端
  2. 自旋表达的到底是什么?
  3. jQuery event的复制粘贴的坑
  4. ThinkPhp5 | 模块分析
  5. 系统需求分析文档需要考虑的问题
  6. vue经验 - 细节小知识点汇总(更新中...)
  7. SEO网站标题怎么优化
  8. 高品质餐饮相关场景模型素材,开始独特的场景来展示设计。
  9. 趣图 | 著名的悖论蒙提霍尔问题到底是什么?
  10. MySQL更改安装路径和Data位置
  11. [python] 将一个序列的排序方式扩展到其他序列
  12. 计算机视觉实战(八)直方图与傅里叶变换
  13. unity package 包下载不下来
  14. JSP学习——EL表达式和JSTL学习小结
  15. 【Idea+Vim】Idea安装Vim插件/IdeaVim剪切板
  16. 你了解过区块链的最新模式都有哪些呢?
  17. imput placeholder 移动端不居中问题
  18. linux安装pytorch
  19. 读 Timothy Gowers 之 Mathematics: A Very Short Introduction
  20. HTTP 错误 404.17 - Not Found 请求的内容似乎是脚本,因而将无法由静态文件处理程序来处理。

热门文章

  1. 微信小程序微商城(十):用户收货地址管理
  2. matlab mysql数据库增删改查_ef6.0增删改查操作
  3. 用枚举法实现工厂模型
  4. php权限无需验证的控制器,Thinkphp6用中间件实现多个控制器判断用户登录权限
  5. Layui动态修改列名
  6. 分布式压缩感知 matlab程序,BCS_CODE 贝叶斯压缩感知以及分布式 的算法实现,很好的范例 matlab 238万源代码下载- www.pudn.com...
  7. maven pom.xml中设置java编译参数
  8. IDEA报错:java: Compilation failed: internal java compiler error
  9. OpenJDK8和OpenJDK8u的差异
  10. eclipse中汉字对齐错误