实战演练丨SCN太大引发ORA-600[2252]
作者 | 张维照,云和恩墨技术专家,Oracle ACEA,2006年起从事数据库管理工作,2009年转Oracle,从事过多套TB级省级工商、医疗、交通、人社、电信运营等数据库维护优化工作,擅长Oracle数据库性能问题的分析与解决、故障分析、升级迁移。个人博客:www.anbob.com
案例背景
前段时间有个朋友遇到的问题,让我协助分析,现象是一个地市的数据库与省级数据库通过DBLINK连接时提示ORA-600 2252,但是其它地市与省级的DBLINK正常。
案例详情
具体分析,错误如下:
SQL> select sysdate from dual@ANBOB_RMT
ORA-00600: 内部错误代码, 参数: [2252], [3985], [1364216517], [], [], [], [], []
ORA-600 [2252] [A] [B] [] [] []
原因:Oracle将给定的SCN值与基于系统日期,如果Oracle检测到提供的SCN太大,则会引发ORA-600[2252]。
ARGS:
参数A:SCN WRAP
参数B:SCN BASE
修复:
症状:两台机器的系统日期不同
症状:在两台机器之间使用数据库链接的查询失败
原因:
ORA-00600的参数[2252]表示Oracle为事务计算的系统更改号(SCN)是一个不合理的数字。SCN部分基于主机系统日期进行计算。如果系统日期相差很远,则为SCN计算的最大可能值可能不可能大,这将导致ORA-600[2252]。
总结:数据库当前的请求SCN大于当前最大允许SCN时会提示ORA-600[2252],最大允许SCN是有本地系统时间决定。一个可能性是本地库主机时间向前调了,还有个可能性是通过DBLINK分布式事务同步SCN时,远程库SCN大于本地允许的最大SCN。
SQL@ANBOB> select 3985*power(2,32)+1364216517 from dual;
3985*POWER(2,32)+1364216517
---------------------------
17116808891077
SQL@ANBOB> select dbms_flashback.get_system_change_number scn from dual;
SCN
----------
15756464714
sys@ANBOB>select current_scn,dbms_flashback.get_system_change_number scn from v$database;
CURRENT_SCN SCN
-------------------- --------------------
15756464716 15756464716
-- 确认时间,时区
select CURRENT_TIMESTAMP, LOCALTIMESTAMP FROM DUAL;
-- 现场的人整理了本地(DBa)、远程(DBb)库的系统时间和SCN.
DBa DBb
-------- ----------
OS date: 20171204 15:50 20171204 15:48
sysdate: 20171204 .. 20171204 ..
scn: 15756464722 17117005290806
DB ver: 11.2.0.1 11.2.0.3
OS Plat: Windows Aix
注意:
本地库和远程库的SCN不在一个数量级,相差1000倍,其实我们可以根据当前的时间计算一下SCN 的最大允许值,远程库的SCN 远大于本地库的最大允许SCN(简称RSL,下面会补充相关知识)。关于SCN可以查阅MOS note <<System Change Number(SCN), Headroom, Security and Patch Information(文档 ID 1376995.1)>>
— 查询远程库的SCN Headroom
SQL> select
2 version,
3 to_char(SYSDATE, 'YYYY/MM/DD HH24:MI:SS') DATE_TIME,
4 ((((
5 ((to_number(to_char(sysdate, 'YYYY')) - 1988) * 12 * 31 * 24 * 60 * 60) +
6 ((to_number(to_char(sysdate, 'MM')) - 1) * 31 * 24 * 60 * 60) +
7 (((to_number(to_char(sysdate, 'DD')) - 1)) * 24 * 60 * 60) +
8 (to_number(to_char(sysdate, 'HH24')) * 60 * 60) +
9 (to_number(to_char(sysdate, 'MI')) * 60) +
10 (to_number(to_char(sysdate, 'SS')))
11 ) * (16 * 1024)) - dbms_flashback.get_system_change_number)
12 / (16 * 1024 * 60 * 60 * 24)
13 ) indicator
14 from v$instance
15 ;
VERSION DATE_TIME INDICATOR
----------------- ------------------- ----------
11.2.0.3.0 2017/12/04 17:15:26 -959.18726
注意:
Oops!!! 上面的脚本也较常见来自官方的scnhealthcheck.sql, INDICATOR是距离SCN Headroom(天花板)的天数,是负数说明已经超过天花板上天了。当然SCN限制是决定不会也不允许超过天花板的。 那会不会是远程库有问题?为什么其它地市的库可以跟这个远程库查询?负数的原因是什么?
基实上面的脚本对于11.2.0.2以后的数据库还需要确认另一处,就是每秒16K的限制从11G R2(11.2.0.2)起已经改变为32K(我查了11.2.0.3 11.2.0.4 12.2.0.1默认都是32K), 有隐藏参数”_max_reasonable_scn_rate”控制,同时需要使用下面的SQL语句实际确认是16K还是32K(只对11.2.0.2以后的版本有意义),因为我发现有些11.2的数据库仍然使用的是16K(也许是低版本直接升级原因,也许是某个PSU临时回归了16K的增速):
sys@ANBOB_RMT>@pd _max_reasonable_scn_rate
Show all parameters and session values from x$ksppi/x$ksppcv...
INDX I_HEX NAME VALUE DESCRIPTION
-------------------- ----- ---------------------------- ---------- ---------------------------
978 3D2 _max_reasonable_scn_rate 32768 Max reasonable SCN rate
sys@ANBOB_RMT>select decode(bitand(DI2FLAG,65536),65536,'Y','N') using16 from x$kccdi2;
U
-
N
sys@ANBOB_RMT>select
version,
to_char(SYSDATE, 'YYYY/MM/DD HH24:MI:SS') DATE_TIME,
((((
((to_number(to_char(sysdate, 'YYYY')) - 1988) * 12 * 31 * 24 * 60 * 60) +
((to_number(to_char(sysdate, 'MM')) - 1) * 31 * 24 * 60 * 60) +
(((to_number(to_char(sysdate, 'DD')) - 1)) * 24 * 60 * 60) +
(to_number(to_char(sysdate, 'HH24')) * 60 * 60) +
(to_number(to_char(sysdate, 'MI')) * 60) +
(to_number(to_char(sysdate, 'SS')))
) * (32 * 1024)) - dbms_flashback.get_system_change_number)
/ (32 * 1024 * 60 * 60 * 24)
) indicator
from v$instance;
VERSION DATE_TIME INDICATOR
----------------- ------------------- ----------
11.2.0.3.0 2017/12/04 17:35:26 5087.41908
现在总结一下这个问题:
本地库是11.2.0.1 scn 的频率限制还是16K;
远程库是11.2.0.3,并且从x$kccdi2确认了当前使用的频率限制是32K;
远程库当前的SCN已经超过了本地库16K允许的上限所以使用DBLINK 同步SCN 会出现ora-600 [2252];
远程库查询天花板需要修改脚本中16为32;
其它地市能访问远程库是因为他们的数据库也是11.2.0.2版本以后,且同样使用的是32K的限制。
SCN增长速率加快了,如果32k的速度使用6bytes的scn总上限也就不是过去说的可用500年了,所以从12.2又引入了big scn加到了8bytes。且在12.2版本中对于SCN传播跳跃,增加了2个视图可以定位源头, 使用DBA_EXTERNAL_SCN_ACTIVITY DBA_DB_LINK_SOURCES and DBA_DB_LINK关连就可以,2012年1月以后的PSU起或在11G的部份版本中提供了控制SCN相关参数:
SCN rejected due to request for high SCN increment(controlled by _external_scn_rejection_threshold_hours)限制最多用到多少,保留时间;
SCN rejected due to request in certain DELTA of changes(controlled by _external_scn_rejection_delta_threshold_minutes)限制一次最多变化多少,如果请求超过会失败,提示ORA-19706;
SCN accepted but with a warning(controlled by _external_scn_logging_threshold_seconds)增长超过一定阀值时,写ALERT LOG。
SCN相关知识点:
SCN是Oracle数据库单向增长的”时钟”,广泛用于数据库一致性恢复和分布式事务(如dblink);
SCN有两部分组成 wrap.base, 在数据库中占用8bytes,在12c r2前预留2bytes,是一个6bytes(48bit)的Integer类型的数字,[16bit SCN Wrap].[32bit SCN Base],在12c R2起引入big scn,启用了原来预留的2bytes, 总长限有原来的2^48增长到2^64;
为了限制SCN无限增长,在程序的代码级设计了一个当前时间点的允许的最大SCN(Maximum Reasonable SCN)的软限制,Reasonable SCN Limit简称RSL,这个值是有一个工式计算出来的RSL=(从1988年1月1日起到当前时间) * 24 * 3600 * 每秒允许的最大增长率, 需要注意的是并不是简单的当前时间和1988-1-1两个时间点相减,可能是出于计算的简单,每个月是按31天计算的,从上面MOS中提供的脚本也可以看出。 每秒允许的最大增长率在11.2.0.2之前是16384(16K)11.2.0.2及以后的版本是32768(32K),有隐藏参数_max_reasonable_scn_rate控制;
SCN Headroom是一个最重要的检查项,值是当前时间点的允许的最大SCN与当前数据库SCN的差值,为了方便阅读以”天“为单位,SCN Headroom天数=(Maximum Reasonable SCN-Current SCN) /(每秒允许的最大增长率) /3600/24;
SCN异常增长通常是有DBLINK、人为前推SCN、oracle bug,SCN的历史变化可以从V$ARCHIVED_LOG得到, 最近5天的SCN也可以尝试从smon_scn_time得到。 数据库自身的增长可以从从dba_hist_sysstat得到’calls to kcmgas’的变化,SCN通过DBLINK 的传播可以通过上面提到的参数控制,和12c 中提供的新视图;
数据库11.2.0.2及以后的版本默认是允许32K的增长速率,所以就会像本案例以上产生较大的SCN, 这就意味着11.2.0.2可能不能再与低版本的数据库或是使用16K增长速率的数据库通过DBLINK。
作者文章
新补丁更新(RU和RUR),新的版本(Release 18和19)
Oracle 12c 关于密码(password)的几个新特性小结
故障诊断:12cR2 Flex ASM 环境中节点启动失败的诊断和分析
资源下载
关注公众号:数据和云(OraNews)回复关键字获取
2018DTCC , 数据库大会PPT
2018DTC,2018 DTC 大会 PPT
ENMOBK,《Oracle性能优化与诊断案例》
DBALIFE ,“DBA 的一天”海报
DBA04 ,DBA 手记4 电子书
122ARCH ,Oracle 12.2体系结构图
2018OOW ,Oracle OpenWorld 资料
产品推荐
云和恩墨Bethune Pro企业版,集监控、巡检、安全于一身,你的专属数据库实时监控和智能巡检平台,漂亮的不像实力派,你值得拥有!
云和恩墨zData一体机现已发布超融合版本和精简版,支持各种简化场景部署,零数据丢失备份一体机ZDBM也已发布,欢迎关注。
实战演练丨SCN太大引发ORA-600[2252]相关推荐
- 好用的综合revit软件丨Revit专业模型太大如何提高电脑性能
好用的综合revit软件丨Revit专业模型太大如何提高电脑性能 在实际项目中(以暖通专业为例),目前的专业模型太大,如下图1所示,会导致计算机资源不足.如何减少计算机资源的消耗,提高工作效率? 以上 ...
- pythom打包文件太大_从SQL注入到整站打包与本地搭建
一.前言 如题,由于是在已知有一处sql注入的情况下才接手进行的后续操作,因此前面信息搜集则一笔带过. 二.信息搜集 目标是个本地的传销站点其大致信息为IIS+ASP.NET+安全狗.腾讯云. 三.B ...
- Oracle - crfclust.bdb文件太大
问题排查 今天在检查oracle rac集群时,突然才发现服务器的根目录下面占用了很多空间,照道理不应该出现这种情况,初步猜想可能是哪个日志或跟踪文件太大导致. $ df -h Filesystem ...
- Unity3D占用内存太大的解决方法【先转,慢慢看】
2019独角兽企业重金招聘Python工程师标准>>> Unity3D占用内存太大的解决方法 最近网友通过网站搜索Unity3D在手机及其他平台下占用内存太大. 这里写下关于Unit ...
- 数据猿·金猿榜丨2017工业大数据领域最具潜力创业公司
[数据猿导读] "2017工业大数据领域最具潜力创业公司"盘点源于数据猿推出的"金猿榜"系列内容,旨在通过媒体的方式与原则,发掘大数据领域最具潜力的创新型企业 ...
- 集大计算机与科学的研究生,明天,我是研究生丨感谢集大,我遇见了更好的自己...
原标题:明天,我是研究生丨感谢集大,我遇见了更好的自己 集大让我遇见更好的自己 透过洒满阳光的图书馆玻璃窗 迎接朝阳与落日 在无数的挑灯夜读的日子 不再畏惧有疲惫侵袭 梦想道路上驰骋的灵魂 只为成为更 ...
- unity3d占用内存太大解决方法
原帖:http://www.onevcat.com/2012/11/memory-in-unity3d/ 转载自星辰 Unity3D占用内存太大的解决方法 最近网友通过网站搜索Unity3D在手机及其 ...
- Unity3D占用内存太大怎么解决
最近网友通过网站搜索Unity3D在手机及其他平台下占用内存太大. 这里写下关于Unity3D对于内存的管理与优化. Unity3D 里有两种动态加载机制:一个是Resources.Load,另外一个 ...
- Matlab曲线图导出eps数据量太大占用很多存储空间
Matlab曲线图导出eps数据量太大占用很多存储空间 我的Figure是从simulink里的scope里导出的,因为是采样率很高的时域波形,所以数据量很大.从Figure里导出eps向量格式的话, ...
最新文章
- matlab 多个表数据相加,Excel合并计算完成多表格数据汇总求和
- 【MM系列】SAP 簇表 A017 物料信息记录 (指定工厂) 包含的透明表
- python做Linux进程运行,Python实现在Linux系统下更改当前进程运行用户
- JS日期格式化(从YYYY-MM-DD到日期类)
- java 摸拟qq消息提示_java 仿qq消息提示框
- html5结构 客户端缓存,Javascript--离线应用与客户端储存
- 如何在几天时间内快速理解一个陌生行业?
- 毕设题目:Matlab瑕疵检测
- c语言编写在线考试系统,c语言作业在线考试系统实现
- 任正非:华为没有996更没有007,“狼性文化”其实是三个精神
- 绕开JS验证的方法汇总
- Pandas数据分析——Task2
- GUET第五组2021——随机森林
- Filament介绍
- java商城开发可以说是日臻完美
- WordPress初学者入门教程-分类和标签
- BackLinks-卖链接赚钱,只要你的网站达到pr3就很好赚钱
- MYSQL 根据身份证号找出年龄大于60岁的人
- ES(elasticsearch)搜索引擎安装和使用
- 10个顶级Python实用库,推荐你试试!