某客户的ERP数据库出现异常,数据库版本比较老,是Oracle 8.0.5。 问题本身并不复杂,简单记录一下。

主要的问题是客户的应用访问报错,通过分析客户传的alert log发现出现了大量的IO错误,如下:

Thu Dec 25 13:29:42 2014

ORACLE Instance PROD (pid = 78) - Error 1115 encountered while recovering transaction (28, 23).

Thu Dec 25 13:29:42 2014

Errors in file /u04/dbcommon/PROD/udump/prod_ora_23181.trc:

ORA-01115: IO error reading block from file 2 (block # 262144)

ORA-01110: data file 2: '/u03/oradata/PROD/rbs1.dbf'

ORA-27072: skgfdisp: I/O error

SVR4 Error: 2: No such file or directory

Additional information: 262143

ORACLE Instance PROD (pid = 78) - Error 1115 encountered while recovering transaction (28, 23).

Thu Dec 25 13:30:04 2014

Errors in file /u04/dbcommon/PROD/udump/prod_ora_23181.trc:

ORA-01115: IO error reading block from file 2 (block # 262144)

ORA-01110: data file 2: '/u03/oradata/PROD/rbs1.dbf'

ORA-27072: skgfdisp: I/O error

SVR4 Error: 2: No such file or directory

Additional information: 262143

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

ThuDec2513:29:422014

ORACLEInstancePROD(pid=78)-Error1115encounteredwhilerecoveringtransaction(28,23).

ThuDec2513:29:422014

Errorsinfile/u04/dbcommon/PROD/udump/prod_ora_23181.trc:

ORA-01115:IOerrorreadingblockfromfile2(block# 262144)

ORA-01110:datafile2:'/u03/oradata/PROD/rbs1.dbf'

ORA-27072:skgfdisp:I/Oerror

SVR4Error:2:Nosuchfileordirectory

Additionalinformation:262143

ORACLEInstancePROD(pid=78)-Error1115encounteredwhilerecoveringtransaction(28,23).

ThuDec2513:30:042014

Errorsinfile/u04/dbcommon/PROD/udump/prod_ora_23181.trc:

ORA-01115:IOerrorreadingblockfromfile2(block# 262144)

ORA-01110:datafile2:'/u03/oradata/PROD/rbs1.dbf'

ORA-27072:skgfdisp:I/Oerror

SVR4Error:2:Nosuchfileordirectory

Additionalinformation:262143

从alert log 来看,上述报错的文件出现IO error,实际上该文件是确实存在的。开始我以为有可能是数据文件头的

os block 损坏了,通过dd dump分析发现是OK,如下:

---异常文件

$ dd if=rbs1.dbf.bak bs=8192 count=1 | od -x |head -10

1+0 records in

1+0 records out

0000000 0000 0000 0000 2000 0007 f800 5a5b 5c5d

0000020 0000 0000 0000 0000 0000 0000 0000 0000

*

0020000

----正常文件

$ dd if=oed3.dbf bs=8192 count=1 | od -x |head -10

1+0 records in

1+0 records out

0000000 0000 0000 0000 2000 0000 1e00 5a5b 5c5d

0000020 0000 0000 0000 0000 0000 0000 0000 0000

*

0020000

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

---异常文件

$ddif=rbs1.dbf.bakbs=8192count=1|od-x|head-10

1+0recordsin

1+0recordsout

000000000000000000020000007f8005a5b5c5d

000002000000000000000000000000000000000

*

0020000

----正常文件

$ddif=oed3.dbfbs=8192count=1|od-x|head-10

1+0recordsin

1+0recordsout

0000000000000000000200000001e005a5b5c5d

000002000000000000000000000000000000000

*

0020000

同时,从报错来看,提到了一个block,查看trace可以看到该block的内容如下:

********************************************************************************

UNDO BLK:

xid: 0x001c.017.0000c361 seq: 0x88ef cnt: 0x4e irb: 0x1 icl: 0x0 flg: 0x0000

Rec Offset Rec Offset Rec Offset Rec Offset Rec Offset

---------------------------------------------------------------------------

0x01 0x1f88 0x02 0x1f2c 0x03 0x1e9c 0x04 0x1e44 0x05 0x1dec

。。。。。。

0x47 0x03c0 0x48 0x0364 0x49 0x02d4 0x4a 0x027c 0x4b 0x0224

0x4c 0x01c4 0x4d 0x0168 0x4e 0x00d8

*-----------------------------

* Rec #0x1 slt: 0x17 objn: 202838(0x00031856) objd: 202838 tblspc: 22(0x00000016)

* Layer: 10 (Index) opc: 22 rci 0x00

Undo type: Regular undo Last buffer split: No

Temp Object: No

rdba: 0x0083ffff

*-----------------------------

index undo for leaf key operations

KTB Redo

op: 0x02 ver: 0x01

op: C uba: 0x0083ffff.88ef.4b

Dump kdilk : itl=3, kdxlkflg=0x1 sdc=0 indexid=0x18816b90 block=0x05c12678

restore leaf row (clear leaf delete flags)

key :(14): 04 c3 02 24 32 05 3c 3d 49 4a 66 02 c1 2c

keydata/bitmap : (6): 19 40 79 da 00 1d

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

********************************************************************************

UNDOBLK:

xid:0x001c.017.0000c361seq:0x88efcnt:0x4eirb:0x1icl:0x0flg:0x0000

RecOffsetRecOffsetRecOffsetRecOffsetRecOffset

---------------------------------------------------------------------------

0x010x1f880x020x1f2c0x030x1e9c0x040x1e440x050x1dec

。。。。。。

0x470x03c00x480x03640x490x02d40x4a0x027c0x4b0x0224

0x4c0x01c40x4d0x01680x4e0x00d8

*-----------------------------

*Rec#0x1  slt: 0x17  objn: 202838(0x00031856)  objd: 202838  tblspc: 22(0x00000016)

*Layer:10(Index)opc:22rci0x00

Undotype:RegularundoLastbuffersplit:No

TempObject:No

rdba:0x0083ffff

*-----------------------------

indexundoforleafkeyoperations

KTBRedo

op:0x02ver:0x01

op:Cuba:0x0083ffff.88ef.4b

Dumpkdilk:itl=3,kdxlkflg=0x1sdc=0indexid=0x18816b90block=0x05c12678

restoreleafrow(clearleafdeleteflags)

key:(14):04c3022432053c3d494a6602c12c

keydata/bitmap:(6):194079da001d

上述的dump内容非常简单。我们回头来看下前面的错误:

Error 1115 encountered while recovering transaction (28, 23)

首先我们需要明白,这里的28,,23分别代表什么含义 ?

正常情况下,这里的28表示回滚段编号,23表示事务槽编号。 通过检查发现实际上这里的信息是不对的。

客户的系统中根本不存在这个回滚段。通过block号,我们定位到实际上是第4号回滚段。

因此要解决这个回滚段事务的问题,就很简单了,通过_corrupted_rollback_segments=RBS4 然后强制drop即可。

另外,由于这里事务涉及的操作,其实是针对Index的操作,因此。我们drop完成之后,还需要重建相关的Index。

当处理完这个之后,客户反馈另外一个数据文件也有问题,当操作某个表时,会出现异常,如下:

SVRMGR> insert /*+append */into inv.MTL_TRANSACTION_ACCOUNTS_BAK select /*+parallel(t,4)*/* from inv.MTL_TRANSACTION_ACCOUNTS t;

ORA-12801: error signaled in parallel query server P001

ORA-01115: IO error reading block from file 94 (block # 262141)

ORA-27072: skgfdisp: I/O error

SVR4 Error: 25: Inappropriate ioctl for device

Additional information: 262141

ORA-01115: IO error reading block from file 94 (block # 262141)

ORA-27072: skgfdisp: I/O error

SVR4 Error: 25: Inappropriate ioctl for device

Additional information: 262141

1

2

3

4

5

6

7

8

9

10

SVRMGR>insert/*+append */intoinv.MTL_TRANSACTION_ACCOUNTS_BAKselect/*+parallel(t,4)*/*frominv.MTL_TRANSACTION_ACCOUNTSt;

ORA-12801:errorsignaledinparallelqueryserverP001

ORA-01115:IOerrorreadingblockfromfile94(block# 262141)

ORA-27072:skgfdisp:I/Oerror

SVR4Error:25:Inappropriateioctlfordevice

Additionalinformation:262141

ORA-01115:IOerrorreadingblockfromfile94(block# 262141)

ORA-27072:skgfdisp:I/Oerror

SVR4Error:25:Inappropriateioctlfordevice

Additionalinformation:262141

实际上,这个表,在我处理之前,直接count(1)操作,都会报上面的错误。经查,这是Oracle 805的bug导致。

通过调整disk_async_io=false,以及db_file_multiblock_read_count为16,解决了这个问题。

虽然可以进行count,然而客户反馈业务操作仍然报错。最后我们发现,这可能是oracle 805的bug导致,当数据文件大小

超过2GB时,会出现异常。实际上,我在进行dbv检查时,该数据文件都会报错。

最后我们通过cats重建表,然后重建index解决了该问题。

备注:805版本中,rename table语法很坑爹,必须这样:

alter table roger.test rename to test_new;

这个系统将近20年了,也正是够老的了。

oracle-12801,ORA-12801相关推荐

  1. oracle tnsnames.ora文件用法说明

    oracle tnsnames.ora文件用法说明 CreationTime--2018年8月10日08点32分 Author:Marydon 1.用途 oracle客户端所需要的一个文件,通过该文件 ...

  2. 12505 java_Java jdbc Oracle error: ORA 12505

    Java jdbc Oracle error: ORA 12505 更改oracle Listener 配置:D:\Oracle\moon\product\11.1.0\db_1\NETWORK\AD ...

  3. Oracle常见ORA错误及解决办法

    Oracle常见ORA错误及解决办法 问题1 1.1 错误现象: EXP-00008: ORACLE error 1013 encountered ORA-01013: user requested ...

  4. ORACLE全部ORA错误收集整理

    有时数据库出现问题,不是每次都有网络可查,所以把所有的ora系列的错误整理出来, 在最没有办法的时候,需要自己来解决,有了这些根据,问题会好办的.虽说对于数据库方面, DBA很强大,他们在遇到错误时, ...

  5. oracle exp ora 01406,8i9i exp 10g遭遇 ora-1406及ora-1406相关问题

    本文提到的案例 通过odbc驱动使用高精度number类型,如果遇到下面两种情况,会出现这个错误 -to fetch of a calculated column with many decimal ...

  6. oracle rac ora 12537,解决11gR2 Rac ORA-12537: TNS:connection closed 一例

    Solaris 10, oracle 11.2.0.3, RAC, 非ASM, 使用SCAN和DNS 状况: # tnsping ISUITE TNS Ping Utility for Solaris ...

  7. Oracle init.ora常用配置详解

    文件的位置(oracle 9i):/export/home/oracle/app/oracle/admin/oracle9i/pfile/initoracle9i.ora 重要的配置 db_name ...

  8. oracle 增加ora容量_案例:Oracle报错ORA-01144 详解数据文件大小32GB的限制的原因

    天萃荷净 Oracle数据文件大小的限制,运维DBA在向Oracle数据库添加一个32G的数据文件的时候报错ORA-01144,分析原因为数据库针对文件有32G限制 1.添加数据文件报错ORA-011 ...

  9. oracle rac ora 12560,rac ORA-12541: TNS:no listener问题 非常急!!

    客户端连接oracle的时候时而连得上时而连不上 而且报错不是ora-12545,是报的ora-12541没有监听 连指定节点能连得上没问题, SQL> conn sys/oracle@cbl1 ...

  10. oracle 安装ora 27102,ORA-27102 解决办法

    因为在32位操作系统上执行了如下的操作 alter system set sga_max_size=2G scope=spfile; 之后再重启数据库就会失败 报出错误: ORA-27102 Out ...

最新文章

  1. 自动化是计算机相关专业英语,自动化专业英语词汇
  2. 特斯拉发布Q1无人驾驶安全报告:事故增多 但还是比人类少
  3. c语言练习题及答案)(1),c语言练习题(带详解答案)1.pdf
  4. Linux下php5.3编译oracle客户端
  5. 9.11 strace:跟踪进程的系统调用 、ltrace:跟踪进程调用库函数
  6. android 解决Error:This Gradle plugin requires Studio 3.0 minimum
  7. Centos7 更新pip和scipy
  8. 前端学习(178):表格元素
  9. 自动化日志收集及分析在支付宝 App 内的演进
  10. 经典面试题(4):use strict 有什么意义和好处?
  11. (18)Zynq FPGA 看门狗定时器介绍
  12. 手把手教你用Python来模拟绘制自由落体运动过程中的抛物线(附源码)
  13. 数据结构:内排序(C++)
  14. 关于String a=new String(a)创建几个对象问题的正确答案
  15. proteus单片机仿真入门攻略(含元器件名称及它的图形)
  16. 前端知识:使用layui模板搭建页面,简单快捷
  17. 生成osm文件_OSM地图本地发布-如何生成各省市矢量地图
  18. 云南大学通信工程827考研上岸经验分享
  19. 自媒体如何多平台发文章?
  20. C#实例练习3:程序流程控制(2)

热门文章

  1. 火影_青鸟_中日罗马音
  2. 为啥Java程序员工资高,却很多人想转行,这4点原很现实
  3. 机器人视觉测量与控制
  4. Java 上机----实训操作14----学校录取类
  5. 惠普HP Ink Tank 118 打印机驱动
  6. Android HTTP边下边播
  7. Spring中如何操作JDBC
  8. # Scroll 系列
  9. 关于子函数的调用和终止
  10. 微信小程序系列4——传值详解