转自 https://blogs.oracle.com/ExadataCN/entry/exadata%E5%AD%98%E5%82%A8%E8%8A%82%E7%82%B9%E7%9A%84rescue

这篇文章主要从何时需要紧急修复、准备过程、实施阶段等几个方面来与大家分享Exadata 存储服务器Rescue方面的维护经验,有的地方提供了My Oracle Support网站的文章号。

了解storage server 和rescue方法

什么是Rescue呢?Rescue这个英文对应的中文含义是紧急修复,只在非常必要的情况下才需要进行,否则会造成无谓停机和软件版本的不一致。

首先,我们需要了解Exadata存储服务器(storage server)方面的知识,它主要提供智能的磁盘I/O给计算节点。关于磁盘的管理,可以通过阅读My Oracle Support文章Auto disk management feature in Exadata (Doc ID 1484274.1)来熟悉storage server上的自动磁盘管理特性。

以下关于何时需要紧急修复,准备阶段和实施阶段等方面进行分享。

何时需要Storage server(存储服务器)的rescue过程

当系统盘失效,操作系统有一个文件系统损坏了或者boot区域被破坏了的时候。一台节点机上的两个系统磁盘都同时失效了的话,就必须通过CELLBOOT USB flash盘上的Oracle Exadata Storage Server软件进行rescue了。

请仔细阅读产品文档中的 Maintaining Exadata Storage Servers of Oracle Exadata Racks章节:

Using the Oracle Exadata Storage Server Software Rescue Procedure

准备阶段

平时要查看CELLBOOT USB盘是否可用,如果丢失或者损坏了,通过如下过程来创建:

重新生成一个损毁的CELLBOOT USB闪存盘

如果CELLBOOT USB闪存盘丢失或者损毁,您可以使用如下过程来创建一个新的。

注意: 针对运行Oracle Exadata Storage Server Software release 12.1.2.1.0或更高版本的机器创建一个USB闪存盘,要求机器操作系统版本是Oracle Linux 6

To create a USB flash drive for a machine running Oracle Exadata Storage Server Software release 12.1.2.1.0 or later requires a machine running Oracle Linux 6.

以root用户身份登录到cell

接插上新的USB盘,它上面的容量得至少1GB,最大可以到8GB。

从系统上移除任何其它的USB闪存盘执行如下命令:

cd /opt/oracle.SupportTools

./make_cellboot_usb -verbose -force

一般来说,Cell上有大量的业务数据,需要注意保证相应磁盘组里有足够多的空闲空间,这样,ASM根据情况重新分布(该需要rescue的cell上面的)数据到磁盘组的剩余磁盘时,就不至于因为空余空间不足从而无法完成。

如果storage server上打过one-off patch,请记住打过的patch号,以便rescue之后可能需要重新打。

实施阶段

真正进行紧急修复时要注意什么呢?

用CELLBOOT USB进行rescue时,从GRUB里选择CELL_USB_BOOT_CELLBOOT_usb_in_rescue_mode引导条目。但如果CELL_USB_BOOT_CELLBOOT_usb_in_rescue_mode 这个选项条目显示不出来,请参照文章Unable to rescue the Exadata storage using CELLBOOT USB (Doc ID 1413637.1) 的步骤向下继续进行。

如果rescue过程完不成,这多半表明可能有硬件问题。这时如果您连接到iLOM 上执行:

show faulty

它会说明出了什么情况。如果机器确实有硬件问题,则必须先修正这个硬件故障,之后再进行后续工作。

如果启动Storage Cell后,根文件系统 “/” 被mount成 read only了,则恢复的过程需要用到USB相关的rescue模式,需要详细步骤请创建一个技术支持服务请求(SR),由Oracle技术支持工程师协助解决。

Rescue完成后的注意事项

如果机器是X3-2 Eighth Rack,则需要参考文章Exadata Database Machine Eighth Rack reconfiguration required after restore/rescue (Doc ID 1538561.1)里所说的补充步骤来恢复为正确的配置。

如果Flash cache的mode (Writethrough及Write-Back)被从默认值修改过,在rescue之后,要手动单独重启一次cell server (restart cellsrv)。

检查IORMPLAN, THRESHOLDs, Cell notification settings这些配置是否与原来的一致,不一致的话进行调整。

如果系统改变过host_access_control,需要检查是否一致。但一般来说这一项大多数用户都不涉及。

其它参考

有可能的话请尝试熟悉文章:    Exadata Platinum Customer Outage Classifications and Restoration Action Plans (Doc ID 1483344.1) 所提及的与系统停止运行有关的维护要点。

参考链接

修复共享服务器,【转】Exadata存储服务器的紧急修复(rescue)经验分享相关推荐

  1. Spring Boot 多版本更新,紧急修复 RFD 安全漏洞

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 来源 | oschina.net/news/118693 ...

  2. qq讨论组显示连接服务器异常,QQ讨论组出现大面积故障 腾讯回应:因服务器异常 已紧急修复...

    原标题:QQ讨论组出现大面积故障 腾讯回应:因服务器异常 已紧急修复 [TechWeb报道]8月25日消息,今天上午,大量网友反映称QQ讨论组功能出现Bug,具体症状为,在讨论组内发送一条信息就会被自 ...

  3. 翻车!微信翻译误翻闹笑话 腾讯官方回应:紧急修复中...

    近日,有网友发现,在微信中通过特殊句式+人名发送,继而通过微信自带的翻译功能进行英译汉翻译,得到的结果出人意料. 具体来看,当网友输入you are so Kris wu后,得到的翻译结果为你真可爱, ...

  4. iOS 11.2 版本紧急修复黑屏 Bug,却遇 FaceID 识别错误,真实原因在此

    点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 自 12 月 1 日起,陆续有很多苹果用户反映搭载 iOS 11.1.2 的 iPhone ...

  5. 谷歌紧急修复已遭在野利用的0day

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 摘要 谷歌发布 Windows.Mac 和 Linux 版本的 Chrome 100.0.4896.127,修复已遭利用的高危0day漏洞(CV ...

  6. 苹果紧急修复已遭利用的两个0day

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 周四,苹果公司紧急更新被用于攻击 iPhone.iPad 和 Mac 的两个0day (CVE-2022-22674和CVE-2022-2267 ...

  7. 谷歌紧急修复已遭利用的新 0day

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 上周五,谷歌紧急修复已遭利用的 Chrome 0day (CVE-2022-1096),和 V8 JavaScript 引擎中的类型混淆漏洞有关 ...

  8. 谷歌紧急修复已遭在野利用的高危 V8 0day (CVE-2021-4102)

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 谷歌为 Windows.Mac 和 Linux 系统发布 Chrome 96.0.4664.110 版本,修复一个已遭在野利用的位于V8 Jav ...

  9. 谷歌Chrome 紧急修复已遭利用的两个0day

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 谷歌发布适用于 Windows.Mac 和 Linux 系统的 Chrome 95.0.4638.69 版本,修复已遭利用的两个0day(CVE ...

最新文章

  1. c语言 栈结构存放数据类型,数据结构——栈的详解
  2. Eclipse文档注释快捷键以及自定义文档注释内容
  3. mysql between and 包含边界吗_10分钟让你明白MySQL是如何利用索引的
  4. android运动轨迹怎么画,Android 利用三阶贝塞尔曲线绘制运动轨迹的示例
  5. Codeforces Round #603 (Div. 2) E. Editor 线段树维护括号序列
  6. AOP五大通知注解详解
  7. 如何理解,互联网架构“高并发”?
  8. 【学堂在线数据挖掘:理论方法笔记】第一天(3.17)
  9. Must Know Tips/Tricks in Deep Neural Networks (by Xiu-Shen Wei)
  10. 2021上半年软考中级软件设计师考试心得(10天时间你可以拿捏的)
  11. solidworks工程图剖视图没有从默认的A开始解决办法
  12. 一文看懂DCDC拓扑原理
  13. 分布式数据库DBLE 快速入门
  14. 工单处理之--docker版java应用增加调试日志的笨方法
  15. 【Tools】抓包工具——Charles(中名:花瓶)
  16. java 下载图片流
  17. 如何旋转在Visio中的文字(或文本)
  18. e^x的导数仍为e^x
  19. 什么是LSI关键词?
  20. 知乎日报 API 分析

热门文章

  1. 【redis系列】redisTemplate缓存常用工具类
  2. linux编译内核后无法进入,编译linux内核,ubuntu,x86的环境出现warning,然后就出现无法启动ubuntu...
  3. MongoDb进阶实践之一 如何在Linux系统上安装和配置MongoDB
  4. 寿险的精算现值(EPV)
  5. mysql必知必会第一节
  6. 解决ssh登录后闲置时间过长而断开连接
  7. [2012.04.03] Windows Phone 上的汉语拼音以及多音字处理
  8. 让你不富都难的28个理财习惯
  9. QGrapicsScene类
  10. 所有XP_SP2服务的详细介绍