系统容错技术的发展有近30年的历史。从专用硬件和专用软件的结合到专用硬件和Unix系统,再到通用的硬件和通用的Windows操作系统,其间经历了几个阶段。本文结合辽河油田物资公司容错技术的使用,对容错技术的发展和应用进行了深入探讨。
硬件容错难普及
  系统容错技术发展的第一个阶段是从1985年到1990年。当时的容错机的机体内有两套甚至多套独立子系统,包括CPU板、总线、内存、硬盘、网卡、多用户卡、电源等。每个独立子系统上均可独立运行操作系统和应用软件。容错技术的关键之处在于,当第一个子系统出现硬件故障时,整个应用系统会无缝切换到第二套子系统上,并继续运行。所谓无缝,指数据不丢失,作业不停顿,系统可以实现零时间切换,这是容错技术的价值所在。因为硬容错切换技术十分复杂,所以容错机的价格一般很昂贵,价格在几十万美元到几百万美元之间。当时,容错机的普及率很低,通常只用在国家气象局、中央银行等关键部门。这些容错机采用专用CPU和以SVR4或BSD为核心并嵌入了容错内核的Unix操作系统,在软件兼容性上有较大的局限性。
  当时,辽河油田的局一级单位因容错机的价格昂贵且信息化应用还不普及,所以未考虑采用容错机。
双机冷备是过渡性方案
  系统容错技术发展的第二个阶段是从1990年到1995年。因为容错机的价格昂贵且软件移植困难,所以企业通常不会采用容错机。但是,企业又必须解决业务系统连续运行的问题,因此双机冷备作为一种替代的方案被普遍采用。所谓双机冷备,即准备一台和主服务器基本一样的备用服务器,当主服务器故障时,将主服务器的网线或多用户接口用手工方式转接到备用服务器上,然后人工启动备用服务器和相应的应用程序。这种方式的切换时间一般为几十分钟,手工切换时用户服务完全停止,故障点的数据也无法保存或恢复。这种容错方式的局限性非常大,没有生命力。
  当时,随着信息管理应用的发展,辽河油田的局一级单位以及主要业务单位,如物资公司等,开始逐步配置双机冷备方案。但是,作为系统管理员来说,非常担心主服务器一旦宕机,又要让业务人员手工填补数据。
  
HA软件太繁琐
  系统容错技术发展的第三个阶段是从1995年到2002年。这一阶段,企业的应用需求是既要降低成本,又要缩短系统切换时间。以高可用性(High Availibility,HA)软件为代表的双机软容错方式在此段时间得到快速普及,代表产品是NCR的Lifekeeper 和Veritas(现已被赛门铁克公司收购)的VCS。HA软件的基本原理是,在两套系统平台一致的服务器中安装HA软件,两台服务器相互脉动侦测(间隔为几秒到几十秒),备用服务器一旦发现主服务器硬件故障,将自动接管主服务器的作业和用户,并继续运行。这种方式能实现自动切换,并具有一定的在线实时功能。但是,HA方式是基于软件的方式完成侦测切换,切换时间从几分钟到半小时不等,切换时间内作业和用户服务暂停,而且故障点的数据,尤其是二次提交的数据库数据会丢失。因此,采用HA软件的方案,可能使企业、银行和售票网点等的在线应用出现混乱。当主服务器运行数据库、Lotus、Exchange等多个服务时,切换脚本的编写和切换管理对于系统管理员来说是十分困难和繁琐的。
  长久以来,数据安全问题一直困扰着我公司。将HA系统容错技术与企业数据库备份技术有机结合,可以有效保障数据安全。我公司采用一台Sun Fire4900服务器(配备12个CPU、64G内存)和6130阵列柜,将服务器分成两个域,即A域和C域,相当于物理上完全隔离的两个整体。A域和C域分别安装HA 软件,构成双机热备。一台旧的数据库服务器和Sun Fire4900服务器构成双机冷备。旧的数据库服务器和阵列柜安装一套Oracle 9i,构成RMAN备份服务器,保证一个月的全数据库备份。
  LVS集群应用系统由多个刀片服务器组成。应用服务器系统通过Mater Web服务器,将前台物资系统的用户请求分发到各节点Web服务器上,接着通过节点Web服务器将这些请求发送到数据库系统调度器上,然后再根据各个服务器的负载情况,动态地选择一台服务器处理请求,从而大大减轻了应用服务器的处理量。图1是我公司双机热备系统和Web服务器集群系统实现的示意图。
  我公司双机热备系统和Web服务器集群系统实现的示意图。

经济型容错机前景广阔
  零时间自动切换的硬容错技术价格昂贵,而价格相对低廉的双机冷备或HA软件容错技术又有致命的缺陷。用户需要的是一种合适、经济、成熟的容错产品。以NEC 5800FT和STRAUS FT为代表的新一代容错机诞生后,系统可用性和经济性之间的矛盾迎刃而解。
  NEC 5800FT和STRATUS FT作为纯粹的硬件容错机,不仅继承了早期Unix容错机的零时间切换硬容错技术,而且将应用平台向下延伸至通用的Microsft Windows和Liunx平台。FT容错机的价格与双机冷备或双机HA基本相当,但在容错性能上有了质的飞跃。FT容错机具有双机一体、硬容错、零时间切换、热插拔等功能。应用程序不必做任何修改,就可直接在FT容错机上运行。用户只要购买一套应用软件(如数据库),就可在主、备系统内分别安装。FT容错机具有很高的容错性能,价格又是普通用户完全可以承受的,因此具有广阔的发展前景。
             
 成熟的系统容错产品还有很多。不同的企业有不同的数据安全策略。作为我公司数据安全产品的服务提供商,北京长久斯捷公司的工作人员一直密切关注数据安全和系统安全的最新发展动向,包括RAID技术、双机容错、磁带备份、SAN、虚拟磁带库、CDP(持续数据保护)、异地容灾、硬件容错技术等,并将这些技术大量应用于石油企业的业务系统中。在容错机的基础上,我们双方针对存储产品、容错技术和应用系统的融合进行了深入探讨,并制定了未来的数据安全策略。
  针对访问时间点比较集中、数据传输速度快的要求,我公司的系统和数据备份的主体构架采用存储区域网(SAN),系统硬件结构如图3所示。在此系统中,Web服务器、数据库服务器、备份服务器通过HBA卡与光纤交换机连接,原有的SCSI磁盘阵列与新购买的光纤磁盘阵列通过多模光纤连入SAN网络,磁带机通过SCSI卡与备份服务器连接,并通过磁盘阵列本身具有的双控制器冗余、RAID技术等,保证系统的高可用性。
  根据多年积累的经验,我们认为,要想使系统具有更高的可靠性,最好采用链路级冗余技术,消除每条物理链路上可能出现的单点故障。这里的链路不仅指物理线路,还包括所有在该物理线路上网络设备,如HBA卡、交换机、光纤磁盘阵列的控制器等。所有设备的冗余配置(HBA卡、阵列控制器、光纤交换机、)结合链路侦测软件,使整个链路形成双环,可实现自动侦测和自动切换。一把钥匙开一把锁。通用的存储容错技术和产品必须与具体的应用相结合,才能满足用户的个性化需求。

转载于:https://blog.51cto.com/gtstorageworld/327621

存储容错:鱼与熊掌可以兼得相关推荐

  1. NVRH.265:鱼与熊掌不兼得?不见得!

    在大联网时代,产品IP化已成必然趋势,更加注重安防大联网的深度挖掘,与多行业的深度融合,然而安防IP化的进程中也遇到过一些阻碍:编码效率如何更大提升?联网带宽如何降低?系统存储如何变得更小? IP大时 ...

  2. R和Python谁更好?这次让你「鱼与熊掌」兼得

    作者 | Parul Pandey 译者 | 大鱼 责编 | Jane 出品 | Python大本营(公众号id:pythonnews) 如果你从事在数据科学领域,提到编程语言,一定能马上想到 R 语 ...

  3. JRuby:谁说鱼与熊掌不可兼得

    JRuby:谁说鱼与熊掌不可兼得? --写在国内第一本JRuby类图书<JRuby实战>即将出版之际 推荐阅读: 1.大师Martin Fowler强烈推荐的一本书 记得以前在和朋友聊天时 ...

  4. 提升资源利用率与保障服务质量,鱼与熊掌不可兼得?

    随着云计算时代的到来,大规模资源运营面临着如何在保障服务质量的同时提升资源利用率(降本增效).但这两个目标的达成在当前的软硬件技术水平上,是相互矛盾的.本文介绍的LAR(Load Auto-Regul ...

  5. 鱼与熊掌不可兼得!VS调试时拒绝访问的原因探究

    今天在用VS2013进行代码调试的时候,运行调试时突然出现了下面的错误: 重新构建.删除exe重新构建,都不能出现问题,上网查了一下,又要重装VS又要重装系统的,我觉得一定不是解决问题所在. 这时,突 ...

  6. python编程与t5哪个难_R和Python谁更好?这次让你「鱼与熊掌」兼得

    原标题:R和Python谁更好?这次让你「鱼与熊掌」兼得 如果你从事在数据科学领域,提到编程语言,一定能马上想到 R 语言和 Python语言(以下分别简称 R.Python).现在更多时候大家都把它 ...

  7. 用虚拟机搭建服务器跑分,个人评测 篇一:鱼与熊掌如何兼得-Parallels Desktop 16虚拟机告诉你...

    个人评测 篇一:鱼与熊掌如何兼得-Parallels Desktop 16虚拟机告诉你 2020-09-03 10:34:25 8点赞 46收藏 14评论 #尾巴众测#关注数字尾巴快8年了,都是当观众 ...

  8. 鱼与熊掌如何兼得:微软科学家解决并行训练困境

    转载: 微软亚洲研究院 http://blog.sina.com.cn/s/blog_4caedc7a0102w8gt.html 近日, ICASSP 2016国际会议在上海召开,这是电气电子工程师学 ...

  9. 开过全新BMW 3系 “鱼与熊掌”都可兼得

    都说宝马好,操控好,但是真的好不好还必须得亲自试驾一番才敢下定论,话不多说,今天开上全新BMW 3系溜一圈,一起来看看吧! 宝马家族式的双肾进气格栅在新车上有了更大面积的展现,在曜夜版车型上进气格栅是 ...

  10. 新型高熵合金:谁说强度和延展性不可以相容!鱼与熊掌可以兼得!

    香港城市大学(香港城大)团队早前成功研发名为Al7Ti7 ((FeCoNi)86Al7Ti7)的新型高熵合金,这种高熵合金在室温下强度达1.5 GPa(gigapascal),延展性达50%.透过纳米 ...

最新文章

  1. 使用代理软件之后其他软件不能联网的解决方法
  2. 批量处理word文件内容_用python批量提取word文件信息,导出到excel文件
  3. 适配器模式和外观模式
  4. alert,confirm和prompt
  5. 官宣!中央广播电视总台《2021年春节联欢晚会》总导演组公布
  6. [codevs 1343] 蚱蜢(省队选拔赛湖南)
  7. 物联网python教程慕课_物联网小白入门
  8. apache lucene_Apache Lucene基础教程
  9. 蓝桥杯大赛青少年创意编程 推荐考生阅读 相关书籍的相关视频(部分)
  10. python安装到桌面的路径是什么_Python 获取windows桌面路径的5种方法小结
  11. webpack-internal:///./node_modules/vue/dist/vue.esm.js:629 [Vue warn]: Invalid prop: type check fail
  12. 正态分布及其如何检验
  13. Windows系统远程桌面连接阿里云Linux Ubuntu
  14. 普通糖尿病人1周食谱
  15. Word 2010 从任意页码重新开始
  16. 拜耳新一代犬体内驱虫药拜宠清登陆中国市场
  17. 【qq音乐歌曲下载转换为mp3格式】
  18. JavaScript 进阶 - 第3天
  19. android蓝牙同步拨打电话状态,还不会用华为Watch打电话?这六个步骤要记清!
  20. 怎样在 Linux 系统中恢复已删除文件

热门文章

  1. Ros学习笔记(六)Launch启动文件
  2. android 呼吸灯权限_Android 呼吸灯效果
  3. 7-10 数组循环左移 (20 分)
  4. Android 项目中用得最多最火的第三方框架可能都在这里了
  5. 洛谷——P1507 NASA的食物计划
  6. Codevs 1684 垃圾陷阱
  7. iOS基础 - UIScrollView
  8. 程序functionLua基础 小结(两个Lua程序示例)
  9. web安全day24:一文读懂Linux系统安装软件的几种方法
  10. HCIE-RS--路由器交换机做整形的区别