关注微信公众号:AWS爱好者(iloveaws)

Hello大家好,欢迎来到《AWS解决方案架构师认证 Professional(SAP)中文视频培训课程》,我们今天的课程讨论实例的状态检查和自动恢复的内容。

我们开始今天的课程。

实例的状态检查知识点

首先,我们先来了解下实例的状态检查的一些重要知识点。
Amazon EC2 会对每个运行的 EC2 实例执行自动检查以识别硬件和软件问题。当我们启动一台实例后,状态检查就会自动开启检测软硬件问题。

状态检查是内置到 Amazon EC2 中的,所以不能禁用或删除。

状态检查每分钟进行一次,会返回一个通过或失败状态。如果所有的检查都通过,则实例的整体状态是OK,如果有一个或多个检查故障,则整体状态为受损。

您也可以创建 Amazon CloudWatch 警报,用于监控 Amazon EC2 实例并可以在实例由于潜在问题而受损时自动恢复实例,这也是我们本节课实例的自动恢复采用的方式,一会会进行实操演示。

EC2的状态检查可分为两种类型:系统状态检查和实例状态检查。
我们首先看下系统状态检查。

EC2的状态检查-系统状态检查

系统状况检查,会检测出需要AWS参与修复的深层实例问题,比如,以下是可能导致系统状况检查失败的问题:

  • 实例的网络连接丢失
  • 实例的系统电源损耗
  • 实例所属物理主机上的软件问题。这个主要是指实例所在底层物理硬件的虚拟化相关软件的问题。
  • 以及实例所属物理主机上影响到网络连接状态的硬件问题

一般当我们的实例出现 系统状况检查失败 是需要AWS参与和处理的,所以当我们遇到这个问题时,可以选择等待AWS修复问题,也可以自行解决问题。但是这里所谓自行解决问题,一般就是将有问题的实例手动停止在启动一下,这样的话这台实例就会从所在故障的底层硬件 自动迁移到 其他没有问题的底层硬件上。注意这种情况是需要停止实例而不是重启实例,重启实例的话实例还是会在原有的有问题的底层硬件之上运行。

AWS也支持当实例出现状态检查失败时自动的为我们恢复指定的实例,不需要人为手动干预,我们在这节课后面也会实操演示这部分内容。

以上是系统状态检查。

EC2的状态检查-实例状态检查

我们在看下 实例状态检查。
实例状况检查,是监控您的各个实例的软件和网络配置等。
Amazon EC2 通过向网络接口 (NIC) 发送地址解析协议 (ARP) 请求,检查实例的运行状况,这些检查检测是需要您参与修复的问题。
如果 实例状态检查 失败,通常必须由您自行解决问题(例如,重启实例或更改实例配置)。

以下是可能导致 实例状态检查失败 的问题的示例:

  • 系统状态检查故障
  • 网络或启动配置不正确
  • 内存耗尽
  • 文件系统损坏
  • 内核不兼容

以上是实例状态检查的内容,所以,通过上面的介绍不难发现,实例状态检查,通常是需要由您也就是客户自行解决的问题;而系统状况检查,是需要AWS参与修复的深层实例问题。

好,以上是我们的知识点内容,接下来我们就进入实操演示环节。

实操演示-查看实例的状态检查信息

首先,我们先来看下如何在AWS控制台查看前面介绍的 实例状态检查的信息。
访问EC2控制台,目前运行着一台实例-server 1,选择这台实例后,通过下面的“状态检查”选项卡,可以查看该实例的“系统状态检查”以及“实例状态检查”。

我们可以看到控制台上的绿字“系统可到达性检查已通过” 以及 “实例可到达检查已通过”,说明这台实例目前已经通过了“系统状态检查”以及“实例状态检查”。

系统状况检查,是需要AWS参与修复的深层实例问题;而实例状态检查,通常是需要由您也就是客户自行解决的问题,具体的问题所包括的内容前面已经介绍过了。

另外,通过“监控”选项卡,然后在往下可以查看选择的实例 各类状态检查失败的次数。

当出现系统状态检查失败时,如果我们配置实例的自动恢复后,EC2会自动的为我们恢复指定的实例,不需要人为手动干预。
但是需要注意的是自动恢复这个功能只支持“系统状态检查”失败时自动恢复,并不支持“实例状态检查”。

实操演示-实例的自动恢复

接下来我们就来实操演示下自动恢复的内容,假设我们要配置server1这台实例的自动恢复。

选择实例后,在状态检查选项卡,点击“创建状态检查警报”,可以在该实例 状态检查失败时 发送通知到SNS主题,比如邮件,这样我们可以在失败时可及时收到通知,我们这里因为是测试就不发送通知了,建议生产环境勾选。

然后选择执行的操作,包括:恢复此实例,停止此实例,终止此实例,重启此实例。
恢复此实例,是指当实例“系统状况检查”失败时,会为我们自动停止然后启动该实例, 达到自动恢复“系统状况检查”失败的实例的效果,因为当停止实例在启动实例后,该实例会切换到其他底层物理服。

比如我们目前这台实例在物理服A上运行,然后物理服A出现问题了,导致该实例“系统状况检查”失败,当我们勾选“恢复此实例”后,EC2会自动为我们停止然后在启动该实例,启动过后该实例就从有问题的物理服A,切换到了其他正常的物理服比如物理服B后运行。

而这个“重启该实例”,如果实例在物理服A上,重启后不会切换物理服,还会在物理服A上运行。
所以如果我们需要EC2帮我们恢复实例,就要在这里选择“恢复此实例”,其实也就是EC2自动帮我们停止在启动实例,切换实例所属底层硬件达到恢复实例的效果。

注意,在强调一下,恢复实例的功能只有在 系统状态检查失败时 才支持。

后面是配置连续的周期和时间。

接下来我们做个实例自动恢复的快速演示,我们选择“恢复此实例”,条件配置为,当系统状态检查失败时,至少1个周期,时间为1分钟。输入警报名称为:test,然后创建警报。

创建后我们点击警报名称就会跳转到CloudWatch警报控制台,由于刚添加的警报目前数据不足,我们等待1分钟,等收集数据完整。
好,大概1分钟左右,目前警报的状态由“数据不足”变为“确定”。

那么现在 系统状态检查警报 我们就创建好了,当系统状况检查失败时,EC2会自动为我们恢复实例。我们接下来就测试下。

测试的方式非常简单,我们就通过 AWS的 CLI命令,将系统状况检查手动设置为“警报”状态,看看会发生什么。

我们先看下将系统状况检查手动设置为“警报”状态这条命令:

aws cloudwatch set-alarm-state --alarm-name “test”--state-value ALARM --state-reason “test” --region ap-northeast-1

alarm-name 后面需要加警报的名称,我们之前创建的警报名称为“test” ,然后state-value的值为ALARM,最后region后面配置所在区域,我测试所在的区域是东京。

当我们手动执行这条命令之后,会将我们之前配置的名为test的警报,状态由“正常”变更为“警报”状态,然后会触发我们之前配置的对应的操作—“恢复此实例”操作,我们现在测试一下。

切换到我本地终端,然后我们复制下命令,执行:

aws cloudwatch set-alarm-state --alarm-name “test”
--state-value ALARM
--state-reason “test”
--region ap-northeast-1

好,然后切换到cloudwatch控制台,可以看到我们之前创建的名为test警报,状态已经由“确定”变为“警报中”,说明我们刚才执行的cli命令已经生效了。

我们可以通过test警报的历史记录看一下具体的执行日志,在历史记录中可以清晰的查看状态更新的日志以及操作记录。

在我们执行cli命令后,历史记录中显示警告从“确定”更新到了“警报中”,然后,自动为我们触发了操作,已成功执行操作对实例进行recover,然后警告从“警报中”变更为“确定”。

也就是说,我们上面通过cli命令手动将警报状态设置为ALARM后,系统状态检查失败,然后EC2自动为我们执行了“恢复该实例”的操作,我们的实操演示成功了。

这里有一个小提示,我们这个演示是通过cli手动将警报状态设置为ALARM,所以AWS并没有真正的为我们停止和启动实例切换不同的底层硬件。但是在实际使用中如果发生系统状态检查失败,EC2是会自动执行停止、启动从而切换底层物理硬件达到恢复实例的作用的。

好,以上就是我们今天的课程内容,我们今天讨论了实例的状态检查知识点,以及实操演示了实例的自动恢复的内容,希望能够给大家带来帮助。

希望此系列教程能为您通过 AWS解决方案架构师认证 Professional 认证考试带来帮助,如您有任何疑问,请联系我们:

  • AWS爱好者的网址是http://www.iloveaws.cn。
  • 可以通过扫码加入【AWS爱好者】微信公众号,查看原创的AWS知识点相关文章
  • 加入【AWS爱好者】微信群,和其他同学一起备考,以及探讨交流AWS相关知识
  • 加入【AWS知识星球】持续学习。

我们今天的视频课程就到这里,感谢大家的观看,我们下一课程再见。

关注微信公众号:AWS爱好者(iloveaws)

netsh命令恢复网络_实例的状态检查和自动恢复相关推荐

  1. netsh命令恢复网络_巧用Netsh命令备份和恢复网络设置

    Netsh是Windows 2000/XP/2003操作系统自身提供的命令行脚本实用工具,它允许用户在本地或远程显示或修改当前正在运行的计算机的网络配置.为了存档.备份或配置其他服务器,Netsh也可 ...

  2. ping命令测试网络_如何执行计算机Ping测试命令以检查网络连接?

    ping命令测试网络 Computer networking provides a lot of features for remote usage. But remote access may ha ...

  3. 电脑如何恢复声音_电脑文件剪切丢失如何恢复?99%数据都能恢复

    剪切文件丢失后如何找回?很多人在文件复制过程中,往往也都比较喜欢使用剪切的方式对所需要复制的文件进行剪切,因为这样操作起来一般也都是比较方便的,并且在文件剪切完成后,也都不需要对原有文件进行删除处理. ...

  4. pfile文件怎么恢复格式_回收站清空的文件怎么恢复?值得收藏的恢复方法

    回收站清空的文件怎么恢复?我想这个问题一直困扰着大家吧,按理说本来回收站是给了我们一个后悔的机会,不像手机里面删除的数据就直接没了,但是对于这个后悔药,有的小伙伴并没有好好利用起来,有些人会直接按&q ...

  5. 联想小新一键恢复小孔_联想小新电脑一键恢复出厂设置

    有些时候联想电脑需要恢复出厂设置,那么的呢?下面是小编收集整理的,希望对大家有帮助~~联想电脑恢复出厂设置的方法操作方法01打开电脑电源开关,迅速连续敲击键盘的[F2]按键,启动[拯救系统]→[一键恢 ...

  6. 苹果手机电池恢复方法_苹果删除的照片怎么恢复?真的能找回,这些方法赶紧看!...

    你真的会用苹果手机吗?很多人每天都在使用手机,但是关于手机里的一些小技巧却一概不知.其实适当地掌握一些小技巧,可以帮助我们很多. 大家肯定都有遇到过误删手机照片的情况,今天小编要给大家分享的就是恢复手 ...

  7. ad19pcb设置恢复默认_无需重装WINDOWS将计算机恢复到初始状态

    你的电脑变慢了吗?还是想在出售前清除所有文件和内容?这是擦拭Windows计算机的最简单方法! 想要Windows计算机恢复为原始状态的最简单方法是格式化非系统盘,也许还要重新安装操作系统,但是如果您 ...

  8. 苹果怎么强制恢复出厂_主板电池放电清BIOS恢复出厂设置怎么操作?配图文

    一般电脑的基本设置.硬件参数都在BIOS中进行设置,有时设置不当会导致电脑无法开机,此时我们就有必要对电脑进行清BIOS操作了,其中比较简单的就是主板电池放电了,BIOS信息依靠主板电池供电储存在cm ...

  9. 600度近视眼恢复方法_高度近视600度如何恢复视力?这三大办法

    近视其实有3个门槛,很多人都不甚了解. 近视度数低于300度,为轻度近视: 近视度数高于300度,低于600度,为中度近视: 近视度数高于600度,为高度近视. 近视度数高不等同于高度近视,从对实际生 ...

最新文章

  1. ML.NET机器学习、API容器化与Azure DevOps实践(四):持续集成与k8s持续部署
  2. python 入门到实践期末考试常出现的考试内容_Python编程入门到实践—列表篇(一)...
  3. 织梦文章添加字段填栏目id,内容页调用字段里的栏目文章
  4. LeetCode 1209. 删除字符串中的所有相邻重复项 II(栈)
  5. XML文件的读取(XmlParserDemo)
  6. Nginx+Tomcat搭建高性能负载均衡集群
  7. ASP.NET MVC:UrlHelper.cs
  8. css html设计网页完整代码,htmlcss完整的网页代码
  9. JSP和Servlet传值中文乱码解决
  10. ldap 统一认证 java_LDAP统一认证
  11. html中空格符号以及空格字符实体的总结
  12. Ansible事实变量常见fact
  13. Latex制作三线表 Latex制作复杂表格 加彩色边框高亮显示
  14. 第十四期公关大讲堂:公关稿件写作理念、方法与技巧.
  15. apt-get安装包失败提示The following packages have unmet dependencies
  16. Flink 结合 布隆过滤器(BloomFilter) 实现去重
  17. 无人驾驶公司实力排名---自动驾驶初创企业排名(roadstar.ai、pony.ai、momenta、景驰和驭势科技等)
  18. Jenkins + Gitlab+ Docker + SpringBoot 构建流水线
  19. Android Camera开发:给摄像头预览界面加个ZoomBar(附完整代码下载)
  20. 【Orangepi Zero2 全志H616】OLED屏应用/IIC协议

热门文章

  1. php和js哪个更像C语言,js和php存在着什么区别
  2. Java B2B2C多用户商城 springboot架构 (五)springboot整合 beatlsql
  3. php 中 stream_select 中的小窟窿.
  4. appium===安卓SDK下载很慢的解决办法
  5. PHP生成缩略图(2)--等比缩略图
  6. 用C#完成Swift远程推送通知
  7. 关于ORACLE MYSQL NOT IN和NOT exists需要注意的 NULL值
  8. 如何修复在Microsoft Azure中“虚拟机防火墙打开,关闭RDP的连接端口”问题
  9. Entity Framework 4 in Action读书笔记——第四章:使用LINQ to Entities查询:使用函数...
  10. sendmail for linux