为了有效地维护服务器,服务器管理员必须执行主动的硬件和软件检查。而服务器的维护清单必须包括除尘、日志查看、软件补丁程序测试等。

即使具有服务器的性能和冗余功能,增加的工作负载整合和可靠性期望也会对服务器硬件造成损害。

服务器维护清单应涵盖物理元素以及系统的软件层配置。还必须考虑到以下事实:彻底维护需要的时间、人工时间和测试。使用清单有助于服务器管理员定义目标,并保持IT团队的正常运转。

1.制定维护程序

服务器管理员经常忽略计划维护窗口。不要等到出现故障时才开始维护;要留出时间进行例行的服务器预防性维护。

维护频率取决于服务器设备的使用年限、数据中心和需要维护的服务器数量。例如,与部署在高效微粒空气过滤、冷却良好的数据中心中的新服务器相比,位于设备柜中的老旧服务器需要更频繁的检查。

组织可以根据供应商或第三方提供商的例行程序制定例行维护计划;如果供应商的服务合同每四个月或六个月要求进行系统检查,需要遵循这个时间表。

2.为准备停机做好准备

解决服务器维护清单上的项目之前,首先需要制定计划。这包括检查系统日志中是否有需要更加直接关注的错误或事件。如果系统日志表明特定内存模块有错误,则应订购替换的双列直插式内存(DIMM)并将其安装。同样,如果有可用的固件、操作系统或代理补丁/更新,请在计划的维护窗口之前先进行测试和审查。

制定明确的计划以使系统脱机并使其恢复服务。在进行虚拟化之前,服务器及其驻留的应用程序将需要停机才能容纳维护窗口,但这迫使服务器管理员在晚上或周末实施维护。

虚拟服务器支持迁移工作负载而不是停机,因此服务器管理员可以将应用程序迁移到其他服务器,并且只要在底层主机系统上进行服务器维护,它们就将保持可用状态。在维修之前,需要首先了解虚拟机的去向,将虚拟机迁移到选定的系统,并在关闭服务器进行维护之前验证每个工作负载是否正常运行。

此时,服务器管理员可以关闭服务器并将其从机架中移除。

3.检查气流路径

在服务器宕机之后,需要目视检查其外部和内部气流路径。清除所有可能阻碍冷却空气的积尘和碎屑。

从外部空气入口和出口开始,然后进入系统机箱,查看CPU散热器和风扇部件、内存,以及所有冷却风扇叶片和风道。从机架上卸下服务器之后,需要确保服务器清洁。采用干净、干燥的压缩空气清除防静电工作区上的灰尘或碎屑。

除尘并不是一个新的过程,但仍然是必要的。灰尘是一种绝热材料,因此去除灰尘尤为重要,因为替代的冷却方案和美国供暖、制冷和空调工程师学会(ASHRAE)的建议已提高了数据中心的工作温度。灰尘和其他气流障碍会导致服务器消耗更多的能量,甚至可能导致组件故障。

4.检查本地硬盘

服务器依靠内部硬盘进行引导、工作负载启动和存储以及用户数据。磁盘介质问题损害了工作负载的性能和稳定性,并导致硬盘过早故障。使用“检查硬盘”实用程序之类的工具来验证硬盘的完整性,并尝试恢复硬盘上的任何坏的扇区。

采用磁性媒质的硬盘并不完美。其常见的问题包括损坏扇区和碎片化。在发生存储错误后,RAID在保持数据完整性方面有很大的进步,但体积较小的1U机架服务器无法提供足够的物理空间来部署硬盘阵列。

只要NT文件系统和文件分配表硬盘文件碎片不会消失,只要文件系统使用第一个可用集群的硬盘空间即可。碎片会减慢服务器硬盘的速度并导致故障。Optimize-Volume实用程序WindowsServer2016对存储层进行碎片整理和处理。

5.验证日志数据和事件

服务器在事件日志中记录了大量的事件信息。没有仔细检查系统、恶意软件和其他事件日志,没有服务器维护清单是不完整的。当然,关键的系统问题应立即引起管理人员和技术人员的注意,但无数小问题可能预示着长期的问题。

在检查日志时,管理员应检查报告设置并验证正确的警报和警报接收者。例如在检查日志时,管理员应检查报告设置,并验证正确的警报和警报接收者。例如,如果技术人员离开服务器组,则需要更新服务器的报告系统。

还要仔细检查联系方式。如果错误发生在工作时间之外,则向技术人员所在公司的电子邮件地址提供发生错误的报告将是无效的。

当日志检查发现长期或重复出现的问题时,主动调查可以在问题升级之前解决问题。如果服务器的日志报告内存中的可恢复错误,它将不会触发严重警报。但是,如果有重复的情况表明模块出现问题,则管理员可以执行更详细的分析,以识别即将发生的故障。

如果问题不够严重,不会关闭服务器,管理员可以将服务器恢复到生产状态,直到出现替换硬件。

6.测试补丁和更新

服务器的软件栈(BIOS、操作系统、管理程序、驱动程序和应用程序)必须协同工作。不幸的是,软件代码很少是没有问题的,所以这一难题的部分经常被修补或更新,以修复错误、提高安全性、简化互操作性,以及提高性能。

任何软件都不应具有自动更新。管理员应确定是否需要修补程序或升级,然后彻底评估和测试更改。

软件开发人员可能无法测试每种可能的硬件和软件组合,因此需要明智地选择补丁和更新,以避免性能问题或工作流程中断。例如,监视代理程序补丁可能会导致重要的工作负载问题,因为新代理程序占用的带宽比预期的要多。

向DevOps的迁移具有较小且更频繁的更新,这增加了出现问题的可能性。组织仍必须在实验室中测试任何修补程序或更新,然后才能将其部署到沙盒或测试安装程序中,并且始终具有还原原始软件配置的能力。

7.记录所有系统更改

在维护时段内,服务器可能会发生很多事情,例如硬件、软件或系统配置更改。服务器管理员完成服务器维护清单后,对他们进行仔细检查并记录所有新系统状态至关重要。例如,更改网络适配器、添加或更换内存或更新操作系统会更改系统的配置。

依赖系统配置管理工具的组织可能需要更新或发现任何更改,在允许系统重新投入使用之前,将这些更改记录到配置管理数据库中。服务器管理员必须更新任何强制的或所需的状态配置状态,以允许进行更改。

还要验证系统的安全状态,例如防火墙设置、反恶意软件版本或扫描频率和入侵检测设置。安全检查确保系统软件的更改不会无意间暴露出在先前配置中关闭的所有攻击面。

服务器重新联机后,不要忘记更新任何系统备份或灾难恢复(DR)内容。

验证服务器的备份/灾难恢复频率保持不变,除非必须特别调整任何相关设置以反映服务器的新用例。

原文来自:http://www.jifang360.com/news/20191227/n2517126492.html

本文地址:https://www.linuxprobe.com/server-maintenance-steps.html编辑:冯瑞涛,审核员:逄增宝

Linux命令大全:https://www.linuxcool.com/

官方站点:www.linuxprobe.com

 Linux命令大全:www.linuxcool.com

Linux系统下载站:www.linuxdown.com

刘遄老师QQ:5604922

Linux技术交流群:193666693

(新群,火热加群中……)

书籍在线学习(电脑阅读效果佳):

http://www.linuxprobe.com/chapter-00.html

想要学习Linux系统的读者可以点击按钮来了解书籍《Linux就该这么学》,同时也非常适合专业的运维人员阅读,成为辅助您工作的高价值工具书!

linux服务器配置与管理_服务器维护实施步骤相关推荐

  1. linux vim 添加注释_服务器维护Linux Vim批量注释和自定义注释快捷键

    如何做好服务器维护?北京艾锑无限科技与你谈谈IT人员必须知道的服务器维护信息 服务器维护小知识使用 Vim 编辑shell脚本,在进行调试时,需要进行多行的注释,每次都要先切换到输入模式,在行首输入注 ...

  2. linux服务器配置与管理_你需要知道什么才能成为系统管理员? | Linux 中国

    通过获得这些起码的能力,开始你的系统管理员职业.-- Seth Kenlon 昔日的系统管理员整天都在调教用户和摆弄服务器,一天的时间都奔波在几百米长的电缆之间.随着云计算.容器和虚拟机的复杂性的增加 ...

  3. linux服务器配置与管理_【13】进大厂必须掌握的面试题-配置管理面试 - Java架构师社区...

    Q1.配置管理流程的目标是什么? 配置管理(CM)的目的是通过使开发或部署过程可控和可重复,从而创建更高质量的产品或系统,来确保产品或系统在其整个生命周期中的完整性.CM流程允许对系统信息和系统更改进 ...

  4. linux服务器配置python环境_服务器python环境配置福利,CentOS ,Linux 一键下载python3和环境配置...

    很多新手对于linux 系统很是费解,通常下一个环境就需要大半天,中途还会出现各种这样的问题 ,干脆写一个脚本一键配置python环境 shell 脚本start.sh: #!/bin/bash yu ...

  5. Linux服务器配置和管理:虚拟机安装CentOS6.7

    2019独角兽企业重金招聘Python工程师标准>>> 原文地址:http://lawlietfans.coding.me/blog/2016/02/29/introduction- ...

  6. Linux服务器配置与管理项目教程(CentOS7 /RHEL 7)(第三版)题库带答案

    Linux服务器配置与管理项目教程 (CentOS7 /RHEL 7)(第三版)微课版 第1篇   系统安装与网络配置 项目1  安装CentOS 服务器 项目2  配置Linux基础网络 不积跬步, ...

  7. Linux服务器配置与管理

    Linux服务器配置与管理 RHEL6的安装 .登录.注销.退出 安装并启动VMware软件: 2 2.根据要求配置CPU.内存.硬盘类型和容量.网络连接方式.总线.其他硬件等的虚拟机环境: 3.加载 ...

  8. Linux服务器配置与管理:Linux基础

    参考自 MOOCLinux服务器配置与管理 目录 一.Linux发展历史 1.1 Unix 1.2 Minix 1.3 Linux 1.4 POSIX 1.5 GNU 二.Linux内核版本 三.Li ...

  9. Linux Shell脚本专栏_服务器系统配置初始化脚本_01

    文章目录 一.服务器系统配置初始化 1. 设置时区并同步时间 ① 脚本编写 ②脚本说明 2. 禁用selinux ① 脚本编写 ②脚本说明 3. 关闭防火墙 ① 脚本编写 ②脚本说明 4. 历史命令显 ...

最新文章

  1. 获取序列全排列Java,java中全排列的生成算法汇总
  2. 死磕Java多线程(五)---理解CPU高速缓存的工作原理 《JAVA性能优化权威指南》 提到过CPU高速缓存未命中率影响线程切换频率
  3. java类成员初始化_简单了解Java类成员初始化顺序
  4. WebSocket服务器TransactionID_SiteDetailMap的析构工作
  5. leetcode111. 二叉树的最小深度
  6. C++:听说C++很难学?该怎么学习C++?
  7. 电梯停靠问题---------------给你出道题
  8. TIOBE 6 月编程语言排行榜:Java 放缓,C 复兴了!
  9. 数据结构_满二叉树、完全二叉树、二叉排序树、平衡二叉树
  10. Mac电脑怎么设置动态桌面,heic动态桌面壁纸怎么使用
  11. 肥姐沈殿霞离世追悼会时间待定 为女儿留下上亿遗产
  12. Chapter3-线性模型线性模型
  13. 2023浙江工商大学计算机考研信息汇总
  14. 苹果13mini和苹果13参数对比选哪个 苹果13mini和苹果13的区别
  15. 如何知道php是32位还是64位,怎么看电脑是32位还是64位详细介绍
  16. pe卸载linux系统软件,ciscodk教你卸载Linux软件
  17. lua 阿拉伯数字转大写(一)
  18. 司普沃浅谈油麦菜高产种植技术+管理要点
  19. ubuntu和win10双系统安装教程
  20. 利用Blensor模拟扫描生成点云

热门文章

  1. java 播放swf_我用java写了一个播放swf动画的类运行时报错了,代码和报错如下…...
  2. python中的__slots__
  3. mysql多种join_MySQL的几种Join
  4. 美团容器平台架构及容器技术实践
  5. 技术动态 | 知识图谱上的实体链接
  6. 论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法
  7. 论文浅尝 | 基于神经网络的知识推理
  8. Android官方开发文档Training系列课程中文版:通过NFC共享文件之发送文件到另一台设备
  9. 论文阅读课5-DocRED: A Large-Scale Document-Level Relation Extraction Dataset(大规模文档集关系提取数据集
  10. zookeeper学习入门