linux系统运行状态检查
目录
- 1 CPU状态检查
- 1.1 运行时间
- 1.2 CPU占用率
- 1.3 单核占用率
- 2 内存状态检查
- 2.1 内存占用率
- 2.2 交换分区占用率
- 3 磁盘状态检查
- 3.1 系统磁盘容量占用率
- 3.2 磁盘健康状态
- 3.3 磁盘读速率
- 3.4 磁盘写速率
- 3.5 磁盘每秒IO数
- 3.6 磁盘使用率
- 4 网卡状态检查
- 4.1 网卡链路状态
- 4.2 网卡启用状态
- 4.3 网卡速率
- 4.4 网卡双工状态
- 4.5 网卡发送速率
- 4.6 网卡接收速率
- 5 其他检查
- 5.1 CORE文件个数
- 5.2 时间同步状态
- 5.3 系统log日志查看
1 CPU状态检查
1.1 运行时间
信息:
运行时间 / Uptime
工具:
uptime
示例:
[root@paris ~]# uptime17:03:12 up 2 days, 20:08, 7 users, load average: 0.06, 0.05, 0.00
处理方法:
如小于预期,则深究
1.2 CPU占用率
信息:
CPU占用率 / CPU Usage
工具:
sar -P ALL 2 5
#每隔两秒对CPU的占用率采样一次,连续采样五次,最后打印出CPU总的以及每个核的占用情况
示例:
[root@TVLD2 ~]# sar -P ALL 2 5 Linux 2.6.18-128.el5 (TVLD2) 10/20/2018 Average: CPU %user %nice %system %iowait %steal %idle Average: all 17.42 0.00 17.92 0.00 0.00 64.66 Average: 0 19.20 0.00 4.80 0.00 0.00 76.00 Average: 1 23.30 0.00 8.30 0.00 0.00 68.40 Average: 2 6.20 0.00 45.40 0.00 0.00 48.40 Average: 3 21.08 0.00 13.09 0.00 0.00 65.83
计算方法:
CPU占用率 = 100% - %idle
处理方法:
如与预期不符或高于90%,则深究
1.3 单核占用率
信息:
单核占用率 / Core Usage
工具:
sar -P ALL 2 5
#每隔两秒对CPU的占用率采样一次,连续采样五次,最后打印出CPU总的以及每个核的占用情况
计算方法:
CPU单核占用率 = 100% - 单核%idle
处理方法:
如与预期不符或高于90%,则深究
2 内存状态检查
2.1 内存占用率
信息:
内存占用率 / Memory Usage
工具:
free
示例:
[root@TVLD2 ~]# freetotal used free shared buffers cached Mem: 510536 503232 7304 0 98656 297196 -/+ buffers/cache: 107380 403156 Swap: 1048568 0 1048568
计算方法:
内存占用率 = (used - buffers – cached) / total * 100%
处理方法:
如与预期不符或高于90%,则深究
2.2 交换分区占用率
信息:
交换分区 / Swap Usage
工具:
free
示例:
[root@TVLD2 ~]# freetotal used free shared buffers cached Mem: 510536 503232 7304 0 98656 297196 -/+ buffers/cache: 107380 403156 Swap: 1048568 0 1048568
计算方法:
内存占用率 = (swap used / swap total ) * 100%
处理方法:
如与预期不符或高于0%,则深究
3 磁盘状态检查
3.1 系统磁盘容量占用率
信息:
系统磁盘容量占用率 / Sys Disk Usage
工具:
df -h
示例:
[root@VODLD ~]# df -h Filesystem Size Used Avail Use% Mounted on /dev/md0 902G 32G 824G 4% / tmpfs 3.9G 0 3.9G 0% /dev/shm /dev/md1 9.9T 7.3T 2.2T 78% /opt/fonsview/NE/vodld/data
统计方法:
根据设备名进行统计
/dev/md0 4%
/dev/md1 78%
处理方法:
如与预期不符或高于95%,则深究
3.2 磁盘健康状态
信息:
磁盘健康状态 / Health Check
工具:
fdisk -l #获取磁盘设备名列表
smartctl -H /dev/sdX #查看具体磁盘的健康状态
示例:
[root@london data]# smartctl -H /dev/sdc smartctl version 5.38 [x86_64-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED [root@london data]# smartctl -Hc /dev/sda smartctl 5.40 2010-10-16 r3189 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL DATA. Failed Attributes: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 035 030 051 Pre-fail Always FAILING_NOW 96231
取值:
PASSED 表示磁盘健康
FAILED 表示磁盘不健康
统计方法:
根据设备名显示磁盘健康状态
处理方法:
如果FAILED!,立即更换磁盘
3.3 磁盘读速率
信息:
磁盘10秒内的平均读速率 / Read Rate
工具:
sar -dp 2 5
示例:
[root@london data]# sar -dp 2 5 Linux 2.6.18-128.el5 (london.sz.fonsview.com) 10/20/2018 Average: DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util Average: sda 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda1 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdb 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb1 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdc 16.20 16519.40 0.00 1019.72 0.14 8.37 7.38 11.96 Average: sdd 15.50 15872.00 0.00 1024.00 0.15 9.86 7.59 11.76 Average: sde 15.60 15974.40 0.00 1024.00 0.13 8.19 7.47 11.66 Average: sdf 15.00 15261.90 0.00 1017.46 0.13 8.79 7.67 11.51
计算方法:
磁盘读速率 = (rd_sec/s) / 2
统计方法:
显示每块磁盘10秒内的平均读速率
处理方法:
如与预期不符或大于50MB/s,则深究
3.4 磁盘写速率
信息:
磁盘10秒内的平均写速率 / Write Rate
工具:
sar -dp 2 5
示例:
[root@london data]# sar -dp 2 5 Linux 2.6.18-128.el5 (london.sz.fonsview.com) 10/20/2018 Average: DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util Average: sda 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda1 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdb 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb1 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdc 16.20 16519.40 0.00 1019.72 0.14 8.37 7.38 11.96 Average: sdd 15.50 15872.00 0.00 1024.00 0.15 9.86 7.59 11.76 Average: sde 15.60 15974.40 0.00 1024.00 0.13 8.19 7.47 11.66 Average: sdf 15.00 15261.90 0.00 1017.46 0.13 8.79 7.67 11.51
计算方法:
磁盘写速率 = (wr_sec/s) / 2
统计方法:
显示每块磁盘10秒内的平均写速率
处理方法:
如与预期不符或大于40MB/s,则深究
3.5 磁盘每秒IO数
信息:
磁盘每秒IO数 / TPS
工具:
sar -dp 2 5
示例:
[root@london data]# sar -dp 2 5 Linux 2.6.18-128.el5 (london.sz.fonsview.com) 10/20/2018 Average: DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util Average: sda 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda1 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdb 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb1 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdc 16.20 16519.40 0.00 1019.72 0.14 8.37 7.38 11.96 Average: sdd 15.50 15872.00 0.00 1024.00 0.15 9.86 7.59 11.76 Average: sde 15.60 15974.40 0.00 1024.00 0.13 8.19 7.47 11.66 Average: sdf 15.00 15261.90 0.00 1017.46 0.13 8.79 7.67 11.51
统计方法:
显示每块磁盘10秒内的平均每秒IO数
处理方法:
如与预期不符或超过50,则深究
3.6 磁盘使用率
信息:
磁盘使用率 / Disk Utilization
工具:
sar -dp 2 5
示例:
[root@london data]# sar -dp 2 5 Linux 2.6.18-128.el5 (london.sz.fonsview.com) 10/20/2018 Average: DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util Average: sda 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda1 7.60 420.80 70.40 64.63 0.04 5.50 4.43 3.37 Average: sda2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdb 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb1 7.40 444.80 70.40 69.62 0.04 4.95 3.85 2.85 Average: sdb2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: sdc 16.20 16519.40 0.00 1019.72 0.14 8.37 7.38 11.96 Average: sdd 15.50 15872.00 0.00 1024.00 0.15 9.86 7.59 11.76 Average: sde 15.60 15974.40 0.00 1024.00 0.13 8.19 7.47 11.66 Average: sdf 15.00 15261.90 0.00 1017.46 0.13 8.79 7.67 11.51
计算方法:
磁盘使用率 = %util
统计方法:
显示每块磁盘10秒内的平均使用率
处理方法:
如与预期不符或超过70%,则深究
4 网卡状态检查
4.1 网卡链路状态
信息:
网卡链路状态 / Link Status
取值:
yes 表示检测到链路
no 表示未检测到链路
工具:
ip addr #获取网卡设备名列表
ethtool ethX #查看具体网卡的状态
示例:
[root@paris root]# ethtool eth0 Settings for eth0:Supported ports: [ TP ]Supported link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/FullSupports auto-negotiation: YesAdvertised link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/FullAdvertised auto-negotiation: YesSpeed: 1000Mb/sDuplex: FullPort: Twisted PairPHYAD: 1Transceiver: internalAuto-negotiation: onSupports Wake-on: pumbagWake-on: gCurrent message level: 0x00000001 (1)Link detected: yes
统计方法:
显示每块网卡的链路状态
处理方法:
如与预期不符且未检测到链路,则
a.检查网线是否脱离网口
b.检查网线的另一头是否脱离网口
c.检查网线的另一头的机器是否关机
4.2 网卡启用状态
信息:
网卡启用状态 / NIC Status
取值:
UP 表示网卡已启用
DOWN 表示网卡未启用
工具:
ifconfig ethX #查看具体网卡的状态
示例:
[root@london data]# ifconfig eth0 eth0 Link encap:Ethernet HWaddr 00:15:17:83:F1:58 inet addr:172.16.201.210 Bcast:172.16.201.255 Mask:255.255.255.0inet6 addr: fe80::215:17ff:fe83:f158/64 Scope:LinkUP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1RX packets:10223856 errors:0 dropped:0 overruns:0 frame:0TX packets:1573906 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:10068100799 (9.3 GiB) TX bytes:1008851902 (962.1 MiB)Memory:b8820000-b8840000[root@Sofia3 data]# ifconfig eth1 eth1 Link encap:Ethernet HWaddr 00:25:90:1B:F1:5F BROADCAST MULTICAST MTU:1500 Metric:1RX packets:0 errors:0 dropped:0 overruns:0 frame:0TX packets:0 errors:0 dropped:0 overruns:0 carrier:0collisions:0 txqueuelen:1000RX bytes:0 (0.0 b) TX bytes:0 (0.0 b)Memory:fbde0000-fbe00000
统计方法:
显示每块网卡的启用状态
处理方法:
如与预期不符且网卡DOWN,则尝试ifup该网口
4.3 网卡速率
信息:
网卡速率 / Speed
取值范围:
1000Mb/s
100Mb/s
10Mb/s
Unknown! 表示网卡未启用
工具:
ip addr #获取网卡设备名列表
ethtool ethX #查看具体网卡的速率
示例:
[root@paris root]# ethtool eth0 Settings for eth0:Supported ports: [ TP ]Supported link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/FullSupports auto-negotiation: YesAdvertised link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/FullAdvertised auto-negotiation: Yes Speed: 1000Mb/sDuplex: FullPort: Twisted PairPHYAD: 1Transceiver: internalAuto-negotiation: onSupports Wake-on: pumbagWake-on: gCurrent message level: 0x00000001 (1)Link detected: yes[root@zurich ~]# ethtool eth1 Settings for eth1:Supported ports: [ TP ]Supported link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/Half 1000baseT/FullSupports auto-negotiation: YesAdvertised link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/Half 1000baseT/FullAdvertised auto-negotiation: YesSpeed: Unknown! (0)Duplex: HalfPort: Twisted PairPHYAD: 1Transceiver: internalAuto-negotiation: onSupports Wake-on: gWake-on: gCurrent message level: 0x000000ff (255)Link detected: no
统计方法:
显示每块网卡的速率
处理方法:
如与预期不符,则重启该网口,即先ifdown,再ifup该网口
4.4 网卡双工状态
信息:
网卡双工状态 / Duplex
取值:
Full 表示全双工
Half 表示半双工
工具:
ip addr #获取网卡设备名列表
ethtool ethX #查看具体网卡的速率
示例:
[root@paris root]# ethtool eth0 Settings for eth0:Supported ports: [ TP ]Supported link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/FullSupports auto-negotiation: YesAdvertised link modes: 10baseT/Half 10baseT/Full100baseT/Half 100baseT/Full1000baseT/FullAdvertised auto-negotiation: YesSpeed: 1000Mb/sDuplex: FullPort: Twisted PairPHYAD: 1Transceiver: internalAuto-negotiation: onSupports Wake-on: pumbagWake-on: gCurrent message level: 0x00000001 (1)Link detected: yes
统计方法:
显示每块网卡双工状态
处理方法:
如与预期不符,则深究
4.5 网卡发送速率
信息:
网卡发送速率 / txbyt/s
工具:
sar -n DEV 2 5
示例:
[root@london data]# sar -n DEV 2 5 Linux 2.6.18-128.el5 (london.sz.fonsview.com) 10/20/2018 Average: IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s Average: lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: eth0 5226.50 10013.40 383753.60 15166070.80 0.00 0.00 40.10 Average: eth1 1394.40 7602.00 96752.80 11527150.00 0.00 0.00 0.10 Average: eth2 4479.60 4537.30 307995.40 6881234.20 0.00 0.00 0.10 Average: eth3 3038.80 11563.80 212539.60 17536266.00 0.00 0.00 0.10 Average: eth4 2696.60 7827.60 184527.00 11871126.00 0.00 0.00 0.10 Average: eth5 7789.00 18856.90 534560.60 28600892.20 0.00 0.00 0.10
计算方法:
网卡发送速率 = txbyt/s * 8
统计方法:
显示每块网卡的发送速率
4.6 网卡接收速率
信息:
网卡接收速率 / rxbps
工具:
sar -n DEV 2 5
示例:
[root@london data]# sar -n DEV 2 5 Linux 2.6.18-128.el5 (london.sz.fonsview.com) 10/20/2018 Average: IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s Average: lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00 Average: eth0 5226.50 10013.40 383753.60 15166070.80 0.00 0.00 40.10 Average: eth1 1394.40 7602.00 96752.80 11527150.00 0.00 0.00 0.10 Average: eth2 4479.60 4537.30 307995.40 6881234.20 0.00 0.00 0.10 Average: eth3 3038.80 11563.80 212539.60 17536266.00 0.00 0.00 0.10 Average: eth4 2696.60 7827.60 184527.00 11871126.00 0.00 0.00 0.10 Average: eth5 7789.00 18856.90 534560.60 28600892.20 0.00 0.00 0.10
计算方法:
网卡接收速率 = rxbyt/s * 8
统计方法:
显示每块网卡的接收速率
5 其他检查
5.1 CORE文件个数
信息:
CORE文件个数 / Core Files
工具:
ls -l /core*|wc -l
示例:
[root@paris data]# ls -l /core*|wc -l 2
统计方法:
显示CORE文件个数
处理方法:
应用程序曾经出错重启,请深究。
5.2 时间同步状态
信息:
时间同步状态 / NTP Syn Status
工具:
ntpq -p
示例:
同步成功:标有*号的行表示当前使用的服务器
[root@Sofia2 info_collector]# ntpq -pn remote refid st t when poll reach delay offset jitter ========================================================================= *221.7.129.79 210.72.145.44 2 u 40 64 37 107.377 21.054 9.256210.72.145.44 .ACTS. 1 u 109 16 12 82.456 11.099 3.804
NTP服务未启动:
[root@Sofia2 info_collector]# ntpq -pn ntpq: read: Connection refused
同步不成功:
[root@Sofia2 info_collector]# ntpq -pn remote refid st t when poll reach delay offset jitter ==============================================================================221.7.129.79 210.72.145.44 2 u 22 64 7 116.205 37.519 18.623210.72.145.44 .INIT. 16 u - 64 0 0.000 0.000 0.000202.120.2.101 61.153.197.226 3 u 24 64 7 52.665 112.022 11.560133.100.11.8 .GPS. 1 u 21 64 5 335.591 12.114 4.22266.92.68.246 .INIT. 16 u - 64 0 0.000 0.000 0.000
取值:
SYN: 同步
UNSYN: 未同步
统计方法:
显示CORE文件个数
处理方法:
恢复正常时间同步
5.3 系统log日志查看
信息:
kernel 是否有Erro
工具:
vim /var/log/messages
事例:
主要查看message日志的 kernel 和应用进程日志中是否有 erro 和异常的显示,最常见的第三方应用软件的相关如UCARP VRRP NTP等状态变更都会有显示,当磁盘、主板在出现异常的时候也会有显示。
转载于:https://www.cnblogs.com/wenquanli/p/9923785.html
linux系统运行状态检查相关推荐
- linux 查看san链路状态,linux系统运行状态检查
1 CPU状态检查 1.1 运行时间 信息: 运行时间 / Uptime 工具: uptime 示例: [root@paris ~]# uptime 17:03:12 up 2 days, 20:08 ...
- linux中检测用户信息的命令是,在Linux系统上检查用户所属组
Linux 管理员经常进行的一项操作之一:那就是把用户添加到现有组,这是在一些大环境工作的 Linux 管理员日常经常从事的操作之一,所以经常会在 Linux 系统上检查用户所属组,本文就来谈谈这方面 ...
- 查看Linux系统运行状态(命令汇总)
查看Linux系统运行状态命令汇总 目录 1.top命令:实时显示进程状态用户(查看谁最占用cpu, 谁最占用资源等) 2.df -h 命令:查看各分区使用情况 3.free -m命令:查看内存使用量 ...
- linux 扫描开放的端口命令,在Linux系统中检查(扫描)开放端口的方法
无论是对网络连接问题进行故障排除还是配置防火墙,首先要检查的是在系统上实际打开的端口,本文介绍几种查找系统外部打开端口的方法,即在Linux系统中检查(扫描)开放端口. 什么是开放端口 侦听端口是应用 ...
- linux系统正常的运行状态是,一种用于监控Linux系统运行状态的监控系统及方法...
一种用于监控Linux系统运行状态的监控系统及方法 [技术领域] [0001]本发明涉及Linux系统,尤其涉及对Linux系统进行实时监控的系统及方法. [背景技术] [0002]通常服务器领域.通 ...
- cpu使用率 htop显示_用top、vmstat、Htop、sar命令在Linux系统中检查CPU使用率/利用率...
本文介绍使用top.vmstat.Htop.sar命令在Linux操作系统中检查CPU使用率/利用率,其实也可以在图形界面中通过工具查看的,可参考使用Stress Terminal UI在Linux终 ...
- nvidia命令不可用linux,如何在Linux系统上检查NVIDIA驱动程序版本
您可能没有几处地方可以查看Linux系统上安装的NVIDIA驱动程序. NVIDIA X服务器设置 让我们从最明显的尝试开始,通过运行来找出NVIDIA驱动程序版本NVIDIA X server se ...
- linux系统定时检查网络状态python脚本
有时需要使用ping命令检查网络通断,如果需要检查的网络主机比较多,使用脚本自动检查就比较方便. vim test.py //创建一个.py文件 test.py代码: 1 #导入所需模块 2 impo ...
- 安全运维 | Linux系统基线检查
声明:本人坚决反对利用文章内容进行恶意攻击行为,一切错误行为必将受到惩罚,绿色网络需要靠我们共同维护,推荐大家在了解技术原理的前提下,更好的维护个人信息安全.企业安全.国家安全. 1 查询系统信息 1 ...
最新文章
- 童心制物(Makeblock)受邀参加2020年韩国机器人世界展览会,倡导以先进的STEAM教育培养未来复合型人才
- CodeForces 416B
- nodejs与npm版本对应表
- C#文件操作基础之File类和FileInfo类
- 计算机与环境科学,计算机在环境科学与工程方向的应用
- 数据结构基础(4) --快速排序
- 选数(洛谷-P1036)
- NYOJ-非洲小孩(贪心)
- power bi可视化表_在Power BI报表视图中创建可视化
- 电磁场仿真——绘制电场线和等势线
- 分享:破解还原精灵的几个小技巧(转)
- sql server中的架构,模式,用户,角色,登录名,所有者,登录名,dbo之间的关系
- 已解决-安装CentOS 7时No Caching mode page found和Assuming drive cache:write through报错问题
- 深度学习中的 Batch_Size,以及learning rate参数理解(跑pytorch代码时遇到的问题)
- MSSQL2019+Linux7, The SQLServerAgent is not currently running, so it cannot be notified of this
- 『杭电1982』Kaitou Kid - The Phantom Thief (1)
- git bash无法复制和黏贴
- 申报须知,2022年滁州市各区县高新技术企业奖励政策变化,明光市
- 查看webpack版本
- 基于Matlab遗传算法工具箱解决物流中心选址