linux系统常用性能参数命令
CPU
cpu.idle:CPU或CPU处于空闲状态且系统没有未完成的磁盘I/O请求的时间百分比。
cpu.busy:与cpu.idle相对,他的值等于100减去cpu.idle。
cpu.guest:CPU或CPU运行虚拟处理器所花费的时间百分比。
cpu.iowait:系统IOwait 等待
cpu.irq:CPU或CPU为硬件中断服务所花费的时间百分比。
cpu.softirq:CPU或CPU为软件中断服务所花费的时间百分比。
cpu.nice:在具有nice优先级的用户级执行时发生的CPU利用率百分比。
cpu.steal:虚拟机监控程序为另一个虚拟处理器提供服务时,虚拟CPU或CPU非自愿等待所花费的时间百分比。
cpu.system:在系统级(内核)执行时发生的CPU利用率百分比。
cpu.user:在用户级(应用程序)执行时发生的CPU利用率百分比。
cpu.cnt:cpu核数。
cpu.switches:cpu上下文切换次数,计数器类型。
1、top命令
top命令
是Linux下常用的性能分析工具
,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器
。
top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态,如果在前台执行该命令,它将独占前台,直到用户终止该程序为止。
比较准确的说,top命令提供了实时的对系统处理器的状态监视,它将显示系统中CPU最"敏感"
的任务列表,该命令可以按CPU使用,内存使用和执行时间对任务进行排序,而且该命令的很多特性都可以通过交互式命令或者在个人定制文件中进行设定。
1.1、命令格式:
top [参数]
1.2、命令功能:
显示当前系统正在执行的进程的相关信息,包括进程ID
、内存占用率
、CPU占用率
等
1.3、命令参数:
-b 批处理
-c 显示完整的治命令
-I 忽略失效过程
-s 保密模式
-S 累积模式
-i<时间> 设置间隔时间
-u<用户名> 指定用户名
-p<进程号> 指定进程
-n<次数> 循环显示的次数
1.4、使用实例:
实例1:显示进程信息
命令:top
输出:
[root@TG1704 log]# top
top - 14:06:23 up 70 days, 16:44, 2 users, load average: 1.25, 1.32, 1.35
Tasks: 206 total, 1 running, 205 sleeping, 0 stopped, 0 zombie
Cpu(s): 5.9%us, 3.4%sy, 0.0%ni, 90.4%id, 0.0%wa, 0.0%hi, 0.2%si, 0.0%st
Mem: 32949016k total, 14411180k used, 18537836k free, 169884k buffers
Swap: 32764556k total, 0k used, 32764556k free, 3612636k cachedPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
28894 root 22 0 1501m 405m 10m S 52.2 1.3 2534:16 java
18249 root 18 0 3201m 1.9g 11m S 35.9 6.0 569:39.41 java 2808 root 25 0 3333m 1.0g 11m S 24.3 3.1 526:51.85 java
25668 root 23 0 3180m 704m 11m S 14.0 2.2 360:44.53 java 574 root 25 0 3168m 611m 10m S 12.6 1.9 556:59.63 java 1599 root 20 0 3237m 1.9g 11m S 12.3 6.2 262:01.14 java 1008 root 21 0 3147m 842m 10m S 0.3 2.6 4:31.08 java
13823 root 23 0 3031m 2.1g 10m S 0.3 6.8 176:57.34 java
28218 root 15 0 12760 1168 808 R 0.3 0.0 0:01.43 top
29062 root 20 0 1241m 227m 10m S 0.3 0.7 2:07.32 java 1 root 15 0 10368 684 572 S 0.0 0.0 1:30.85 init 2 root RT -5 0 0 0 S 0.0 0.0 0:01.01 migration/0 3 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0 4 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/0 5 root RT -5 0 0 0 S 0.0 0.0 0:00.80 migration/1 6 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/1 7 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/1 8 root RT -5 0 0 0 S 0.0 0.0 0:20.59 migration/2 9 root 34 19 0 0 0 S 0.0 0.0 0:00.09 ksoftirqd/2 10 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/2 11 root RT -5 0 0 0 S 0.0 0.0 0:23.66 migration/3 12 root 34 19 0 0 0 S 0.0 0.0 0:00.03 ksoftirqd/3 13 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/3 14 root RT -5 0 0 0 S 0.0 0.0 0:20.29 migration/4 15 root 34 19 0 0 0 S 0.0 0.0 0:00.07 ksoftirqd/4 16 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/4 17 root RT -5 0 0 0 S 0.0 0.0 0:23.07 migration/5 18 root 34 19 0 0 0 S 0.0 0.0 0:00.07 ksoftirqd/5 19 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/5 20 root RT -5 0 0 0 S 0.0 0.0 0:17.16 migration/6 21 root 34 19 0 0 0 S 0.0 0.0 0:00.05 ksoftirqd/6 22 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/6 23 root RT -5 0 0 0 S 0.0 0.0 0:58.28 migration/7
说明:
前五行是当前系统情况整体的统计信息区。
第一行:top<—>任务队列信息,同uptime
命令的执行结果
14:06:23 <---> 当前系统时间
up 70 days, 16:44 <---> 系统已经运行了70天16小时44分钟
2 users <---> 当前有2个用户登录系统
load average: 1.15, 1.42, 1.44 <---> 后面的三个数分别是1分钟、5分钟、15分钟的负载情况load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。
如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转。
第二行:Tasks<—>任务(进程)
系统现在共有206个进程:
运行(running)的任务1个;
休眠(sleep)的任务205个;
停止(stoped)的状态0个;
僵尸(zombie)的状态0个。
第三行:%cpu(s)<—>CPU状态信息
5.9% us <---> 用户空间占用CPU的百分比
3.4% sy <---> 内核空间占用CPU的百分比
0.0% ni <---> 改变过优先级的进程占用CPU的百分比
90.4% id <---> 空闲CPU百分比
0.0% wa <---> IO等待占用CPU的百分比
0.0% hi <---> 硬中断(Hardware IRQ)占用CPU的百分比
0.2% si <---> 软中断(Software Interrupts)占用CPU的百分比
0.2% st <---> 虚拟机监控程序为另一个虚拟处理器提供服务时,虚拟CPU或CPU非自愿等待所花费的时间百分比
注: 在这里CPU的使用比率和windows概念不同,需要理解linux系统用户空间和内核空间的相关知识!
第四行:KiB Mem)<—>内存状态
32949016k total <---> 物理内存总量(32GB)
14411180k used <---> 使用中的内存总量(14GB)
18537836k free <---> 空闲内存总量(18GB)
169884k buffers <---> 缓存的内存量(169M)
第五行:KiB Swap<—>交换分区信息:
32764556k total <---> 交换区总量(32GB)
0k used <---> 使用的交换区总量(0K)
32764556k free <---> 空闲交换区总量(32GB)
3612636k cached <---> 缓冲的交换区总量(3.6GB)
注意:
内存总量(used)
指的是现在系统内核控制
的内存数;
空闲内存总量(free)
是内核还未纳入
其管控范围的数量
纳入内核管理的内存不见得都在使用中,还包括过去使用过的
、现在可以被重复利用
的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。
如果出于习惯去计算可用内存数,这里有个近似的计算公式:
第四行的free+第四行的buffers+第五行的cached
按这个公式此台服务器的可用内存:
18537836k +169884k +3612636k = 22GB左右。
对于内存监控,在top里我们要时刻监控第五行swap交换分区的used,如果这个数值在不断的变化,说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。
第六行:空行
第七行以下:各进程(任务)的状态监控
PID <---> 进程id
USER <---> 进程所有者
PR <---> 进程优先级
NI <---> nice值,负值表示高优先级,正值表示低优先级
VIRT <---> 进程使用的虚拟内存总量,单位kb //VIRT=SWAP+RES
RES <---> 进程使用的、未被换出的物理内存大小,单位kb //RES=CODE+DATA
SHR <---> 共享内存大小,单位kb
S <---> 进程状态 //D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU <---> 上次更新到现在的CPU时间占用百分比
%MEM <---> 进程使用的物理内存百分比
TIME+ <---> 进程使用的CPU时间总计,单位1/100秒
COMMAND <---> 进程名称(命令名/命令行)
其他使用技巧:
1、多U多核CPU监控
在top基本视图中,按键盘数字"1"
,可监控每个逻辑CPU
的状况:
top - 20:06:09 up 867 days, 9:49, 1 user, load average: 0.18, 0.30, 0.16
Tasks: 567 total, 1 running, 566 sleeping, 0 stopped, 0 zombie
Cpu0 : 0.0%us, 1.3%sy, 0.0%ni, 98.3%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st
Cpu1 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu2 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu3 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu4 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu5 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu6 : 0.0%us, 0.3%sy, 0.0%ni, 99.7%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu7 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu8 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu9 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu10 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu11 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu12 : 0.0%us, 1.0%sy, 0.0%ni, 99.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu13 : 0.0%us, 0.3%sy, 0.0%ni, 99.7%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu14 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu15 : 0.0%us, 2.0%sy, 0.0%ni, 98.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu16 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu17 : 0.0%us, 1.0%sy, 0.0%ni, 99.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu18 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu19 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu20 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu21 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu22 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu23 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 132046128k total, 68316784k used, 63729344k free, 364180k buffers
Swap: 10485752k total, 416k used, 10485336k free, 62350972k cached
观察上图,服务器有24个逻辑CPU
,实际上是单颗CPU:2C/6T
,再按数字键1
,就会返回到top基本视图界面。
2、高亮显示当前运行进程
敲击键盘b(打开/关闭排序行的加亮效果)
,top的视图变化如下:
进程id为2570的top
进程被加亮了,top进程是视图第二行显示的唯一的运行态(runing)
的那个进程,可以通过敲击y
键关闭或打开运行态进程的加亮效果。
3、进程字段排序
默认进入top时,各进程是按照CPU的占用量来排序的,在下图中进程ID为24773的vagentdc进程排在第一(cpu占用3%),进程ID为24765的vagentdc进程排在第二(cpu占用2.3%)。
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
24773 dsg 20 0 30820 7308 424 S 3.0 0.0 0:10.30 vagentdc
24765 dsg 20 0 30820 7188 424 S 2.3 0.0 0:12.31 vagentdc
24769 dsg 20 0 30820 7296 424 S 1.3 0.0 0:09.82 vagentdc 345 root 39 19 0 0 0 S 1.0 0.0 13243:27 kipmi0
25037 root 20 0 15436 1612 948 R 0.7 0.0 0:00.05 top 5158 zabbix 20 0 81116 2972 2204 S 0.3 0.0 195:32.41 zabbix_agentd
敲击键盘x(打开/关闭排序列的加亮效果)
,top的视图变化如下:
top默认的排序列是%CPU
4、向右或左改变排序列
通过"shift + >"
或"shift + <"
组合键向右或左改变排序列高亮显示
下图是按一次shift + >
的效果图,视图现在已经按照%MEM
来排序:
实例2:显示完整命令
命令:top -c
输出:
top - 20:15:40 up 867 days, 9:58, 1 user, load average: 0.06, 0.08, 0.09
Tasks: 567 total, 2 running, 565 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.2%sy, 0.0%ni, 99.7%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 132046128k total, 71842132k used, 60203996k free, 364180k buffers
Swap: 10485752k total, 416k used, 10485336k free, 65875428k cachedPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
24765 dsg 20 0 30820 7188 424 R 2.7 0.0 0:16.80 ./vagentdc -restore y 35001
24769 dsg 20 0 30820 7296 424 S 2.0 0.0 0:12.83 ./vagentdc -restore y 35001 345 root 39 19 0 0 0 S 1.0 0.0 13243:29 [kipmi0]
24773 dsg 20 0 30820 7308 424 S 1.0 0.0 0:14.16 ./vagentdc -restore y 35001 107 root 20 0 0 0 0 S 0.3 0.0 17:42.40 [events/8] 2947 root 20 0 0 0 0 S 0.3 0.0 36:02.84 [kondemand/6] 5160 zabbix 20 0 81232 2400 1496 S 0.3 0.0 10:52.38 /usr/sbin/zabbix_agentd: listener #2 [waiting for connection]
20397 dsg 20 0 197m 27m 1836 S 0.3 0.0 1188:26 ./dbpsd -home /home/dsg/back_pool/gxptqzk/vcfs1 35000
25119 root 20 0 15436 1620 948 R 0.3 0.0 0:00.08 top -c
29286 root 20 0 43.5g 1.0g 12m S 0.3 0.8 1345:49 /usr/bin/java -Djava.util.logging.config.file=/home/dsg/apache-tomcat-8.0.51/conf/logging.properties
实例3:以批处理模式显示程序信息
命令:top -b
实例4:以累积模式显示程序信息
命令:top -S
实例5:设置信息更新次数
命令:top -n 2
说明:表示更新两次后终止更新显示
实例6:设置信息更新时间
命令:top -d 3
说明:表示更新周期为3秒
实例7:显示指定的进程信息
命令:top -p 5159
输出:
[root@databackserv ~]# top -p 5159
top - 20:21:26 up 867 days, 10:04, 1 user, load average: 0.09, 0.07, 0.08
Tasks: 1 total, 0 running, 1 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.2%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 132046128k total, 71842296k used, 60203832k free, 364180k buffers
Swap: 10485752k total, 416k used, 10485336k free, 65874600k cachedPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 5159 zabbix 20 0 81232 2400 1496 S 0.0 0.0 10:52.60 zabbix_agentd
1.5、top交互命令:
在top命令执行过程中可以使用的一些交互命令,这些命令都是单字母的,如果在命令行中使用了s 选项,其中一些命令可能会被屏蔽。
h 显示帮助画面,给出一些简短的命令总结说明
k 终止一个进程
i 忽略闲置和僵死进程 //这是一个开关式命令
q 退出程序
r 重新安排一个进程的优先级别
S 切换到累计模式
s 改变两次刷新之间的延迟时间(单位为s),如果有小数,就换算成ms,输入0值则系统将不断刷新,默认值是5s
f/F 从当前显示中添加或者删除项目
o/O 改变显示项目的顺序
l 切换显示平均负载和启动时间信息
m 切换显示内存信息
t 切换显示进程和CPU状态信息
c 切换显示命令名称和完整命令行
M 根据驻留内存大小进行排序
P 根据CPU使用百分比大小进行排序
T 根据时间/累计时间进行排序
W 将当前设置写入~/.toprc文件中
2、free命令
free命令
可以显示Linux系统中空闲
的、已用
的物理内
及swap内存
,及被内核使用的buffer
。
在Linux系统监控的工具中,free命令是最经常使用的命令之一。
2.1、命令格式:
free [参数]
2.2、命令功能:
显示当前系统使用和空闲的内存情况,包括物理内存
、交互区内存(swap)
和内核缓冲区内存
,共享内存将被忽略
2.3、命令参数:
-b 以Byte为单位显示内存使用情况
-k 以KB为单位显示内存使用情况
-m 以MB为单位显示内存使用情况
-g 以GB为单位显示内存使用情况
-o 不显示缓冲区调节列
-s <间隔秒数>持续观察内存使用状况
-t 显示内存总和列
-V 显示版本信息
2.4、使用实例:
实例1:显示内存使用情况
命令:free
、free -m
、free -g
、free -h
输出:
[root@databackserv ~]# freetotal used free shared buffers cached
Mem: 132046128 71875396 60170732 0 364180 65869552
-/+ buffers/cache: 5641664 126404464
Swap: 10485752 416 10485336
[root@databackserv ~]# free -mtotal used free shared buffers cached
Mem: 128951 70190 58760 0 355 64325
-/+ buffers/cache: 5509 123441
Swap: 10239 0 10239
[root@databackserv ~]# free -gtotal used free shared buffers cached
Mem: 125 68 57 0 0 62
-/+ buffers/cache: 5 120
Swap: 9 0 9
[root@databackserv ~]#
下面是对这些数值的解释:
total: 总计物理内存的大小
used: 已使用多大
free: 可用有多少
Shared: 多个进程共享的内存总额
Buffers/cached: 磁盘缓存的大小
第三行(-/+ buffers/cached):used: 已使用多大free: 可用有多少
第四行是交换分区swap,也就是我们通常所说的虚拟内存
第二行(mem)的used/free与第三行(-/+ buffers/cache) used/free的区别:
在于使用的角度来看:
第一行指的是从OS的角度来看:对于OS,buffers/cached 都是属于被使用,所以他的可用内存是60170732KB,已用内存是 71875396KB,其中包括,内核(OS)使用+Application(zabbix_agentd,oracle,etc)使用的+buffers+cached。第三行指的是从应用程序角度来看;对于应用程序来说,buffers/cached 是等于可用的,因为buffer/cached是为了提高文件读取的性能,当应用程序需在用到内存的时候,buffer/cached会很快地被回收。从应用程序的角度来说,可用内存=系统free memory+buffers+cached。如本机情况的可用内存为:
60170732KB+364180KB+65869552KB=126404464KB≈120GB
什么时候内存会被交换,以及按什么方交换:
当可用内存少于额定值的时候,就会开会进行交换.如何看额定值:
命令:cat /proc/meminfo
输出:
[root@SF1150 service]# cat /proc/meminfo
MemTotal: 32940112 kB
MemFree: 2096700 kB
Buffers: 4545340 kB
Cached: 11364056 kB
SwapCached: 1896080 kB
Active: 22739776 kB
Inactive: 7427836 kB
HighTotal: 0 kB
HighFree: 0 kB
LowTotal: 32940112 kB
LowFree: 2096700 kB
SwapTotal: 32764556 kB
SwapFree: 30819572 kB
Dirty: 164 kB
Writeback: 0 kB
AnonPages: 14153592 kB
Mapped: 20748 kB
Slab: 590232 kB
PageTables: 34200 kB
NFS_Unstable: 0 kB
Bounce: 0 kB
CommitLimit: 49234612 kB
Committed_AS: 23247544 kB
VmallocTotal: 34359738367 kB
VmallocUsed: 278840 kB
VmallocChunk: 34359459371 kB
HugePages_Total: 0 HugePages_Free: 0 HugePages_Rsvd: 0 Hugepagesize: 2048kB
交换将通过三个途径来减少系统中使用的物理页面的个数:
1. 减少缓冲与页面cache的大小,
2. 将系统V类型的内存页面交换出去,
3. 换出或者丢弃页面(Application 占用的内存页,也就是物理内存不足)。
事实上,少量地使用swap是不是影响到系统性能的。
buffers和cached都是缓存,两者的区别:
为了提高磁盘存取效率,Linux做了一些精心的设计,除了对dentry(目录项)进行缓存(用于VFS,加速文件路径名到inode的转换),还采取了两种主要Cache方式:
`Buffer Cache`和`Page Cache`
前者针对磁盘块的读写,后者针对文件inode的读写,这些Cache有效缩短了 I/O系统调用(比如read,write,getdents)的时间。
磁盘的操作有逻辑级(文件系统)
和物理级(磁盘块)
,这两种Cache就是分别缓存逻辑级数据
和物理级数据
的。
Page cache
实际上是针对文件系统
的,是文件的缓存
,在文件层面上的数据会缓存到page cache,文件的逻辑层需要映射到实际的物理磁盘,这种映射关系由文件系统来完成。
当page cache的数据需要刷新时,page cache中的数据交给buffer cache,因为Buffer Cache就是缓存磁盘块的,但是这种处理在2.6版本的内核之后就变的很简单了,没有真正意义上的cache操作。
Buffer cache
是针对磁盘块的缓存
,也就是在没有文件系统的情况下,直接对磁盘进行操作的数据会缓存到buffer cache中,例如,文件系统的元数据都会缓存到buffer cache
中。
简单说来,buffer cache用来缓存磁盘数据
,page cache用来缓存文件数据
。
在有文件系统的情况下,对文件操作,那么数据会缓存到page cache,如果直接采用dd等工具对磁盘进行读写,那么数据会缓存到buffer cache。
只要不用swap的交换空间,就不用担心自己的内存太少,如果常常swap用很多,可能你就要考虑加物理内存,这也是linux看内存是否够用的标准。
如果是应用服务器的话,一般只看第二行,+buffers/cache,即对应用程序来说free的内存太少了,也是该考虑优化程序或加内存了。
实例2:以总和的形式显示内存的使用信息
命令:free -t
输出:
[root@SF1150 service]# free -t total used free shared buffers cached
Mem: 32940112 30845024 2095088 0 4545340 11364324
-/+ buffers/cache: 14935360 18004752
Swap: 32764556 1944984 30819572
Total: 65704668 32790008 32914660
实例3:周期性的查询内存使用信息
命令:free -s 10
输出:
[root@SF1150 service]# free -s 10total used free shared buffers cached
Mem: 32940112 30844528 2095584 0 4545340 11364380
-/+ buffers/cache: 14934808 18005304Swap: 32764556 1944984 30819572total used free shared buffers cached
Mem: 32940112 30843932 2096180 0 4545340 11364388
-/+ buffers/cache: 14934204 18005908Swap: 32764556 1944984 30819572
3、vmstat命令
vmstat是Virtual Meomory Statistics
(虚拟内存统计)的缩写,可对操作系统的虚拟内存
、进程
、CPU活动
进行监控。
他是对系统的整体情况进行统计,不足之处是无法对某个进程进行深入分析。
vmstat 工具提供了一种低开销的系统性能观察方式,因为vmstat 本身就是低开销工具,在非常高负荷的服务器上,你需要查看并监控系统的健康情况,在控制窗口还是能够使用vmstat 输出结果。
物理内存和虚拟内存区别:
我们知道,直接从物理内存读写数据要比从硬盘读写数据要快的多,因此,我们希望所有数据的读取和写入都在内存完成,而内存是有限的,这样就引出了物理内存与虚拟内存的概念。
物理内存就是系统硬件提供的内存大小,是真正的内存。
相对于物理内存,在linux下还有一个虚拟内存的概念,虚拟内存就是为了满足物理内存的不足而提出的策略,它是利用磁盘空间虚拟出的一块逻辑内存,用作虚拟内存的磁盘空间被称为交换空间(Swap Space)。
作为物理内存的扩展,linux会在物理内存不足时,使用交换分区的虚拟内存,更详细的说,就是内核会将暂时不用的内存块信息写到交换空间,这样以来,物理内存得到了释放,这块内存就可以用于其它目的,当需要用到原始的内容时,这些信息会被重新从交换空间读入物理内存。
linux的内存管理采取的是分页存取机制,为了保证物理内存能得到充分的利用,内核会在适当的时候将物理内存中不经常使用的数据块自动交换到虚拟内存中,而将经常使用的信息保留到物理内存。
要深入了解linux内存运行机制,需要知道下面提到的几个方面:
首先,Linux系统会不时的进行页面交换操作,以保持尽可能多的空闲物理内存,即使并没有什么事情需要内存,Linux也会交换出暂时不用的内存页面。这可以避免等待交换所需的时间。
其次,linux进行页面交换是有条件的,不是所有页面在不用时都交换到虚拟内存,linux内核根据最近最经常使用
算法,仅仅将一些不经常使用的页面文件交换到虚拟内存
有时我们会看到这么一个现象:
linux物理内存还有很多,但是交换空间也使用了很多,这并不奇怪。
例如,一个占用很大内存的进程运行时,需要耗费很多内存资源,此时就会有一些不常用页面文件被交换到虚拟内存中,但后来这个占用很多内存资源的进程结束并释放了很多内存时,刚才被交换出去的页面文件并不会自动的交换进物理内存,除非有这个必要,那么此刻系统物理内存就会空闲很多,同时交换空间也在被使用,就出现了刚才所说的现象了,关于这点,不用担心什么,只要知道是怎么一回事就可以了。
最后,交换空间的页面在使用时会首先被交换到物理内存,如果此时没有足够的物理内存来容纳这些页面,它们又会被马上交换出去,如此以来,虚拟内存中可能没有足够空间来存储这些交换页面,最终会导致linux出现假死机、服务异常等问题,linux虽然可以在一段时间内自行恢复,但是恢复后的系统已经基本不可用了。
因此,合理规划和设计linux内存的使用,是非常重要的。
虚拟内存原理:
在系统中运行的每个进程都需要使用到内存,但不是每个进程都需要每时每刻使用系统分配的内存空间。
当系统运行所需内存超过实际的物理内存,内核会释放某些进程所占用但未使用的部分或所有物理内存,将这部分资料存储在磁盘上直到进程下一次调用,并将释放出的内存提供给有需要的进程使用。
在Linux内存管理中,主要是通过调页Paging
和交换Swapping
来完成上述的内存调度
调页算法是将内存中最近不常使用的页面换到磁盘上,把活动页面保留在内存中供进程使用交换技术是将整个进程,而不是部分页面,全部交换到磁盘上
分页(Page)写入磁盘的过程被称作Page-Out
分页(Page)从磁盘重新回到内存的过程被称作Page-In
当内核需要一个分页时,但发现此分页不在物理内存中(因为已经被Page-Out了),此时就发生了分页错误(Page Fault)。
当系统内核发现可运行内存变少时,就会通过Page-Out来释放一部分物理内存,尽管Page-Out不是经常发生,但是如果Page-out频繁不断的发生,直到当内核管理分页的时间超过运行程式的时间时,系统效能会急剧下降,这时的系统已经运行非常慢或进入暂停状态,这种状态亦被称作thrashing(颠簸)。
3.1、命令格式:
vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
3.2、命令功能:
用来显示虚拟内存
的信息
3.3、命令参数:
-a:显示活跃和非活跃内存
-f:显示从系统启动至今的fork数量
-m:显示slabinfo
-n:只在开始时显示一次各字段名称
-s:显示内存相关统计信息及多种系统活动数量
-delay:刷新时间间隔。如果不指定,只显示一条结果
-count:刷新次数。如果不指定刷新次数,但指定了刷新时间间隔,这时刷新次数为无穷
-d:显示磁盘相关统计信息
-p:显示指定磁盘分区统计信息
-S:使用指定单位显示。参数有 k 、K 、m 、M ,分别代表1000、1024、1000000、1048576字节(byte)。默认单位为K(1024 bytes)
-V:显示vmstat版本信息
3.4、使用实例:
实例1:显示虚拟内存使用情况
命令:vmstat
输出:
[root@localhost ~]# vmstat 5 6
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------r b swpd free buff cache si so bi bo in cs us sy id wa st0 0 0 3029876 199616 690980 0 0 0 2 3 2 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 41 1009 39 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 3 1004 36 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 4 1004 36 0 0 100 0 00 0 0 3029752 199616 690980 0 0 0 6 1003 33 0 0 100 0 0
命令解释:
vmstat 5 6
:表示在5秒时间内进行6次采样,将得到一个数据汇总他能够反映真正的系统情况。
字段说明:
Procs(进程):
r: 运行队列中进程数量
b: 等待IO的进程数量Memory(内存):
swpd: 使用虚拟内存大小
free: 可用内存大小
buff: 用作缓冲的内存大小
cache: 用作缓存的内存大小Swap(交换分区):
si: 每秒从交换区写到内存的大小
so: 每秒写入交换区的内存的大小IO(现在的Linux版本块的大小为1024bytes)
bi: 每秒读取的块数
bo: 每秒写入的块数system(系统):
in: 每秒中断数,包括时钟中断
cs: 每秒上下文切换数
CPU(以百分比表示)
us: 用户进程执行时间(user time)
sy: 系统进程执行时间(system time)
id: 空闲时间(包括IO等待时间),中央处理器的空闲时间 ,以百分比表示
wa: 等待IO时间
备注:
如果r经常大于4 ,且id经常少于40,表示cpu的负荷很重
如果pi,po长期不等于0,表示内存不足
如果disk经常不等于0, 且在b中的队列大于3, 表示io性能不好
Linux在具有高稳定性、可靠性的同时,具有很好的可伸缩性和扩展性,能够针对不同的应用和硬件环境调整,优化出满足当前应用需要的最佳性能。因此企业在维护Linux系统、进行系统调优时,了解系统性能分析工具是至关重要的。
实例2:显示活跃和非活跃内存
命令:vmstat -a 2 5
输出:
[root@localhost ~]# vmstat -a 2 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------r b swpd free inact active si so bi bo in cs us sy id wa st0 0 0 3029752 387728 513008 0 0 0 2 3 2 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 0 1005 34 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 22 1004 36 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 0 1004 33 0 0 100 0 00 0 0 3029752 387728 513076 0 0 0 0 1003 32 0 0 100 0 0
说明:
使用-a
选项显示活跃
和非活跃内存
时,所显示的内容除增加inact和active外,其他显示内容与例子1相同。
字段说明:
Memory(内存):
inact: 非活跃内存大小(当使用-a选项时显示)
active: 活跃的内存大小(当使用-a选项时显示)
实例3:查看系统已经fork了多少次
命令:vmstat -f
输出:
[root@SCF1129 ~]# vmstat -f12744849 forks
说明:
这个数据是从/proc/stat
中的processes字段
里取得的
实例4:查看内存使用的详细信息
命令:vmstat -s
输出:
[root@localhost ~]# vmstat -s 4043760 total memory1013884 used memory513012 active memory387728 inactive memory3029876 free memory199616 buffer memory690980 swap cache6096656 total swap0 used swap6096656 free swap83587 non-nice user cpu ticks132 nice user cpu ticks278599 system cpu ticks913344692 idle cpu ticks814550 IO-wait cpu ticks10547 IRQ cpu ticks21261 softirq cpu ticks0 stolen cpu ticks310215 pages paged in14254652 pages paged out0 pages swapped in0 pages swapped out288374745 interrupts146680577 CPU context switches1351868832 boot time367291 forks
说明:
这些信息的分别来自于/proc/meminfo
,/proc/stat
和/proc/vmstat
。
实例5:查看磁盘的读/写
命令:vmstat -d
输出:
[root@localhost ~]# vmstat -d
disk- ------------reads------------ ------------writes----------- -----IO------total merged sectors ms total merged sectors ms cur sec
ram0 0 0 0 0 0 0 0 0 0 0
ram1 0 0 0 0 0 0 0 0 0 0
ram2 0 0 0 0 0 0 0 0 0 0
ram3 0 0 0 0 0 0 0 0 0 0
ram4 0 0 0 0 0 0 0 0 0 0
ram5 0 0 0 0 0 0 0 0 0 0
ram6 0 0 0 0 0 0 0 0 0 0
ram7 0 0 0 0 0 0 0 0 0 0
ram8 0 0 0 0 0 0 0 0 0 0
ram9 0 0 0 0 0 0 0 0 0 0
ram10 0 0 0 0 0 0 0 0 0 0
ram11 0 0 0 0 0 0 0 0 0 0
ram12 0 0 0 0 0 0 0 0 0 0
ram13 0 0 0 0 0 0 0 0 0 0
ram14 0 0 0 0 0 0 0 0 0 0
ram15 0 0 0 0 0 0 0 0 0 0
sda 33381 6455 615407 63224 2068111 1495416 28508288 15990289 0 10491
hdc 0 0 0 0 0 0 0 0 0 0
fd0 0 0 0 0 0 0 0 0 0 0
md0 0 0 0 0 0 0 0 0 0 0
说明:
这些信息主要来自于/proc/diskstats
merged:表示一次来自于合并的写/读请求,一般系统会把多个连接/邻近的读/写请求合并到一起来操作
实例6:查看/dev/sda1磁盘的读/写
命令:vmstat -p /dev/sda1
输出:
[root@SCF1129 ~]# df
文件系统 1K-块 已用 可用 已用% 挂载点
/dev/sda3 1119336548 27642068 1034835500 3% /
tmpfs 32978376 0 32978376 0% /dev/shm
/dev/sda1 1032088 59604 920056 7% /boot[root@SCF1129 ~]# vmstat -p /dev/sda1
sda1 reads read sectors writes requested writes18607 4249978 6 48[root@SCF1129 ~]# vmstat -p /dev/sda3
sda3 reads read sectors writes requested writes429350 35176268 28998789 980301488
说明:
这些信息主要来自于/proc/diskstats
。
reads: 来自于这个分区的读的次数
read sectors: 来自于这个分区的读扇区的次数
writes: 来自于这个分区的写的次数
requested writes: 来自于这个分区的写请求次数
实例7:查看系统的slab信息
命令:vmstat -m
输出:
[root@localhost ~]# vmstat -m
Cache Num Total Size Pages
ip_conntrack_expect 0 0 136 28
ip_conntrack 3 13 304 13
ip_fib_alias 11 59 64 59
ip_fib_hash 11 59 64 59
AF_VMCI 0 0 960 4
bio_map_info 100 105 1064 7
dm_mpath 0 0 1064 7
jbd_4k 0 0 4096 1
dm_uevent 0 0 2608 3
dm_tio 0 0 24 144
dm_io 0 0 48 77
scsi_cmd_cache 10 10 384 10
sgpool-128 32 32 4096 1
sgpool-64 32 32 2048 2
sgpool-32 32 32 1024 4
sgpool-16 32 32 512 8
sgpool-8 45 45 256 15
scsi_io_context 0 0 112 34
ext3_inode_cache 51080 51105 760 5
ext3_xattr 36 88 88 44
journal_handle 18 144 24 144
journal_head 56 80 96 40
revoke_table 4 202 16 202
revoke_record 0 0 32 112
uhci_urb_priv 0 0 56 67
UNIX 13 33 704 11
flow_cache 0 0 128 30
msi_cache 33 59 64 59
cfq_ioc_pool 14 90 128 30
cfq_pool 12 90 216 18
crq_pool 16 96 80 48
deadline_drq 0 0 80 48
as_arq 0 0 96 40
mqueue_inode_cache 1 4 896 4
isofs_inode_cache 0 0 608 6
hugetlbfs_inode_cache 1 7 576 7
Cache Num Total Size Pages
ext2_inode_cache 0 0 720 5
ext2_xattr 0 0 88 44
dnotify_cache 0 0 40 92
dquot 0 0 256 15
eventpoll_pwq 3 53 72 53
eventpoll_epi 3 20 192 20
inotify_event_cache 0 0 40 92
inotify_watch_cache 1 53 72 53
kioctx 0 0 320 12
kiocb 0 0 256 15
fasync_cache 0 0 24 144
shmem_inode_cache 254 290 768 5
posix_timers_cache 0 0 128 30
uid_cache 0 0 128 30
ip_mrt_cache 0 0 128 30
tcp_bind_bucket 3 112 32 112
inet_peer_cache 0 0 128 30
secpath_cache 0 0 64 59
xfrm_dst_cache 0 0 384 10
ip_dst_cache 5 10 384 10
arp_cache 1 15 256 15
RAW 3 5 768 5
UDP 5 10 768 5
tw_sock_TCP 0 0 192 20
request_sock_TCP 0 0 128 30
TCP 4 5 1600 5
blkdev_ioc 14 118 64 59
blkdev_queue 20 30 1576 5
blkdev_requests 13 42 272 14
biovec-256 7 7 4096 1
biovec-128 7 8 2048 2
biovec-64 7 8 1024 4
biovec-16 7 15 256 15
biovec-4 7 59 64 59
biovec-1 23 202 16 202
bio 270 270 128 30
utrace_engine_cache 0 0 64 59
Cache Num Total Size Pages
utrace_cache 0 0 64 59
sock_inode_cache 33 48 640 6
skbuff_fclone_cache 7 7 512 7
skbuff_head_cache 319 390 256 15
file_lock_cache 1 22 176 22
Acpi-Operand 4136 4248 64 59
Acpi-ParseExt 0 0 64 59
Acpi-Parse 0 0 40 92
Acpi-State 0 0 80 48
Acpi-Namespace 2871 2912 32 112
delayacct_cache 81 295 64 59
taskstats_cache 4 53 72 53
proc_inode_cache 1427 1440 592 6
sigqueue 0 0 160 24
radix_tree_node 13166 13188 536 7
bdev_cache 23 24 832 4
sysfs_dir_cache 5370 5412 88 44
mnt_cache 26 30 256 15
inode_cache 2009 2009 560 7
dentry_cache 60952 61020 216 18
filp 479 1305 256 15
names_cache 3 3 4096 1
avc_node 14 53 72 53
selinux_inode_security 994 1200 80 48
key_jar 2 20 192 20
idr_layer_cache 74 77 528 7
buffer_head 164045 164800 96 40
mm_struct 51 56 896 4
vm_area_struct 1142 1958 176 22
fs_cache 35 177 64 59
files_cache 36 55 768 5
signal_cache 72 162 832 9
sighand_cache 68 84 2112 3
task_struct 76 80 1888 2
anon_vma 458 864 24 144
pid 83 295 64 59
shared_policy_node 0 0 48 77
Cache Num Total Size Pages
numa_policy 37 144 24 144
size-131072(DMA) 0 0 131072 1
size-131072 0 0 131072 1
size-65536(DMA) 0 0 65536 1
size-65536 1 1 65536 1
size-32768(DMA) 0 0 32768 1
size-32768 2 2 32768 1
size-16384(DMA) 0 0 16384 1
size-16384 5 5 16384 1
size-8192(DMA) 0 0 8192 1
size-8192 7 7 8192 1
size-4096(DMA) 0 0 4096 1
size-4096 110 111 4096 1
size-2048(DMA) 0 0 2048 2
size-2048 602 602 2048 2
size-1024(DMA) 0 0 1024 4
size-1024 344 352 1024 4
size-512(DMA) 0 0 512 8
size-512 433 480 512 8
size-256(DMA) 0 0 256 15
size-256 1139 1155 256 15
size-128(DMA) 0 0 128 30
size-64(DMA) 0 0 64 59
size-64 5639 5782 64 59
size-32(DMA) 0 0 32 112
size-128 801 930 128 30
size-32 3005 3024 32 112
kmem_cache 137 137 2688 1
说明:
这组信息来自于/proc/slabinfo
slab:由于内核会有许多小对象,这些对象构造销毁十分频繁,比如i-node,dentry,这些对象如果每次构建的时候就向内存要一个页(4kb),而其实只有几个字节,这样就会非常浪费,为了解决这个问题,就引入了一种新的机制来处理在同一个页框中如何分配小存储区,而slab可以对小对象进行分配,这样就不用为每一个对象分配页框,从而节省了空间,内核对一些小对象创建析构很频繁,slab对这些小对象进行缓冲,可以重复利用,减少内存分配次数。
4、iostat命令
Linux系统中的iostat是I/O statistics
(输入/输出统计)的缩写,iostat工具将对系统的磁盘操作活动进行监视;
它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU使用情况;
同vmstat一样,iostat也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析;
iostat属于sysstat软件包。可以用yum install sysstat 直接安装。
4.1、命令格式:
iostat[参数][时间][次数]
4.2、命令功能:
通过iostat方便查看CPU
、网卡
、tty设备
、磁盘
、CD-ROM
等等设备的活动情况, 负载信息。
4.3、命令参数:
-C 显示CPU使用情况
-d 显示磁盘使用情况
-k 以 KB 为单位显示
-m 以 M 为单位显示
-N 显示磁盘阵列(LVM) 信息
-n 显示NFS 使用情况
-p[磁盘] 显示磁盘和分区的情况
-t 显示终端和CPU的信息
-x 显示详细信息
-V 显示版本信息
4.4、使用实例:
实例1:显示所有设备负载情况
命令:iostat
输出:
[root@databackserv ~]# iostat
Linux 2.6.32-431.el6.x86_64 (databackserv) 2020年04月16日 _x86_64_ (24 CPU)avg-cpu: %user %nice %system %iowait %steal %idle0.01 0.00 0.08 0.01 0.00 99.90Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sdb 4.11 437.97 4.18 32848078256 313161338
sda 5.23 26.23 2456.43 1967317945 184232989816
sdc 4.07 437.84 4.18 32838506288 313161338
md126 0.45 0.15 3.83 10946036 287245784
说明:
cpu属性值说明:
%user:CPU处在用户模式下的时间百分比
%nice:CPU处在带NICE值的用户模式下的时间百分比
%system:CPU处在系统模式下的时间百分比
%iowait:CPU等待输入输出完成时间的百分比
%steal:管理程序维护另一个虚拟处理器时,虚拟CPU的无意识等待时间百分比
%idle:CPU空闲时间百分比
备注:
如果%iowait的值过高,表示硬盘存在I/O瓶颈
如果%idle值高,表示CPU较空闲
如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量
如果%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU
disk属性值说明:
rrqm/s: 每秒进行 merge 的读操作数目。即 rmerge/s
wrqm/s: 每秒进行 merge 的写操作数目。即 wmerge/s
r/s: 每秒完成的读 I/O 设备次数。即 rio/s
w/s: 每秒完成的写 I/O 设备次数。即 wio/s
rsec/s: 每秒读扇区数。即 rsect/s
wsec/s: 每秒写扇区数。即 wsect/s
rkB/s: 每秒读K字节数。是 rsect/s 的一半,因为每扇区大小为512字节。
wkB/s: 每秒写K字节数。是 wsect/s 的一半。
avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。
avgqu-sz: 平均I/O队列长度。
await: 平均每次设备I/O操作的等待时间 (毫秒)。
svctm: 平均每次设备I/O操作的服务时间 (毫秒)。
%util: 一秒中有百分之多少的时间用于 I/O 操作,即被io消耗的cpu百分比
备注:
如果 %util接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈
如果svctm比较接近await,说明 I/O 几乎没有等待时间
如果await远大于svctm,说明I/O 队列太长,io响应太慢,则需要进行必要优化
如果avgqu-sz比较大,也表示有当量io在等待
实例2:定时显示所有信息
命令:iostat 2 3
输出:
[root@databackserv ~]# iostat 2 3
Linux 2.6.32-431.el6.x86_64 (databackserv) 2020年04月16日 _x86_64_ (24 CPU)avg-cpu: %user %nice %system %iowait %steal %idle0.01 0.00 0.08 0.01 0.00 99.90Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sdb 4.11 437.97 4.18 32848078288 313162472
sda 5.23 26.23 2456.42 1967317945 184232991416
sdc 4.07 437.84 4.18 32838506288 313162472
md126 0.45 0.15 3.83 10946052 287246752avg-cpu: %user %nice %system %iowait %steal %idle0.00 0.00 0.06 0.02 0.00 99.92Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sdb 1.00 0.00 1.00 0 2
sda 6.00 0.00 72.00 0 144
sdc 1.00 0.00 1.00 0 2
md126 0.00 0.00 0.00 0 0avg-cpu: %user %nice %system %iowait %steal %idle0.02 0.00 0.08 0.00 0.00 99.90Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sdb 2.50 0.00 13.00 0 26
sda 0.00 0.00 0.00 0 0
sdc 2.50 0.00 13.00 0 26
md126 1.50 0.00 12.00 0 24
说明:
每隔2秒
刷新显示3次
实例3:显示指定磁盘信息
命令:iostat -d sda1
输出:
[root@databackserv ~]# iostat -d sda1
Linux 2.6.32-431.el6.x86_64 (databackserv) 2020年04月16日 _x86_64_ (24 CPU)Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda1 5.23 26.23 2456.41 1967316145 184232991960
实例4:显示tty和cpu信息
命令:iostat -t
输出:
[root@databackserv ~]# iostat -t
Linux 2.6.32-431.el6.x86_64 (databackserv) 2020年04月16日 _x86_64_ (24 CPU)2020年04月16日 11时51分51秒
avg-cpu: %user %nice %system %iowait %steal %idle0.01 0.00 0.08 0.01 0.00 99.90Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sdb 4.11 437.97 4.18 32848078288 313163134
sda 5.23 26.23 2456.41 1967317945 184232992064
sdc 4.07 437.84 4.18 32838506288 313163134
md126 0.45 0.15 3.83 10946052 287247352
实例5:以M为单位显示所有信息
命令:iostat -m
输出:
[root@databackserv ~]# iostat -m
Linux 2.6.32-431.el6.x86_64 (databackserv) 2020年04月16日 _x86_64_ (24 CPU)avg-cpu: %user %nice %system %iowait %steal %idle0.01 0.00 0.08 0.01 0.00 99.90Device: tps MB_read/s MB_wrtn/s MB_read MB_wrtn
sdb 4.11 0.21 0.00 16039100 152911
sda 5.23 0.01 1.20 960604 89957515
sdc 4.07 0.21 0.00 16034426 152911
md126 0.45 0.00 0.00 5344 140257
实例6:查看TPS和吞吐量信息
命令:iostat -d -k 1 1
输出:
[root@CT1186 ~]# iostat -d -k 1 1
Linux 2.6.18-128.el5 (CT1186) 2012年12月28日Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 22.72 21.85 243.71 337017916 3758984340
sda1 0.00 0.00 0.00 1329 268
sda2 0.11 1.87 1.76 28860797 27101108
sda3 0.98 0.31 8.75 4727086 135012508
sda4 0.00 0.00 0.00 3 0
sda5 6.95 0.06 54.37 962481 838566148
sda6 2.20 0.09 15.61 1418630 240744712
sda7 12.48 19.52 163.22 301047254 2517559596
说明:
tps:该设备每秒的传输次数
(Indicate the number of transfers per second that were issued to the device)
“一次传输”意思是“一次I/O请求”,多个逻辑请求可能会被合并为“一次I/O请求”,“一次传输”请求的大小是未知的。
kB_read/s:每秒从设备(drive expressed)读取的数据量;
kB_wrtn/s:每秒向设备(drive expressed)写入的数据量;
kB_read:读取的总数据量;kB_wrtn:写入的总数量数据量;这些单位都为Kilobytes。
上面的例子中,我们可以看到磁盘sda以及它的各个分区的统计数据,当时统计的磁盘总TPS是22.73,下面是各个分区的TPS。(因为是瞬间值,所以总TPS并不严格等于各个分区TPS的总和)
实例7:查看设备使用率(%util)、响应时间(await)
命令:iostat -d -x -k 1 1
输出:
[root@CT1186 ~]# iostat -d -x -k 1 1
Linux 2.6.18-128.el5 (CT1186) 2012年12月28日Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
sda 0.44 38.59 0.40 22.32 21.85 243.71 23.37 0.04 1.78 4.20 9.54
sda1 0.00 0.00 0.00 0.00 0.00 0.00 18.90 0.00 8.26 6.46 0.00
sda2 0.36 0.43 0.11 0.01 1.87 1.76 63.57 0.01 63.75 1.94 0.02
sda3 0.00 1.24 0.04 0.95 0.31 8.75 18.42 0.04 39.77 8.73 0.86
sda4 0.00 0.00 0.00 0.00 0.00 0.00 2.00 0.00 19.67 19.67 0.00
sda5 0.00 6.65 0.00 6.94 0.06 54.37 15.67 0.26 36.81 4.48 3.11
sda6 0.00 1.71 0.01 2.19 0.09 15.61 14.29 0.03 12.40 5.84 1.28
sda7 0.08 28.56 0.25 12.24 19.52 163.22 29.28 0.27 21.46 5.00 6.25
说明:
rrqm/s: 每秒进行 merge 的读操作数目.即 delta(rmerge)/s
wrqm/s: 每秒进行 merge 的写操作数目.即 delta(wmerge)/s
r/s: 每秒完成的读 I/O 设备次数.即 delta(rio)/s
w/s: 每秒完成的写 I/O 设备次数.即 delta(wio)/s
rsec/s: 每秒读扇区数.即 delta(rsect)/s
wsec/s: 每秒写扇区数.即 delta(wsect)/s
rkB/s: 每秒读K字节数.是 rsect/s 的一半,因为每扇区大小为512字节.(需要计算)
wkB/s: 每秒写K字节数.是 wsect/s 的一半.(需要计算)
avgrq-sz:平均每次设备I/O操作的数据大小 (扇区).delta(rsect+wsect)/delta(rio+wio)
avgqu-sz:平均I/O队列长度.即 delta(aveq)/s/1000 (因为aveq的单位为毫秒).
await: 平均每次设备I/O操作的等待时间 (毫秒).即 delta(ruse+wuse)/delta(rio+wio)
svctm: 平均每次设备I/O操作的服务时间 (毫秒).即 delta(use)/delta(rio+wio)
%util: 一秒中有百分之多少的时间用于 I/O 操作,或者说一秒中有多少时间 I/O 队列是非空的,即 delta(use)/s/1000 (因为use的单位为毫秒)
如果 %util接近100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈
如果%idle小于70%,IO压力就较大了,一般读取速度有较多的%iowait
同时可以结合vmstat查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)
另外 await 的参数也要多和 svctm 来参考。差的过高就一定有 IO 的问题
avgqu-sz 也是个做 IO调优时需要注意的地方,这个就是直接每次操作的数据的大小:
如果次数多,但数据拿的小的话,其实 IO 也会很小;如果数据拿的大,IO的数据才会高
也可以通过 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s
也就是讲,读定速度是这个来决定的
svctm一般要小于await (因为同时等待的请求的等待时间被重复计算)
svctm的大小一般和磁盘性能有关,CPU/内存的负荷也会对其有影响,请求过多也会间接导致 svctm的增加await的大小一般取决于服务时间(svctm)以及I/O队列的长度和I/O请求的发出模式如果svctm比较接近await,说明I/O几乎没有等待时间;
如果await远大于svctm,说明I/O队列太长,应用得到的响应时间变慢如果响应时间超过了用户可以容许的范围,这时可以考虑更换更快的磁盘,调整内核 elevator 算法,优化应用,或者升级 CPU。
队列长度(avgqu-sz)也可作为衡量系统 I/O 负荷的指标,但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水。
形象的比喻:
r/s+w/s 类似于交款人的总数
平均队列长度(avgqu-sz)类似于单位时间里平均排队人的个数
平均服务时间(svctm)类似于收银员的收款速度
平均等待时间(await)类似于平均每人的等待时间
平均I/O数据(avgrq-sz)类似于平均每人所买的东西多少
I/O操作率 (%util)类似于收款台前有人排队的时间比例
设备IO操作: 总IO(io)/s=r/s(读) +w/s(写) 1.46+25.28=26.74
平均每次设备I/O操作只需要0.36毫秒完成,现在却需要10.57毫秒完成,因为发出的 请求太多(每秒26.74个),假如请求时同时发出的,可以这样计算
平均等待时间: 平均等待时间=单个I/O服务器时间*(1+2+...+请求总数-1)/请求总数
每秒发出的I/0请求很多,但是平均队列就4,表示这些请求比较均匀,大部分处理还是比较及时。
实例8:查看cpu状态
命令:iostat -c 1 3
输出:
[root@CT1186 ~]# iostat -c 1 3
Linux 2.6.18-128.el5 (CT1186) 2012年12月28日avg-cpu: %user %nice %system %iowait %steal %idle8.30 0.02 5.07 0.17 0.00 86.44avg-cpu: %user %nice %system %iowait %steal %idle8.64 0.00 5.38 0.00 0.00 85.98avg-cpu: %user %nice %system %iowait %steal %idle7.62 0.00 5.12 0.50 0.00 86.75
5、lsof命令
lsof(list open files)
是一个列出当前系统打开文件
的工具;
在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件,如传输控制协议 (TCP) 和用户数据报协议 (UDP) 套接字等;
系统在后台都为该应用程序分配了一个文件描述符,无论这个文件的本质如何,该文件描述符为应用程序与基础操作系统之间的交互提供了通用接口;
因为应用程序打开文件的描述符列表提供了大量关于这个应用程序本身的信息,因此通过lsof工具能够查看这个列表对系统监测以及排错将是很有帮助的。
5.1、命令格式:
iostat[参数][时间][次数]
5.2、命令功能:
用于查看进程开打的文件
、·打开文件的进程、
进程打开的端口`(TCP\UDP);
找回/恢复删除的文件,是十分方便的系统监视工具,因为lsof需要访问核心内存和各种文件,所以需要root用户执行。
lsof打开的文件可以是:
1.普通文件
2.目录
3.网络文件系统的文件
4.字符或设备文件
5.(函数)共享库
6.管道,命名管道
7.符号链接
8.网络文件(例如:NFS file、网络socket,unix域名socket)
9.还有其它类型的文件,等等
4.3、命令参数:
-a 列出打开文件存在的进程
-c<进程名> 列出指定进程所打开的文件
-g 列出GID号进程详情
-d<文件号> 列出占用该文件号的进程
+d<目录> 列出目录下被打开的文件
+D<目录> 递归列出目录下被打开的文件
-n<目录> 列出使用NFS的文件
-i<条件> 列出符合条件的进程(4、6、协议、端口、@ip)
-p<进程号> 列出指定进程号所打开的文件
-u 列出UID号进程详情
-h 显示帮助信息
-v 显示版本信息
3.4、使用实例:
实例1:无任何参数
命令:lsof
输出:
[root@localhost ~]# lsof
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
init 1 root cwd DIR 8,2 4096 2 /
init 1 root rtd DIR 8,2 4096 2 /
init 1 root txt REG 8,2 43496 6121706 /sbin/init
init 1 root mem REG 8,2 143600 7823908 /lib64/ld-2.5.so
init 1 root mem REG 8,2 1722304 7823915 /lib64/libc-2.5.so
init 1 root mem REG 8,2 23360 7823919 /lib64/libdl-2.5.so
init 1 root mem REG 8,2 95464 7824116 /lib64/libselinux.so.1
init 1 root mem REG 8,2 247496 7823947 /lib64/libsepol.so.1
init 1 root 10u FIFO 0,17 1233 /dev/initctl
migration 2 root cwd DIR 8,2 4096 2 /
migration 2 root rtd DIR 8,2 4096 2 /
migration 2 root txt unknown /proc/2/exe
ksoftirqd 3 root cwd DIR 8,2 4096 2 /
ksoftirqd 3 root rtd DIR 8,2 4096 2 /
ksoftirqd 3 root txt unknown /proc/3/exe
migration 4 root cwd DIR 8,2 4096 2 /
migration 4 root rtd DIR 8,2 4096 2 /
migration 4 root txt unknown /proc/4/exe
ksoftirqd 5 root cwd DIR 8,2 4096 2 /
ksoftirqd 5 root rtd DIR 8,2 4096 2 /
ksoftirqd 5 root txt unknown /proc/5/exe
events/0 6 root cwd DIR 8,2 4096 2 /
events/0 6 root rtd DIR 8,2 4096 2 /
events/0 6 root txt unknown /proc/6/exe
events/1 7 root cwd DIR 8,2 4096 2 /
说明:
lsof输出各列信息的意义如下:
COMMAND:进程的名称
PID:进程标识符
PPID:父进程标识符(需要指定-R参数)
USER:进程所有者
PGID:进程所属组
FD:文件描述符,应用程序通过文件描述符识别该文件。如cwd、txt等(1)cwd:表示current work dirctory,即:应用程序的当前工作目录,这是该应用程序启动的目录,除非它本身对这个目录进行更改
(2)txt :该类型的文件是程序代码,如应用程序二进制文件本身或共享库,如上列表中显示的 /sbin/init 程序
(3)lnn:library references (AIX);
(4)er:FD information error (see NAME column);
(5)jld:jail directory (FreeBSD);
(6)ltx:shared library text (code and data);
(7)mxx :hex memory-mapped type number xx.
(8)m86:DOS Merge mapped file;
(9)mem:memory-mapped file;
(10)mmap:memory-mapped device;
(11)pd:parent directory;
(12)rtd:root directory;
(13)tr:kernel trace file (OpenBSD);
(14)v86 VP/ix mapped file;
(15)0:表示标准输出
(16)1:表示标准输入
(17)2:表示标准错误一般在标准输出、标准错误、标准输入后还跟着文件状态模式:r、w、u等
(1)u:表示该文件被打开并处于读取/写入模式
(2)r:表示该文件被打开并处于只读模式
(3)w:表示该文件被打开并处于
(4)空格:表示该文件的状态模式为unknow,且没有锁定
(5)-:表示该文件的状态模式为unknow,且被锁定同时在文件状态模式后面,还跟着相关的锁
(1)N:for a Solaris NFS lock of unknown type;
(2)r:for read lock on part of the file;
(3)R:for a read lock on the entire file;
(4)w:for a write lock on part of the file;(文件的部分写锁)
(5)W:for a write lock on the entire file;(整个文件的写锁)
(6)u:for a read and write lock of any length;
(7)U:for a lock of unknown type;
(8)x:for an SCO OpenServer Xenix lock on part of the file;
(9)X:for an SCO OpenServer Xenix lock on the entire file;
(10)space:if there is no lockTYPE:文件类型,如DIR、REG等,常见的文件类型
(1)DIR:表示目录
(2)CHR:表示字符类型
(3)BLK:块设备类型
(4)UNIX:UNIX 域套接字
(5)FIFO:先进先出 (FIFO) 队列
(6)IPv4:网际协议 (IP) 套接字
DEVICE:指定磁盘的名称
SIZE:文件的大小
NODE:索引节点(文件在磁盘上的标识)
NAME:打开文件的确切名称
实例2:查看谁正在使用某个文件
查找某个文件相关的进程
命令:lsof /bin/bash
输出:
[root@localhost ~]# lsof /bin/bash
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
bash 24159 root txt REG 8,2 801528 5368780 /bin/bash
bash 24909 root txt REG 8,2 801528 5368780 /bin/bash
bash 24941 root txt REG 8,2 801528 5368780 /bin/bash
实例3:递归查看某个目录的文件信息
命令:lsof test/test3
输出:
[root@localhost ~]# cd /opt/soft/
[root@localhost soft]# lsof test/test3
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
bash 24941 root cwd DIR 8,2 4096 2258872 test/test3
vi 24976 root cwd DIR 8,2 4096 2258872 test/test3
说明:
使用了+D,对应目录下的所有子目录和文件都会被列出
实例4:不使用+D选项,遍历查看某个目录的所有文件信息的方法
命令:lsof |grep 'test/test3'
输出:
[root@localhost soft]# lsof |grep 'test/test3'bash 24941 root cwd DIR 8,2 4096 2258872 /opt/soft/test/test3
vi 24976 root cwd DIR 8,2 4096 2258872 /opt/soft/test/test3
vi 24976 root 4u REG 8,2 12288 2258882 /opt/soft/test/test3/.log2013.log.swp
实例5:列出某个用户打开的文件信息
命令:lsof -u username
输出:
[root@databackserv ~]# lsof -u root | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
init 1 root cwd DIR 259,0 4096 2 /
init 1 root rtd DIR 259,0 4096 2 /
init 1 root txt REG 259,0 150352 262205 /sbin/init
init 1 root mem REG 259,0 65928 4587550 /lib64/libnss_files-2.12.so
init 1 root mem REG 259,0 1926800 4587952 /lib64/libc-2.12.so
init 1 root mem REG 259,0 93320 4587960 /lib64/libgcc_s-4.4.7-20120601.so.1
init 1 root mem REG 259,0 47064 4587956 /lib64/librt-2.12.so
init 1 root mem REG 259,0 145896 4587953 /lib64/libpthread-2.12.so
init 1 root mem REG 259,0 268232 4587969 /lib64/libdbus-1.so.3.4.0
init 1 root mem REG 259,0 39896 4587755 /lib64/libnih-dbus.so.1.0.0
init 1 root mem REG 259,0 101920 4587757 /lib64/libnih.so.1.0.0
init 1 root mem REG 259,0 156928 4587951 /lib64/ld-2.12.so
说明:
-u选项,u其实是user的缩写
实例6:列出某个程序进程所打开的文件信息
命令:lsof -c mysql
输出:
[root@databackserv ~]# lsof -c mysql | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
mysqld_sa 15449 root cwd DIR 259,0 12288 3014657 /etc
mysqld_sa 15449 root rtd DIR 259,0 4096 2 /
mysqld_sa 15449 root txt REG 259,0 938832 1048616 /bin/bash
mysqld_sa 15449 root mem REG 259,0 156928 4587951 /lib64/ld-2.12.so
mysqld_sa 15449 root mem REG 259,0 22536 4587955 /lib64/libdl-2.12.so
mysqld_sa 15449 root mem REG 259,0 1926800 4587952 /lib64/libc-2.12.so
mysqld_sa 15449 root mem REG 259,0 138280 4587590 /lib64/libtinfo.so.5.7
mysqld_sa 15449 root mem REG 259,0 99154480 4719947 /usr/lib/locale/locale-archive
mysqld_sa 15449 root mem REG 259,0 26060 4720203 /usr/lib64/gconv/gconv-modules.cache
说明:
-c 选项将会列出所有以mysql这个进程开头的程序的文件也可以写成 lsof | grep mysql
实例7:列出多个进程多个打开的文件信息
命令:lsof -c mysql -c apache
输出:
[root@databackserv ~]# lsof -c mysql -c apache | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
mysqld_sa 15449 root cwd DIR 259,0 12288 3014657 /etc
mysqld_sa 15449 root rtd DIR 259,0 4096 2 /
mysqld_sa 15449 root txt REG 259,0 938832 1048616 /bin/bash
mysqld_sa 15449 root mem REG 259,0 156928 4587951 /lib64/ld-2.12.so
mysqld_sa 15449 root mem REG 259,0 22536 4587955 /lib64/libdl-2.12.so
mysqld_sa 15449 root mem REG 259,0 1926800 4587952 /lib64/libc-2.12.so
mysqld_sa 15449 root mem REG 259,0 138280 4587590 /lib64/libtinfo.so.5.7
mysqld_sa 15449 root mem REG 259,0 99154480 4719947 /usr/lib/locale/locale-archive
mysqld_sa 15449 root mem REG 259,0 26060 4720203 /usr/lib64/gconv/gconv-modules.cache
mysqld_sa 15449 root 0r CHR 1,3 0t0 3920 /dev/null
mysqld_sa 15449 root 1w CHR 1,3 0t0 3920 /dev/null
mysqld_sa 15449 root 2u CHR 136,0 0t0 3 /dev/pts/0 (deleted)
mysqld_sa 15449 root 255r REG 259,0 28448 4740582 /usr/bin/mysqld_safe
mysqld 15655 mysql cwd DIR 259,4 4096 393372 /var/lib/mysql
mysqld 15655 mysql rtd DIR 259,0 4096 2 /
mysqld 15655 mysql txt REG 259,0 251496087 4740592 /usr/sbin/mysqld (deleted)
实例8:列出某个用户以及某个进程所打开的文件信息
命令:lsof -u zabbix -c zabbix
输出:
[root@databackserv ~]# lsof -u zabbix -c zabbix | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
zabbix_ag 5156 zabbix cwd DIR 259,0 4096 2 /
zabbix_ag 5156 zabbix rtd DIR 259,0 4096 2 /
zabbix_ag 5156 zabbix txt REG 259,0 647128 4747785 /usr/sbin/zabbix_agentd
zabbix_ag 5156 zabbix mem REG 259,0 65928 4587550 /lib64/libnss_files-2.12.so
zabbix_ag 5156 zabbix mem REG 259,0 472064 4587979 /lib64/libfreebl3.so
zabbix_ag 5156 zabbix mem REG 259,0 124624 4587963 /lib64/libselinux.so.1
zabbix_ag 5156 zabbix mem REG 259,0 43392 4587980 /lib64/libcrypt-2.12.so
zabbix_ag 5156 zabbix mem REG 259,0 12592 4587961 /lib64/libkeyutils.so.1.3
zabbix_ag 5156 zabbix mem REG 259,0 46368 4587964 /lib64/libkrb5support.so.0.1
zabbix_ag 5156 zabbix mem REG 259,0 164504 4733759 /usr/lib64/libssh2.so.1.0.1
zabbix_ag 5156 zabbix mem REG 259,0 209120 4587988 /lib64/libidn.so.11.6.1
zabbix_ag 5156 zabbix mem REG 259,0 108728 4747738 /usr/lib64/libsasl2.so.2.0.23
zabbix_ag 5156 zabbix mem REG 259,0 243096 4587975 /lib64/libnspr4.so
zabbix_ag 5156 zabbix mem REG 259,0 21288 4587976 /lib64/libplc4.so
zabbix_ag 5156 zabbix mem REG 259,0 17128 4587977 /lib64/libplds4.so
说明:
用户与进程可相关,也可以不相关
实例9:列出除了某个用户外的被打开的文件信息
命令:lsof -u ^root
输出:
[root@databackserv ~]# lsof -u ^root | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
rpcbind 2999 rpc cwd DIR 259,0 4096 2 /
rpcbind 2999 rpc rtd DIR 259,0 4096 2 /
rpcbind 2999 rpc txt REG 259,0 54408 262194 /sbin/rpcbind
rpcbind 2999 rpc mem REG 259,0 65928 4587550 /lib64/libnss_files-2.12.so
rpcbind 2999 rpc mem REG 259,0 1926800 4587952 /lib64/libc-2.12.so
rpcbind 2999 rpc mem REG 259,0 145896 4587953 /lib64/libpthread-2.12.so
rpcbind 2999 rpc mem REG 259,0 22536 4587955 /lib64/libdl-2.12.so
rpcbind 2999 rpc mem REG 259,0 36584 4587658 /lib64/libgssglue.so.1.0.0
rpcbind 2999 rpc mem REG 259,0 116368 4587746 /lib64/libnsl-2.12.so
rpcbind 2999 rpc mem REG 259,0 161984 4587666 /lib64/libtirpc.so.1.0.10
rpcbind 2999 rpc mem REG 259,0 43256 4587989 /lib64/libwrap.so.0.7.6
rpcbind 2999 rpc mem REG 259,0 156928 4587951 /lib64/ld-2.12.so
rpcbind 2999 rpc 0u CHR 1,3 0t0 3920 /dev/null
rpcbind 2999 rpc 1u CHR 1,3 0t0 3920 /dev/null
rpcbind 2999 rpc 2u CHR 1,3 0t0 3920 /dev/null
说明:
^
这个符号在用户名之前,将会把是root用户打开的进程不显示
实例10:通过某个进程号显示该进行打开的文件
命令:lsof -p 5162
输出:
[root@databackserv ~]# lsof -p 5162
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
zabbix_ag 5162 zabbix cwd DIR 259,0 4096 2 /
zabbix_ag 5162 zabbix rtd DIR 259,0 4096 2 /
zabbix_ag 5162 zabbix txt REG 259,0 647128 4747785 /usr/sbin/zabbix_agentd
zabbix_ag 5162 zabbix mem REG 259,0 65928 4587550 /lib64/libnss_files-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 472064 4587979 /lib64/libfreebl3.so
zabbix_ag 5162 zabbix mem REG 259,0 124624 4587963 /lib64/libselinux.so.1
zabbix_ag 5162 zabbix mem REG 259,0 43392 4587980 /lib64/libcrypt-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 12592 4587961 /lib64/libkeyutils.so.1.3
zabbix_ag 5162 zabbix mem REG 259,0 46368 4587964 /lib64/libkrb5support.so.0.1
zabbix_ag 5162 zabbix mem REG 259,0 164504 4733759 /usr/lib64/libssh2.so.1.0.1
zabbix_ag 5162 zabbix mem REG 259,0 209120 4587988 /lib64/libidn.so.11.6.1
zabbix_ag 5162 zabbix mem REG 259,0 108728 4747738 /usr/lib64/libsasl2.so.2.0.23
zabbix_ag 5162 zabbix mem REG 259,0 243096 4587975 /lib64/libnspr4.so
zabbix_ag 5162 zabbix mem REG 259,0 21288 4587976 /lib64/libplc4.so
zabbix_ag 5162 zabbix mem REG 259,0 17128 4587977 /lib64/libplds4.so
zabbix_ag 5162 zabbix mem REG 259,0 182112 4735034 /usr/lib64/libnssutil3.so
zabbix_ag 5162 zabbix mem REG 259,0 1299096 4747735 /usr/lib64/libnss3.so
zabbix_ag 5162 zabbix mem REG 259,0 183928 4747737 /usr/lib64/libsmime3.so
zabbix_ag 5162 zabbix mem REG 259,0 249368 4747736 /usr/lib64/libssl3.so
zabbix_ag 5162 zabbix mem REG 259,0 177520 4587965 /lib64/libk5crypto.so.3.1
zabbix_ag 5162 zabbix mem REG 259,0 17256 4587966 /lib64/libcom_err.so.2.1
zabbix_ag 5162 zabbix mem REG 259,0 944712 4587967 /lib64/libkrb5.so.3.3
zabbix_ag 5162 zabbix mem REG 259,0 280520 4587968 /lib64/libgssapi_krb5.so.2.2
zabbix_ag 5162 zabbix mem REG 259,0 1926800 4587952 /lib64/libc-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 183816 4587987 /lib64/libpcre.so.0.0.1
zabbix_ag 5162 zabbix mem REG 259,0 113952 4587962 /lib64/libresolv-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 47064 4587956 /lib64/librt-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 22536 4587955 /lib64/libdl-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 599384 4587959 /lib64/libm-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 346008 4726101 /usr/lib64/libcurl.so.4.1.1
zabbix_ag 5162 zabbix mem REG 259,0 63336 4587978 /lib64/liblber-2.4.so.2.5.6
zabbix_ag 5162 zabbix mem REG 259,0 317200 4587981 /lib64/libldap-2.4.so.2.5.6
zabbix_ag 5162 zabbix mem REG 259,0 1949440 4725828 /usr/lib64/libcrypto.so.1.0.1e
zabbix_ag 5162 zabbix mem REG 259,0 439912 4747732 /usr/lib64/libssl.so.1.0.1e
zabbix_ag 5162 zabbix mem REG 259,0 145896 4587953 /lib64/libpthread-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 91096 4587954 /lib64/libz.so.1.2.3
zabbix_ag 5162 zabbix mem REG 259,0 156928 4587951 /lib64/ld-2.12.so
zabbix_ag 5162 zabbix DEL REG 0,4 65537 /SYSV00000000
zabbix_ag 5162 zabbix DEL REG 0,4 32768 /SYSV00000000
zabbix_ag 5162 zabbix 0r CHR 1,3 0t0 3920 /dev/null
zabbix_ag 5162 zabbix 1w REG 259,4 1803 131556 /var/log/zabbix/zabbix_agentd.log-20190915 (deleted)
zabbix_ag 5162 zabbix 2w REG 259,4 1803 131556 /var/log/zabbix/zabbix_agentd.log-20190915 (deleted)
zabbix_ag 5162 zabbix 3w REG 259,4 4 131558 /var/run/zabbix/zabbix_agentd.pid
zabbix_ag 5162 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
[root@databackserv ~]#
实例11:列出多个进程号对应的文件信息
命令:lsof -p 5162,13922
输出:
[root@databackserv ~]# lsof -p 5162,13922 | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
zabbix_ag 5162 zabbix cwd DIR 259,0 4096 2 /
zabbix_ag 5162 zabbix rtd DIR 259,0 4096 2 /
zabbix_ag 5162 zabbix txt REG 259,0 647128 4747785 /usr/sbin/zabbix_agentd
zabbix_ag 5162 zabbix mem REG 259,0 65928 4587550 /lib64/libnss_files-2.12.so
zabbix_ag 5162 zabbix mem REG 259,0 472064 4587979 /lib64/libfreebl3.so
zabbix_ag 5162 zabbix 0r CHR 1,3 0t0 3920 /dev/null
zabbix_ag 5162 zabbix 1w REG 259,4 1803 131556 /var/log/zabbix/zabbix_agentd.log-20190915 (deleted)
zabbix_ag 5162 zabbix 2w REG 259,4 1803 131556 /var/log/zabbix/zabbix_agentd.log-20190915 (deleted)
zabbix_ag 5162 zabbix 3w REG 259,4 4 131558 /var/run/zabbix/zabbix_agentd.pid
zabbix_ag 5162 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
sshd 13922 root cwd DIR 259,0 4096 2 /
sshd 13922 root rtd DIR 259,0 4096 2 /
sshd 13922 root txt REG 259,0 546680 4742423 /usr/sbin/sshd
sshd 13922 root DEL REG 0,4 16831962 /dev/zero
sshd 13922 root mem REG 259,0 18592 4587694 /lib64/security/pam_limits.so
sshd 13922 root mem REG 259,0 10224 4587692 /lib64/security/pam_keyinit.so
sshd 13922 root mem REG 259,0 10240 4587697 /lib64/security/pam_loginuid.so
sshd 13922 root DEL REG 0,4 16831933 /dev/zero
sshd 13922 root 0u CHR 1,3 0t0 3920 /dev/null
sshd 13922 root 1u CHR 1,3 0t0 3920 /dev/null
sshd 13922 root 2u CHR 1,3 0t0 3920 /dev/null
sshd 13922 root 3r IPv4 16831913 0t0 TCP databackserv:ssh->172.30.4.231:60086 (ESTABLISHED)
sshd 13922 root 4w unix 0xffff881068327380 0t0 16831982 socket
sshd 13922 root 5u FIFO 0,8 0t0 16831985 pipe
sshd 13922 root 6w FIFO 0,8 0t0 16831985 pipe
sshd 13922 root 7u CHR 5,2 0t0 5600 /dev/ptmx
实例12:列出除了某个进程号,其他进程号所打开的文件信息
命令:lsof -p ^1
输出:
[root@databackserv ~]# lsof -p ^1 | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
kthreadd 2 root cwd DIR 259,0 4096 2 /
kthreadd 2 root rtd DIR 259,0 4096 2 /
kthreadd 2 root txt unknown /proc/2/exe
migration 3 root cwd DIR 259,0 4096 2 /
migration 3 root rtd DIR 259,0 4096 2 /
migration 3 root txt unknown /proc/3/exe
ksoftirqd 4 root cwd DIR 259,0 4096 2 /
ksoftirqd 4 root rtd DIR 259,0 4096 2 /
实例13:列出所有的网络连接
命令:lsof -i
输出:
[root@databackserv ~]# lsof -i
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
rpcbind 2999 rpc 6u IPv4 18461 0t0 UDP *:sunrpc
rpcbind 2999 rpc 7u IPv4 18463 0t0 UDP *:rda
rpcbind 2999 rpc 8u IPv4 18464 0t0 TCP *:sunrpc (LISTEN)
rpcbind 2999 rpc 9u IPv6 18466 0t0 UDP *:sunrpc
rpcbind 2999 rpc 10u IPv6 18468 0t0 UDP *:rda
rpcbind 2999 rpc 11u IPv6 18469 0t0 TCP *:sunrpc (LISTEN)
rpc.statd 3017 rpcuser 5u IPv4 18651 0t0 UDP *:cadview-3d
rpc.statd 3017 rpcuser 8u IPv4 18655 0t0 UDP *:35871
rpc.statd 3017 rpcuser 9u IPv4 18659 0t0 TCP *:54999 (LISTEN)
rpc.statd 3017 rpcuser 10u IPv6 18663 0t0 UDP *:42856
rpc.statd 3017 rpcuser 11u IPv6 18667 0t0 TCP *:58521 (LISTEN)
cupsd 3169 root 6u IPv6 18985 0t0 TCP localhost:ipp (LISTEN)
cupsd 3169 root 7u IPv4 18986 0t0 TCP localhost:ipp (LISTEN)
cupsd 3169 root 9u IPv4 18989 0t0 UDP *:ipp
sshd 3296 root 3u IPv4 19552 0t0 TCP *:ssh (LISTEN)
sshd 3296 root 4u IPv6 19556 0t0 TCP *:ssh (LISTEN)
master 3380 root 12u IPv4 19776 0t0 TCP localhost:smtp (LISTEN)
master 3380 root 13u IPv6 19778 0t0 TCP localhost:smtp (LISTEN)
dbpsd 4435 dsg 6u IPv4 13463844 0t0 TCP *:31000 (LISTEN)
dbpsd 4435 dsg 29u IPv4 16065603 0t0 TCP *:31005 (LISTEN)
dbpsd 4448 dsg 6u IPv4 13463844 0t0 TCP *:31000 (LISTEN)
dbpsd 4448 dsg 29u IPv4 16065611 0t0 TCP *:31006 (LISTEN)
zabbix_ag 5156 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5156 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5158 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5158 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5159 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5159 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5160 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5160 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5161 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5161 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
dbpsd 9502 dsg 6u IPv4 8374919 0t0 TCP *:33000 (LISTEN)
vagentdc 9532 dsg 3u IPv4 8375034 0t0 TCP *:33001 (LISTEN)
sshd 13922 root 3r IPv4 16831913 0t0 TCP databackserv:ssh->172.30.4.231:60086 (ESTABLISHED)
mysqld 15655 mysql 28u IPv6 1885439 0t0 TCP *:mysql (LISTEN)
mysqld 15655 mysql 124u IPv6 16849597 0t0 TCP databackserv:mysql->databackserv:8909 (ESTABLISHED)
mysqld 15655 mysql 619u IPv6 16835103 0t0 TCP databackserv:mysql->databackserv:8487 (ESTABLISHED)
dbpsd 18968 dsg 6u IPv4 13463844 0t0 TCP *:31000 (LISTEN)
vagentdc 19054 dsg 3u IPv4 13464201 0t0 TCP *:31001 (LISTEN)
dbpsd 20397 dsg 6u IPv4 8396458 0t0 TCP *:35000 (LISTEN)
dbpsd 20397 dsg 10u IPv4 8396819 0t0 TCP databackserv:35000->172.30.4.231:51702 (CLOSE_WAIT)
vagentdc 20428 dsg 3u IPv4 8396573 0t0 TCP *:35001 (LISTEN)
dbpsd 20453 dsg 6u IPv4 8396697 0t0 TCP *:35005 (LISTEN)
java 29286 root 9w IPv6 16849596 0t0 TCP databackserv:8909->databackserv:mysql (ESTABLISHED)
java 29286 root 45u IPv6 2252119 0t0 TCP *:webcache (LISTEN)
java 29286 root 50u IPv6 2252123 0t0 TCP *:8009 (LISTEN)
java 29286 root 68u IPv6 16835102 0t0 TCP databackserv:8487->databackserv:mysql (ESTABLISHED)
java 29286 root 69u IPv6 2252161 0t0 TCP localhost:mxi (LISTEN)
实例14:列出所有tcp网络连接信息
命令:lsof -i tcp
输出:
[root@databackserv ~]# lsof -i tcp
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
rpcbind 2999 rpc 8u IPv4 18464 0t0 TCP *:sunrpc (LISTEN)
rpcbind 2999 rpc 11u IPv6 18469 0t0 TCP *:sunrpc (LISTEN)
rpc.statd 3017 rpcuser 9u IPv4 18659 0t0 TCP *:54999 (LISTEN)
rpc.statd 3017 rpcuser 11u IPv6 18667 0t0 TCP *:58521 (LISTEN)
cupsd 3169 root 6u IPv6 18985 0t0 TCP localhost:ipp (LISTEN)
cupsd 3169 root 7u IPv4 18986 0t0 TCP localhost:ipp (LISTEN)
sshd 3296 root 3u IPv4 19552 0t0 TCP *:ssh (LISTEN)
sshd 3296 root 4u IPv6 19556 0t0 TCP *:ssh (LISTEN)
master 3380 root 12u IPv4 19776 0t0 TCP localhost:smtp (LISTEN)
master 3380 root 13u IPv6 19778 0t0 TCP localhost:smtp (LISTEN)
dbpsd 4435 dsg 6u IPv4 13463844 0t0 TCP *:31000 (LISTEN)
dbpsd 4435 dsg 29u IPv4 16065603 0t0 TCP *:31005 (LISTEN)
dbpsd 4448 dsg 6u IPv4 13463844 0t0 TCP *:31000 (LISTEN)
dbpsd 4448 dsg 29u IPv4 16065611 0t0 TCP *:31006 (LISTEN)
zabbix_ag 5156 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5156 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5158 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5158 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5159 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5159 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5160 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5160 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5161 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5161 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
dbpsd 9502 dsg 6u IPv4 8374919 0t0 TCP *:33000 (LISTEN)
vagentdc 9532 dsg 3u IPv4 8375034 0t0 TCP *:33001 (LISTEN)
sshd 13922 root 3r IPv4 16831913 0t0 TCP databackserv:ssh->172.30.4.231:60086 (ESTABLISHED)
mysqld 15655 mysql 28u IPv6 1885439 0t0 TCP *:mysql (LISTEN)
mysqld 15655 mysql 124u IPv6 16849597 0t0 TCP databackserv:mysql->databackserv:8909 (ESTABLISHED)
mysqld 15655 mysql 619u IPv6 16835103 0t0 TCP databackserv:mysql->databackserv:8487 (ESTABLISHED)
dbpsd 18968 dsg 6u IPv4 13463844 0t0 TCP *:31000 (LISTEN)
vagentdc 19054 dsg 3u IPv4 13464201 0t0 TCP *:31001 (LISTEN)
dbpsd 20397 dsg 6u IPv4 8396458 0t0 TCP *:35000 (LISTEN)
dbpsd 20397 dsg 10u IPv4 8396819 0t0 TCP databackserv:35000->172.30.4.231:51702 (CLOSE_WAIT)
vagentdc 20428 dsg 3u IPv4 8396573 0t0 TCP *:35001 (LISTEN)
dbpsd 20453 dsg 6u IPv4 8396697 0t0 TCP *:35005 (LISTEN)
java 29286 root 9w IPv6 16849596 0t0 TCP databackserv:8909->databackserv:mysql (ESTABLISHED)
java 29286 root 45u IPv6 2252119 0t0 TCP *:webcache (LISTEN)
java 29286 root 50u IPv6 2252123 0t0 TCP *:8009 (LISTEN)
java 29286 root 68u IPv6 16835102 0t0 TCP databackserv:8487->databackserv:mysql (ESTABLISHED)
java 29286 root 69u IPv6 2252161 0t0 TCP localhost:mxi (LISTEN)
实例15:列出所有udp网络连接信息
命令:lsof -i udp
输出:
[root@databackserv ~]# lsof -i udp
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
rpcbind 2999 rpc 6u IPv4 18461 0t0 UDP *:sunrpc
rpcbind 2999 rpc 7u IPv4 18463 0t0 UDP *:rda
rpcbind 2999 rpc 9u IPv6 18466 0t0 UDP *:sunrpc
rpcbind 2999 rpc 10u IPv6 18468 0t0 UDP *:rda
rpc.statd 3017 rpcuser 5u IPv4 18651 0t0 UDP *:cadview-3d
rpc.statd 3017 rpcuser 8u IPv4 18655 0t0 UDP *:35871
rpc.statd 3017 rpcuser 10u IPv6 18663 0t0 UDP *:42856
cupsd 3169 root 9u IPv4 18989 0t0 UDP *:ipp
实例16:列出谁在使用某个端口
命令:lsof -i :3306
输出:
[root@databackserv ~]# lsof -i :3306
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
mysqld 15655 mysql 28u IPv6 1885439 0t0 TCP *:mysql (LISTEN)
mysqld 15655 mysql 124u IPv6 16849597 0t0 TCP databackserv:mysql->databackserv:8909 (ESTABLISHED)
mysqld 15655 mysql 619u IPv6 16835103 0t0 TCP databackserv:mysql->databackserv:8487 (ESTABLISHED)
java 29286 root 9w IPv6 16849596 0t0 TCP databackserv:8909->databackserv:mysql (ESTABLISHED)
java 29286 root 68u IPv6 16835102 0t0 TCP databackserv:8487->databackserv:mysql (ESTABLISHED)
实例17:列出谁在使用某个特定的udp端口
命令:lsof -i udp:42856
输出:
[root@databackserv ~]# lsof -i udp:42856
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
rpc.statd 3017 rpcuser 10u IPv6 18663 0t0 UDP *:42856
实例18:列出某个用户的所有活跃的网络端口
命令:lsof -a -u zabbix -i
输出:
[root@databackserv ~]# lsof -a -u zabbix -i
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
zabbix_ag 5156 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5156 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5158 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5158 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5159 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5159 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5160 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5160 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5161 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5161 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
zabbix_ag 5162 zabbix 5u IPv6 8586118 0t0 TCP *:zabbix-agent (LISTEN)
实例19:列出所有网络文件系统
命令:lsof -N
实例20:域名socket文件
命令:lsof -U
输出:
[root@databackserv ~]# lsof -U
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
systemd 1 root 12u unix 0xffff880036a083c0 0t0 251 /run/systemd/private
systemd 1 root 13u unix 0xffff88003633cb00 0t0 47616117 socket
systemd 1 root 22u unix 0xffff8807cde10000 0t0 12495 /run/systemd/notify
systemd 1 root 24u unix 0xffff880036a08b40 0t0 287 /run/udev/control
systemd 1 root 25u unix 0xffff880036a27800 0t0 13843 /var/run/dbus/system_bus_socket
systemd 1 root 27u unix 0xffff880036a27bc0 0t0 13853 /var/run/pcscd/pcscd.comm
systemd 1 root 30u unix 0xffff8807cde10780 0t0 12510 /run/systemd/journal/stdout
systemd 1 root 31u unix 0xffff8807cde10b40 0t0 12513 /run/systemd/journal/socket
systemd 1 root 32u unix 0xffff8807cde10f00 0t0 12515 /dev/log
systemd 1 root 34u unix 0xffff880036a08f00 0t0 317 /run/lvm/lvmetad.socket
systemd 1 root 35u unix 0xffff880036a25a00 0t0 13867 @ISCSIADM_ABSTRACT_NAMESPACE
systemd 1 root 38u unix 0xffff880036a08780 0t0 280 /run/systemd/shutdownd
systemd 1 root 39u unix 0xffff880036a27440 0t0 13836 /var/run/rpcbind.sock
systemd 1 root 41u unix 0xffff880036a092c0 0t0 388 /run/lvm/lvmpolld.socket
systemd 1 root 44u unix 0xffff880036a25dc0 0t0 13863 @ISCSID_UIP_ABSTRACT_NAMESPACE
systemd 1 root 45u unix 0xffff880036a27080 0t0 13904 socket
systemd-j 839 root 3u unix 0xffff8807cde10780 0t0 12510 /run/systemd/journal/stdout
systemd-j 839 root 4u unix 0xffff8807cde10b40 0t0 12513 /run/systemd/journal/socket
systemd-j 839 root 5u unix 0xffff8807cde10f00 0t0 12515 /dev/log
systemd-j 839 root 14u unix 0xffff8807cd9b0780 0t0 702 /run/systemd/journal/stdout
systemd-j 839 root 15u unix 0xffff8807cd9b0f00 0t0 703 /run/systemd/journal/stdout
实例21:某个用户组所打开的文件信息
命令:lsof -g 1
输出:
[root@databackserv ~]# lsof -g 1
COMMAND PID PGID USER FD TYPE DEVICE SIZE/OFF NODE NAME
systemd 1 1 root cwd DIR 253,0 4096 128 /
systemd 1 1 root rtd DIR 253,0 4096 128 /
systemd 1 1 root txt REG 253,0 1489960 67800255 /usr/lib/systemd/systemd
systemd 1 1 root mem REG 253,0 20032 201330349 /usr/lib64/libuuid.so.1.3.0
systemd 1 1 root mem REG 253,0 252704 202243259 /usr/lib64/libblkid.so.1.1.0
systemd 1 1 root mem REG 253,0 90632 201330309 /usr/lib64/libz.so.1.2.7
systemd 1 1 root mem REG 253,0 19888 201330432 /usr/lib64/libattr.so.1.1.0
systemd 1 1 root mem REG 253,0 19512 201330152 /usr/lib64/libdl-2.17.so
systemd 1 1 root mem REG 253,0 153192 201330228 /usr/lib64/liblzma.so.5.0.99
systemd 1 1 root mem REG 253,0 398272 201330230 /usr/lib64/libpcre.so.1.2.0
systemd 1 1 root mem REG 253,0 2107816 201330146 /usr/lib64/libc-2.17.so
systemd 1 1 root mem REG 253,0 142296 201330172 /usr/lib64/libpthread-2.17.so
systemd 1 1 root mem REG 253,0 88720 201326729 /usr/lib64/libgcc_s-4.8.5-20150702.so.1
systemd 1 1 root mem REG 253,0 44088 201330176 /usr/lib64/librt-2.17.so
systemd 1 1 root mem REG 253,0 260784 202280799 /usr/lib64/libmount.so.1.1.0
实例22:根据文件描述列出对应的文件信息
命令:lsof -d description(like 2)
例如:lsof -d txt
例如:lsof -d 1
例如:lsof -d 2
输出:
[root@databackserv ~]# lsof -d 8
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
systemd 1 root 8u netlink 0t0 247 KOBJECT_UEVENT
systemd-j 839 root 8u a_inode 0,9 0 7835 [timerfd]
systemd-u 879 root 8u a_inode 0,9 0 7835 [signalfd]
auditd 1186 root 8u a_inode 0,9 0 7835 [eventfd]
firewalld 1209 root 8u REG 253,0 4096 1143405 /tmp/ffi9BuPFl (deleted)
systemd-l 1212 root 8u netlink 0t0 20732 KOBJECT_UEVENT
dbus-daem 1213 dbus 8u unix 0xffff880036a0ecc0 0t0 738 socket
abrtd 1224 root 8u unix 0xffff8807cbb15dc0 0t0 19902 /var/run/abrt/abrt.socket
gssproxy 1247 root 8u unix 0xffff880036a0da00 0t0 755 /var/lib/gssproxy/default.sock[root@databackserv ~]# lsof -d txt | more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
systemd 1 root txt REG 253,0 1489960 67800255 /usr/lib/systemd/systemd
kthreadd 2 root txt unknown /proc/2/exe
ksoftirqd 3 root txt unknown /proc/3/exe
kworker/0 5 root txt unknown /proc/5/exe
migration 7 root txt unknown /proc/7/exe
rcu_bh 8 root txt unknown /proc/8/exe
rcuob/0 9 root txt unknown /proc/9/exe
rcuob/1 10 root txt unknown /proc/10/exe
rcuob/2 11 root txt unknown /proc/11/exe
说明:
0表示标准输入,1表示标准输出,2表示标准错误从而可知:所以大多数应用程序所打开的文件的 FD 都是从 3 开始
实例23:根据文件描述范围列出文件信息
命令:lsof -d 2-3
输出:
[root@databackserv ~]# lsof -d 2-3
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
systemd 1 root 2u CHR 1,3 0t0 1028 /dev/null
systemd 1 root 3u a_inode 0,9 0 7835 [timerfd]
systemd-j 839 root 2w CHR 1,3 0t0 1028 /dev/null
systemd-j 839 root 3u unix 0xffff8807cde10780 0t0 12510 /run/systemd/journal/stdout
lvmetad 859 root 2u unix 0xffff8807cc7f2d00 0t0 1650 socket
实例24:列出COMMAND列中包含字符串" sshd",且文件描符的类型为txt的文件信息
命令:lsof -c sshd -a -d txt
输出:
[root@databackserv ~]# lsof -c sshd -a -d txt
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
sshd 1887 root txt REG 253,0 815520 203649657 /usr/sbin/sshd
sshd 25881 root txt REG 253,0 815520 203649657 /usr/sbin/sshd
sshd 34191 root txt REG 253,0 815520 203649657 /usr/sbin/sshd
sshd 36403 root txt REG 253,0 815520 203649657 /usr/sbin/sshd
实例25:列出被进程号为5156的进程所打开的所有IPV4 network files
命令:lsof -i 4 -a -p 5156
输出:
[root@databackserv ~]# lsof -i 4 -a -p 5156
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
zabbix_ag 5156 zabbix 4u IPv4 8586117 0t0 TCP *:zabbix-agent (LISTEN)
实例26:列出目前连接主机yum-server上端口号
端口号为:20,21,22,25,53,80相关的所有文件信息,且每隔3秒不断的执行lsof指令
命令:lsof -i @yum-server:20,21,22,25,53,80 -r 3
输出:
[root@yum-server~]# lsof -i @yum-server:20,21,22,25,53,80 -r 3
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
nginx 9275 nobody 3u IPv4 455285026 0t0 TCP dzh-sjd1:http->61.178.233.131:onehome-help (ESTABLISHED)
nginx 9275 nobody 4u IPv4 455139117 0t0 TCP dzh-sjd1:http->42.91.75.203:33245 (ESTABLISHED)
nginx 9275 nobody 7u IPv4 455285351 0t0 TCP dzh-sjd1:http->117.157.134.201:55698 (ESTABLISHED)
nginx 9275 nobody 12u IPv4 455289879 0t0 TCP dzh-sjd1:http->118.182.188.95:46075 (ESTABLISHED)
nginx 9275 nobody 13u IPv4 455278554 0t0 TCP dzh-sjd1:http->61.178.65.2:11257 (ESTABLISHED)
nginx 9275 nobody 14u IPv4 455270168 0t0 TCP dzh-sjd1:http->117.157.165.150:4531 (ESTABLISHED)
nginx 9275 nobody 15u IPv4 455254712 0t0 TCP dzh-sjd1:http->42.90.92.160:cgn-stat (ESTABLISHED)
nginx 9275 nobody 16u IPv4 455288196 0t0 TCP dzh-sjd1:http->117.157.109.207:11645 (ESTABLISHED)
nginx 9275 nobody 17u IPv4 455271704 0t0 TCP dzh-sjd1:http->42.91.168.99:28036 (ESTABLISHED)
nginx 9275 nobody 18u IPv4 455286839 0t0 TCP dzh-sjd1:http->42.91.75.203:33241 (ESTABLISHED)
6、实战之恢复/var/log/messages误删的数据
事故出现
运维人员查看/var/log/messages提示无此文件
[root@centos73_test ~ 17:08:21]#tail -50 /var/log/messages
tail: cannot open ‘/var/log/messages’ for reading: No such file or directory
再次确认无此文件
[root@centos73_test ~ 17:28:00]#cd /var/log/
[root@centos73_test /var/log 17:30:00]#ll messages*
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202001.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202002.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202003.log
-rw-r--r-- 1 root root 45 Apr 14 20:08 messages-20200413.gz
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202004.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202005.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202006.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202007.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202008.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202009.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202010.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202011.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202012.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202013.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202014.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202015.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202016.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202017.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202018.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202019.log
-rw-r--r-- 1 root root 0 Apr 14 20:08 messages-202020.log
查看history
[root@centos73_test /var/log 17:31:35]#history1001 # top -b -o +%MEM | head -n 221002 # top -b -o +%MEM | head -n 11003 rm -rf /var/log/messages //文件被删除1004 tail -50 /var/log/messages1005 cd /var/log/1006 ls messages*1007 ll messages*1008 history
开始恢复
1. 查看当前是否有进程打开/var/logmessages文件
[root@centos73_test /var/log 17:34:05]# lsof |grep /var/log/messages
rsyslogd 451 root 3w REG 253,1 516257 1181939 /var/log/messages (deleted)
in:imjour 451 461 root 3w REG 253,1 516257 1181939 /var/log/messages (deleted)
rs:main 451 462 root 3w REG 253,1 516257 1181939 /var/log/messages (deleted)从上面的信息可以看到 PID 451(rsyslogd)打开文件的文件描述符为3,同时还可以看到/var/log/messages已经标记被删除了2. 将文件/proc/1283/fd/3(fd下的每个以数字命名的文件表示进程对应的文件描述符)拷贝/var/log/messages
[root@centos73_test /var/log 17:41:10]#ls -al /proc/451/fd/3
l-wx------ 1 root root 64 Apr 2 14:16 /proc/451/fd/3 -> /var/log/messages (deleted)
[root@centos73_test /var/log 17:43:13]#cp /proc/451/fd/3 /var/log/messages 3. 重新启动rsyslogd服务即可恢复被误删除的日志文件,并且新的日志记录能够继续被写入日志文件
[root@centos73_test /var/log 17:45:58]#systemctl restart rsyslog4.重新查看打开的messages文件
[root@centos73_test /var/log 17:45:58]#lsof /var/log/messages
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
rsyslogd 12616 root 4w REG 253,1 517883 1181541 /var/log/messages
恢复成功
5.查看日志
[root@centos73_test /var/log 17:48:42]#tail -15f /var/log/messages
Apr 16 17:42:01 centos73_test systemd: Started Session 10558 of user root.
Apr 16 17:42:01 centos73_test systemd: Starting Session 10558 of user root.
Apr 16 17:45:37 centos73_test rsyslogd: [origin software="rsyslogd" swVersion="7.4.7" x-pid="12600" x-info="http://www.rsyslog.com"] start
Apr 16 17:45:37 centos73_test systemd: Stopping System Logging Service...
Apr 16 17:45:37 centos73_test systemd: Starting System Logging Service...
Apr 16 17:45:37 centos73_test systemd: Started System Logging Service.
Apr 16 17:45:45 centos73_test rsyslogd: [origin software="rsyslogd" swVersion="7.4.7" x-pid="12600" x-info="http://www.rsyslog.com"] exiting on signal 15.
Apr 16 17:45:45 centos73_test rsyslogd: [origin software="rsyslogd" swVersion="7.4.7" x-pid="12616" x-info="http://www.rsyslog.com"] start
Apr 16 17:45:45 centos73_test systemd: Stopping System Logging Service...
Apr 16 17:45:45 centos73_test systemd: Starting System Logging Service...
Apr 16 17:45:45 centos73_test systemd: Started System Logging Service.
Apr 16 17:46:01 centos73_test systemd: Started Session 10560 of user root.
Apr 16 17:46:01 centos73_test systemd: Starting Session 10560 of user root.
Apr 16 17:48:01 centos73_test systemd: Started Session 10561 of user root.
Apr 16 17:48:01 centos73_test systemd: Starting Session 10561 of user root.
原理
当进程打开了某个文件时,只要该进程保持打开该文件,即使将其删除,它依然存在于磁盘中;
这意味着,进程并不知道文件已经被删除,它仍然可以向打开该文件时提供给它的文件描述符进行读取和写入;
除了该进程之外,这个文件是不可见的,因为已经删除了其相应的目录索引节点;
在/proc目录下,其中包含了反映内核和进程树的各种文件,/proc目录挂载的是在内存中所映射的一块区域,所以这些文件和目录并不存在于磁盘中,因此当我们对这些文件进行读取和写入时,实际上是在从内存中获取相关信息;
大多数与lsof 相关的信息都存储于以进程的PID命名的目录中,即/proc/1234
中包含的是PID为1234
的进程的信息;
每个进程目录中存在着各种文件,它们可以使得应用程序简单地了解进程的内存空间、文件描述符列表、指向磁盘上的文件的符号链接和其他系统信息;
lsof程序使用该信息和其他关于内核内部状态的信息来产生其输出,所以lsof可以显示进程的文件描述符和相关的文件名等信息;
也就是我们通过访问进程的文件描述符可以找到该文件的相关信息;
当系统中的某个文件被意外地删除了,只要这个时候系统中还有进程正在访问该文件,那么我们就可以通过lsof从/proc目录下恢复该文件的内容。
linux系统常用性能参数命令相关推荐
- Linux系统运行时参数命令--网络IO性能监控
目录 5 网络IO性能监控 5.1 性能指标 5.2 网络信息 5.2.1 套接字信息 5.2.2 协议栈统计信息-netstat命令 5.2.3 网络吞吐-sar命令 5.2.4 连通性和延时 5. ...
- Linux系统运行时参数命令--Linux基础命令和工具
目录 1 Linux基础命令和工具 1.1 grep搜索字符 1.2 find查找文件 1.3 ls显示文件 1.4 wc命令 1.5 ulimit用户资源 1.6 scp远程拷贝 1.7 dos2u ...
- Linux系统运行时参数命令
文章目录 前言 一.Linux基础命令和工具 grep命令搜索字符 find命令查找文件 ls命令显示文件 wc命令计算字数 ulimit用户资源 curl http scp远程拷贝 dos2unix ...
- Linux:常用性能检查命令(内存、CPU 、网络、磁盘、Java应用)
目录 MAC地址 系统版本和内核版本 内存方面 free 作用 格式 主要参数 应用实例 vmstat 作用 格式 应用实例 CPU方面 查看CPU数量 lscpu top 语法 内容解释: 网络方面 ...
- linux 删除文件命令_Linux系统常用的文件管理命令
请关注本头条号,每天坚持更新原创干货技术文章. 如需学习视频,请在微信搜索公众号"智传网优"直接开始自助视频学习 1. 前言 本文主要讲解在Linux系统中,常用的文件管理工具有哪 ...
- 【收藏】Linux系统常用命令速查手册(附赠PDF档)
给大家收集整理了日常常用的Linux系统命令,仅供大家参考. 大家如果觉得文章看起来不太方便,获取<Linux系统常用命令速查手册>.PDF版. 联系小姐姐,备注"liunx命令 ...
- 【收藏】Linux系统常用命令速查手册(附PDF下载链接)
给大家收集整理了日常常用的Linux系统命令,仅供大家参考. 大家如果觉得文章看起来不太方便,可以在+qq. 2 3 5 53 3 1 0 4 6 备注"liunx命令",即可获取 ...
- linux可以用dos命令是什么意思,Linux系统常用命令与DOS命令的类似之处和本质区别各是什么?...
满意答案 iedsa3641 推荐于 2019.09.13 采纳率:56% 等级:8 已帮助:361人 Linux是一个非常优秀的操作系统,与MS-WINDOWS相比具有可靠.稳定.速度快等优点 ...
- Linux系统常用命令,指令详解及案例
现在的企业有90%甚至更过是使用Linux操作系统, 所以不管是开发还是运维, 不会点Linux知识肯定是无法进入到企业里工作. 而且, 全球500强超级计算机几乎都是使用Linux操作系统, 这也是 ...
最新文章
- css3弹性盒子模型之box-flex(--)
- .bat文件(%~dp0)和call、echo批处理环境变量
- openstack——使用命令行删除租户所有信息
- Java文件路径(getResource)
- 用原生 JS 实现 MVVM 框架2——单向绑定
- python调用网络摄像机
- vue2.0 自定义 饼状图 (Echarts)组件
- FusionCharts图表右键菜单的各种典型示例
- mybatis一简单one2one关系xml配置
- python制作回合制游戏脚本_Python制作回合制手游外挂简单教程(下)
- 用HTML写出能转换成合适的PDF文件(A4纸张大小)的相关问题和方法
- python3的print()函数的用法图文讲解
- ubuntu镜像安装教程
- springMVC-RESTful约束下dispatcher拦截对象优化
- 抑制背景干扰的行人重识别方法
- 区块链行业前景还好吗?区块链技术有没有经过时间的检验?
- vue中Route和router、routes的关系
- openpyxl基本使用
- ziheng - 测手速游戏
- 银行计算机专业面试,建设银行计算机专业面试问题汇总和精彩回答
热门文章
- 代码混淆之class-winter
- Python的numpy库中rand(),randn(),randint(),random_integers()等random系函数的使用
- 什么是面包屑导航,它对SEO的影响有哪些?
- vue-pdf插件实现pdf文档预览(自动分页预览)——基础积累
- Android开发者的寒冬:轮回之下,几人破茧,几人沉沦?
- 红米note4x装linux,红米Note4X怎么装卡/插卡 红米Note4X手机SIM卡安装图文教程
- file和base64格式转换
- python audioread 音频处理
- 2020年团体程序设计天梯赛-总决赛-题目
- 数据中心蓄冷系统选择-孙长青