项目场景:

linux服务器告警信息:Free inodes is less than xx% on /volume


问题描述:

linux服务器告警信息:Free inodes is less than xx% on /volume


原因分析:

经过查找,出现当前告警信息的原因是因为inodes的使用率达到了阈值,所以报警了。我的理解是某个文件系统inodes总数可能是100,由于一直创建文件,文件也不删除,可挂载点下的文件超过了80个,就会出现Free inodes is less than 20% on /volume的预警。


排查步骤:

第一步:查看所有文件系统inodes的使用率

df -i

此命令会列出所有文件系统inodes的总数,使用,剩余以及挂载点等信息。
我当前服务器上有个文件系统的inodes使用率达到了81%,挂载点是根目录。

第二步:查询挂载点inodes的占用情况,可以把每个文件夹都遍历一遍

for i in /* ; do echo $i find $i | wc -i;done > result.txt

第三步:肉眼查找一下,占用最多的那几项

可以看下这几项中,就这两天总共产生了多少个文件

第四步:我当前服务器是定位到了 /etc/spool/clientmqueue

经过查询,说是当前目录是邮件队列,即将发送而未发送的邮件,邮件如果发送失败,就一直会在。

第五步:查看一下发送邮件的服务

ps -ef | grep sendmail
//当前结果就是,有个Fcrondemon进程,那么大致能够确认跟定时任务有一定的关系

第六步:查看有哪些定时任务在执行

crontabl -l
//确认存在有计划任务在执行

第七步:关注几个日志,一个是计划任务的日志,一个是发送邮件的日志。

计划任务失败,会发送邮件给其他用户(哪些用户能收到,哪些用户收不到这个我不知道怎么配置),
由于某些问题(本身发送邮件的服务没有配置,或者配置有问题,都会导致发送邮件失败)
导致发送邮件失败,那么邮件队列中的邮件始终不能出队列,意味着这个 /etc/spool/clientmqueue
文件下只会一直产生文件。假设你的定时任务一分钟执行一次,都执行失败的话,
一天可能产生大概3600文件,这只是一个定时任务,如果开启多个,就算你删除了,没过多久就又会出现。

注:这个/etc/spool/clientmqueue 下的文件,我始终不能理解成要发送的邮件,更像是cron日志,因为
文件的内容本身有类似日志的一些输出,很随意的输出。里面还包含了一些类似发送失败的消息,因为什么发送失败了。接着就是标准的邮件格式。但是cron本身有自己的日志,所以这个文件不知道怎么理解。

解决方案:

1、看一下是不是真的需要执行这个定时任务。
2、检查一下发送邮件的配置,调试好发送邮件,成功使其发送邮件。
3、删除/etc/spool/clientmqueue下的文件,治标不治本。删除的时候可能因为由于太少,会失败。
参考:/var/spool/clientmqueue/目录下存在大量文件的原因及解决方法

注:

网上千篇一律都是这句话,但还是理解不来,有知道的大佬评论区支援一下~

linux服务器告警信息:Free inodes is less than xx% on /volume 排查相关推荐

  1. linux服务器怎么查看cpu配置信息,linux服务器cpu信息查看详解

    在linux系统中,提供了/proc目录下文件,显示系统的软硬件信息.如果想了解系统中CPU的提供商和相关配置信息,则可以查/proc/cpuinfo.但是此文件输出项较多,不易理解.例如我们想获取, ...

  2. Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决

    Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决 参考文章: (1)Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决 (2)https://www.cnblog ...

  3. Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决(续)

    Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决(续) 参考文章: (1)Linux服务器Cache占用过多内存导致系统内存不足问题的排查解决(续) (2)https://www. ...

  4. linux 硬件告警信息,shell 操作钉钉机器人实现告警提醒

    我们知道,之前的运维告警多通过mail 等方式通知到相应的人员,难以实现随时随地的查看.随着手机app的发展,很多告警开始发送到im软件上去.目前比较常用的是发送到微信和钉钉上,今天我们将重点放在钉钉 ...

  5. 飞鸽快信微信消息-LINUX服务器告警、状态监控预警、程序报警提醒等消息实时推送工具

    一.产品介绍: 飞鸽快信微信消息是一款基于微信的实时消息推送产品,可应用于服务器告警.LINUX服务器日志.状态监控异常提醒.阀值预警.程序报错报警提醒等场景,使用微信消息代替短信发送警告通知,实现精 ...

  6. java获取服务器信息返回前端,java程序获取linux服务器进程信息

    搜索了很多关于获取Linux的信息,但是没有发现获取linux服务器的进程信息详细说明. 在这里求解一下,能否在java代码中实现读取代码执行的本机linux服务器中的进程信息? 该问题又分为三个小问 ...

  7. android 通过xmpp即时聊天客户端往服务器发消息,利用XMPP协议推送服务器告警信息到安卓平台及桌面...

    XMPP的前身是Jabber,一个开源形式组织产生的网络即时通信协议. XMPP目前被IETF国际标准组织完成了标准化工作.标准化的核心结果分为两部分: 核心的XML流传输协议 基于XML流传输的即时 ...

  8. linux服务器监控信息,Linux 服务器监控

    概述 文字主要讲述使用linux自带的几个命令监控io.CPU.磁盘.内存.服务器整体信息等. IO监控 iostat命令 主要用于监控系统设备的IO负载情况 查看命令帮助 iostat --help ...

  9. Xshell连接远程Linux服务器失败Could not connect to ‘192.xxx.xx.xxx‘ (port 22): Connection failed.

    问题描述: 我将自己的一台Ubuntu系统笔记本作为服务器,然后使用另一台win10系统的Xshell去远程连接该服务器,始终不成功. [备注]这个远程连接解决的是同一局域网中的远程,算不上真正的远程 ...

  10. 查看Linux服务器raid信息笔记整理!

    原因: 有些情况下服务器系统不是自己装的,raid也不是自己配置的,或者当你接收一个岗位,远程登录系统后可能就不知道系统是否有做raid,raid级别?因此在这里博主总结一下Linux下查看软.硬ra ...

最新文章

  1. mac自带php7降级,MAC更新自带php版本到7.0
  2. ubuntu服务器mysql管理 第一弹
  3. WAS6集群部署及初步测试
  4. 编程判断某个数为素数_【每日编程233期】素数对猜想
  5. jsp页面整体无法居中问题的解决方案
  6. 从零开始学电脑_《新手从零开始学电脑》1.6——怎样才能打一手好字
  7. oracle0数据库论文总结,大学oracle数据库总结(考试必备)
  8. lucene学习笔记_学习Lucene
  9. Activity嵌套fragment大全,activity加载单个fragment,TabLayout+ViewPager实现多个fragment滑动效果
  10. win7系统还原失败怎么解决
  11. 构建适用于Oracle 11.2.0.x的Linux单数据库实例的DataGuard
  12. java bank项目答案_Bank项目-java
  13. C语言中数组变量和指针变量
  14. Symantec 不用密码卸载
  15. java类Writer和类Reader小结
  16. Python简明教程之后应该学什么?
  17. 异常信息:Unable to update index for aliyun|http://maven.aliyun.com/nexus/content/groups/public/ 解决方法
  18. 《修C传》——初始C语言 <凝气篇>
  19. oracle计算sql运行时间,如何计算正在运行的SQL已经执行的时间?
  20. 程序媛眼中的 PingCAP:无法抗拒的五大吸引力 | PingCAP 招聘季

热门文章

  1. win7加快开机速度
  2. 阿里开源的升级思考:开源委员会的三个关键行动点
  3. Java8新特性学习第一天
  4. android ShareSDK分享,QQ,微信,新浪等分享
  5. 编写README文档(Markdown)
  6. c语言递归阶乘汉诺塔文曲星游戏词典制作文件调用整合
  7. 基于C# SQLServer开发学员管理系统
  8. python 审批流系统
  9. 模板类继承后找不到父类函数的问题
  10. 【python爬虫实战】【天天基金网】还在用余额宝存钱?5分钟教你学会筛选优质货币基金