我们之前维护的集群经常性地出现失联的情况,大数据集群上,还有es集群在跑,在凌晨左右集群会有随机的机器间歇性失联,cpu飙高,ssh登录不了。
在尝试了诸多方法后,通过每天定时清理缓存的方式解决了集群失联的问题。生产环境的大数据集群每天会有大量缓存,若不清理,就会导致内存使用率一直居高不下,长此以往,集群机器就容易失联。

手工释放linux内存

To free pagecache, use
echo 1 > /proc/sys/vm/drop_caches;to free dentries and inodes, use
echo 2 > /proc/sys/vm/drop_caches;to free pagecache, dentries and inodes, use
echo 3 >/proc/sys/vm/drop_caches.

选择echo 3 >/proc/sys/vm/drop_caches可以直接清理pagecache, dentries and inodes

在跳板机上,写个脚本,加入定时任务,即可

cd /etc
mkdir mission
cd mission
vim clean_cache.sh

#!/bin/bash
for i in {xxx..xxx}; do ssh 192.168.xx.$i "echo 3 > /proc/sys/vm/drop_caches"; done

crontab -e

0 0 * * *       /etc/mission/clean_cache.sh
0 12 * * *      /etc/mission/clean_cache.sh

每天0点和12点,各跑一次,清理集群缓存,可以有效解决集群失联问题

查看任务运行状况
cat /var/log/cron

大数据集群失联问题解决方案相关推荐

  1. 阿里云TSDB在大数据集群监控中的方案与实战

    目前大部分的互联网企业基本上都有搭建自己的大数据集群,为了能更好让我们的大数据集群更加高效安全的工作,一个优秀的监控方案是必不可少的:所以今天给大家带来的这篇文章就是讲阿里云TSDB在上海某大型互联网 ...

  2. 克服大数据集群的挑战

    克服大数据集群的挑战 数据存储曾经是大数据的最大挑战.由于云计算基础设施的进步,存储数据不再是关键问题.如今,数据科学家所面临的最大问题是数据收集. 集群化使得大数据分析更容易.然而,集群也给数据工程 ...

  3. 小知识点:ARM 架构 Linux 大数据集群基础环境搭建(Hadoop、MySQL、Hive、Spark、Flink、ZK、Kafka、Nginx、Node)

      换了 M2 芯片的 Mac,以前 x86 版本的 Linux 大数据集群基础环境搭建在 ARM 架构的虚拟机集群上有些用不了了,现在重新写一份基于 ARM 架构的,少数不兼容之外其他都差不多,相当 ...

  4. 大数据集群搭建全部过程(Vmware虚拟机、hadoop、zookeeper、hive、flume、hbase、spark、yarn)

    大数据集群搭建进度及问题总结 所有资料在评论区那里可以得到 第一章: 1.网关配置(参照文档) 注意事项:第一台虚拟机改了,改为centos 101 ,地址为192.168.181.130 网关依然是 ...

  5. Hadoop+Spark 大数据集群日常1 (There are 0 datanode(s) running报错 处理)

    Hadoop+Spark 大数据集群日常1 由于项目涉及Hadoop+Spark大数据集群,特写此文档,方便将来处理类似问题参照,也为后人提供解决方案. 本人才疏学浅,文档难免有错漏与不妥之处,欢迎与 ...

  6. 【大数据集群搭建-Apache】Apache版本进行大数据集群各组件环境部署

    [大数据集群搭建-Apache]Apache版本进行大数据集群各组件环境部署 1)大数据环境统一 1.1.设置主机名和域名映射 1.2.关闭服务器防火墙和Selinux 1.3.服务器免密登陆 1.4 ...

  7. 那些年,我们迁移过的大数据集群

    大数据集群迁移这件事,不知道有多少同学做过.我说的不是把一个集群的数据备份到另一个集群上.我指的是整个数据平台与大数据相关的所有集群及业务的迁移工作,从一个机房到另一个机房. 具体范围可能包括:从离线 ...

  8. 数据蒋堂 | 大数据集群该不该透明化?

    作者:蒋步星 来源:数据蒋堂 本文约1500字,建议阅读5分钟. 通过本文为大家解读大数据集群透明化的利弊! 这好像是个多余的问题,大部分大数据平台都把集群透明化作为一个基本目标在努力实现. 所谓集群 ...

  9. centos7 ambari2.6.1.5+hdp2.6.4.0 大数据集群安装部署

    2019独角兽企业重金招聘Python工程师标准>>> 转载请务必注明原创地址为:http://dongkelun.com/2018/04/25/ambariConf/ 前言 本文是 ...

最新文章

  1. springboot配置定时任务及常用的cron表达式
  2. 在使用ToolBar + AppBarLayout,实现上划隐藏Toolbar功能,遇到了一个坑。
  3. python爬虫知乎图片_Python爬虫入门教程 25-100 知乎文章图片爬取器之一
  4. 在MyEclipse中,jsp文件输入中文,文件不能保存
  5. jvm学习笔记(3)——java对象的内存分配和对象的回收(GC)
  6. STM32F103:二.(6)mrc522卡号读取
  7. 成也炒作,败也炒作?孙宇晨遭遇最大信任危机
  8. Ghost8.0分区备份与恢复详细图解
  9. attachEvent中this指向(转)
  10. 修改整合的Jfinal的Model自动绑定表插件 AutoTableBindPlugin
  11. 大学计算机vb基础知识6,计算机基础课-VB6选择题汇编(2011-2016)
  12. archlinux设置屏幕亮度
  13. 解决win10中无法打开CHM文件的方法
  14. aria2 linux 编译,Centos 7 编译安装Aria2
  15. Canonical标签怎么使用,Canonical标签有什么作用?
  16. 记一次 黑软件 kthreaddi 攻防战
  17. 5G手机网优测试软件,5G测速WiFi测量仪
  18. 什么是CVR,CTR,CPC,CPA,ROI?
  19. 概率论知识回顾(二):古典概型,几何概型
  20. 网站内容快速填充的技巧和方法

热门文章

  1. Collection类和泛型
  2. LeetCode.191:关于十进制与二进制的浅薄理解
  3. 函数式编程中的函数是什么?
  4. DophinScheduler ui部分 核心代码详细解析——重中之重的src文件夹里究竟有何种玄机
  5. 第八章 DataStream API
  6. 呵,偶居然也能“说教”了
  7. stm32F767开发版基本介绍
  8. 从 Spec.到芯片_(数字IC、模拟IC、FPGA/CPLD设计的流程及EDA工具)
  9. linux没办法识别u盘,linux系统下不能识别U盘
  10. 中国黄芪注射液市场评估与投资战略报告(2022版)