在企业信息化建设的过程中我们经常会遇到以下场景:

场景一 无法整体感知使用情况

领导:帆软的报表系统上线这么长时间了,不知道咱们是不是真正用起来了啊?平时大概有多少人能用到?访问频次怎么样?花大量人力开发的那些模板有多少用起来了?

业务人员:这个......之前还没统计过,我去查一下,也许后台会有这些数据的......

场景二 无法前置暴露性能问题

领导:现在我们报表系统内存怎么样?够不够用?CPU整体什么水平?需要换个性能更优的CPU吗?

业务人员:额,总体上应该是够的吧,好像偶尔会内存较高、CPU持续暴涨,之后我们记录下这些情况呢......

领导:现在报表有没有什么明显问题,都是新招的年轻人开发的,质量不一定有保证。

业务人员:这个现在也很难衡量,只有说出现问题了再去回溯,确实做不到预见性的判断......

场景三 缺乏排查宕机问题条件

生产报表使用者:信息部,报表系统宕机了,赶紧重启,整条生产线都停了!

业务人员:好的,正在重启,稍后我问一下帆软的技术支持看看什么原因......

帆软技术支持:您好,请问宕机之后有导出dump文件吗?还是直接重启了啊?

业务人员:没时间,都是生产一线,不可用时间越短越好,不能等导完dump再重启。

帆软技术支持:是这样,排查下来应该是内存溢出的问题,但是没有dump文件无法分析具体是哪张报表导致的,很抱歉。

(于是宕机的问题很难等得到有效解决,陷入一旦宕机、立即重启、无法分析的死循环......)

场景四 无法快速获得系统基本数据

业务人员:你好,想问一下,这个XX插件为啥在我们的服务器上用不起来啊,我看在我本地是可以的。

帆软技术支持:您好,请问您的jdk版本是多少?现在的jar版本是多少啊?

业务人员:稍等哈,我去查查......

以上问题在很多企业中都会遇到,给企业运维人员造成一定的困扰。能不能有一个完整的运维报告,一下子解决上述场景的所有问题呢?

在帆软面前,答案是肯定的。

众所周知,系统的稳定和高效是业务成功使用的基础,要达到这样的效果离不开专业的运维团队,但往往运维有着较高的技术门槛和人力要求,并且传统的人工运维有着周期长、无法24小时工作的局限。

但无需担心,这些困难都可以通过帆软云端运维解决——上传云端运维数据,经云端计算就可以获得完整、全面的系统健康检查分析报告!

云端是指帆软为客户提供的云中心分析计算引擎,云端运维相比于本地运维具有大计算、零成本、低门槛、高成长等等优势,帆软希望通过云端运维和本地运维两种方式丰富运维功能,发挥各自优势,为系统的稳定可用保驾护航,目前已有327个客户加入了云端运维的大家庭。

看得见的新功能开发 ,我们在努力做

1、访问次数&用户数

想感知有多少用户访问了系统、频次如何?

2、访问模板数

不清楚开了那么多模板当中有多少是能被用到的?

3、内存走势

想确认是否有内存溢出的危险时刻?

4、CPU走势

想了解系统压力最大时的稳定运行风险?

5、运维指标

和技术人员定位、确认问题时,连系统的基本信息都无法快速提供?

6、业务指标

想对比一些新模板上线后,系统使用的月度指标是否有提升?

看不见的老功能优化,我们在持续做

在已经上线一段时间的模板性能风险分析&宕机情况分析这两个功能上面,我们也未满足于现有的成绩,依然不断验证准确性、改进算法,力求为用户提供更可靠的数据。

1、整体概览

  • 得分量化,横向比较系统月度稳定性波动情况
  • 关键指标(宕机次数、重启次数)一目了然,重中之重优先展示

2、宕机情况分析

分析宕机时间、问题模板、数据量、耗时、问题数据集、可能存在的问题等

3、模板性能风险分析

分析问题模板及数据集,不仅仅在宕机发生后补救,出现不良苗头就及时处理

4、效果验证

通过对部分有条件导出dump文件的客户进行判断结果对比,云端运维的宕机、模板分析准确性已有了可观的提升(案例过多,不做全部展示,且保护用户隐私,对模板、数据集信息打码)

dump分析结果:

云端运维报告分析结果:

现今我们已经取得了这样的成果,但我们仍在为提升哪怕一个百分点而努力

  • 是否宕机及宕机时间判断准确率(所有宕机场景):76%
  • 是否宕机及宕机时间判断准确率(算法覆盖的内存异常、CPU异常场景):87%
  • 内存异常场景宕机模板判断准确率(报告所推荐的不多于三张可能造成宕机问题的模板覆盖到dump分析定位到模板的概率):73%

这一切努力为的只是真正帮到客户解决问题(不做全部展示,保护用户隐私,不公布客户信息)

不易察觉的小细节,我们在用心做

除功能以外,在您不易感知的交互、操作等细节问题上,我们也在默默提升......

  • 更直观的说明图——一张流程图让您了解云端运维的含义
  • 更贴心的报告demo预览——方便您快速了解报告提供的内容、信息
  • 更便捷的多月范围选择——批量操作时无需多次操作,一步搞定
  • 更快速的一键上传——无需繁琐步骤,一键点击直接生成报告
  • 更省心的上传——取消了勾选以后还需保存的操作,不再因为交互的问题增加困扰

注:此优化在12.04及以后jar版本

摆脱数据安全困扰,无后顾之忧

在功能优势的同时,帆软对于云端的特性也兼顾了数据安全方面的考虑,确保使用没有后顾之忧。

  • 数据脱敏——只涉及产品改良和应用运维所需数据,绝不涉及业务数据
  • 数据披露——用户可以随时看到上传了哪些数据
  • 保密协议——如有需求,可以签署保密协议(支持线上签署)

系统运维遇上了大救星,是什么让IT效率提高48%相关推荐

  1. 龙蜥利器:系统运维工具 SysAK的云上应用性能诊断 | 龙蜥技术

    简介:本文从大量的性能诊断实践出发,来介绍 SysAK 在性能诊断上的方法论及相关工具. 文/张毅:系统运维SIG核心成员.SysAK 项目负责人:毛文安:系统运维 SIG 负责人. 系统运维既要业务 ...

  2. Linux系统运维九大技能及知识总结,90%日常运维

    Linux 系统运维九大技能及知识总结,搞定 90% 日常运维 | 周末送资料 以下内容包括RedHat和CentOS运维工作中常用的几大技能,并总结了系统运维中网络方面的规划.操作及故障处理等知识. ...

  3. 墨天轮社区专属福利:与作者互动问答,民工哥全新力作《Linux系统运维指南:从入门到企业实战》送上!...

    墨墨导读:最近人民邮电出版社出版了新书<Linux系统运维指南:从入门到企业实战>,本书是同名经典畅销书的升级版,基于MySQL 5.7版本进行了内容改写,同时穿插介绍了MySQL 8.0 ...

  4. 分享这两年从事Linux系统运维行业的感受

    2019独角兽企业重金招聘Python工程师标准>>> 2015年6月,一次偶然的机会让我这个非科班出生的人从事起了运维(operation)的行业.这两年间,从大的讲,运维社区.技 ...

  5. linux系统运维面试题

    标签:linux系统运维面试题 1.     简述常用高可用技术 解答: Keepalived:Keepalived是一个保证集群高可用的服务软件,用来防止单点故障,使用VRRP协议实现.在maste ...

  6. vue-ueditor 后端配置项没有正常加载_当运营商遇上极简流畅的产商品配置体验

    "销售品配置复杂!" "销售品展示的信息偏IT,不直观!业务部门不能理解!" "销售品配置到上架时间漫长!" "对一线营销支撑能力 ...

  7. 机器人铁锈斑斑好吗_工业机器人系统运维员是什么职业?这个职业好吗?

    工业机器人系统运维员是什么职业?这个职业好吗?去哪里学?这些问题可能是很多想要从事这一行业的朋友所想要问的问题.那么工业机器人系统运维员这个职业您之前一定没有听过,因为这一职业是国家新设立的职业,属于 ...

  8. 封神系统-运维大脑的日志检测

    简介:封神-运维大脑 | 日志检测工具 1. 背景目标 阿里云应用业务有问题,云平台监控可以发现问题,但并不能定位到问题根本原因,运维大脑监控底层日志,可快速定位问题原因,帮助现场运维同学解决问题. ...

  9. 机器人铁锈斑斑好吗_工业机器人系统运维员是什么职业?这个职业好吗?去哪里学?...

    工业机器人系统运维员是什么职业?这个职业好吗?去哪里学?这些问题可能是很多想要从事这一行业的朋友所想要问的问题.那么工业机器人系统运维员这个职业您之前一定没有听过,因为这一职业是国家新设立的职业,属于 ...

最新文章

  1. 027_jdbc-mysql几个常用的日期类型
  2. python外星人入侵游戏代码_Python游戏:外星人入侵游戏编程完整版!内附代码
  3. 【转载】我心目中最好的框架组合是
  4. 《白鹿原》金句摘抄(五)
  5. 【IOS】获取wifi名称 (即SSID)
  6. php静态资源服务器,Node实现静态资源服务器
  7. 小程序影视APP/追剧吧/脱离微擎/可用火车头采集小程序影视
  8. 为什么调用webservice接口只有 string arg0_快速开发平台中关于支持第三方接口开发的指导
  9. Spark 基础 —— RDD(创建 RDD)的两种方式
  10. CentOS 6.5设置静态IP教程 并且可以ping通
  11. eclipse配置java开发环境_Java中Eclipse开发环境配置
  12. 最新版最简单SPSS 26安装详细教程
  13. 后台业务管理系统高保真Axure原型模板
  14. wilcoxon秩和检验--学习笔记
  15. 股票经典书籍推荐(豪华版)
  16. 瞎子摸象——shopnc篇
  17. 打开服务器网页要5秒,网页优化技巧 如何把网页加载时间控制在1.5秒以内
  18. 国资优选—兰溪市金融控股投资有限公司思想工作会议召开
  19. linux 将当前时间往后调整2分钟_linux调整系统时间 永久 z | 学步园
  20. 【Android学习】图片

热门文章

  1. mysql允许所有用户连接_Mysql权限控制 - 允许用户远程连接
  2. vue-router路由、mixin混入、vue-resource、axios、计算属性watch、moment.js、vuex、vue-cli、数据双向绑定、搭建vue环境、vue实例、配置启动项
  3. 服务器重启导致无法启动MySQL
  4. 前1%的产品经理和前10%产品经理的区别
  5. 2020年中国OTT大屏服务行业研究报告
  6. 产品经理必备的两种心态
  7. java课程设计(图书管理系统)
  8. php限制ip访问次数 并发_PHP实现redis限制单ip、单用户的访问次数功能示例
  9. 需求分析师的基本功:逻辑思维、逻辑分析与逻辑表达
  10. 来看各种数值的反转吧(洛谷P1553题题解,Java语言描述)