Java监视的当前状态最大的问题是什么?

生产中的错误很像喝醉的短信。 您只有在事情已经发生之后才意识到出了点问题。 发短信日志通常比应用程序错误日志更有趣,但是……两者都同样难以修复。

在本文中,我们将执行一个12步的监视漏洞修复程序。 由Takipi用户的经验支持的思想实验,解决了您可能会遇到的一些最常见问题–以及您可以如何处理。

来吧。

步骤#1:承认我们有问题

实际上,这只是更高级别的应用程序可靠性问题。 为了能够快速了解​​应用程序何时出现问题,并能够快速访问所需的所有信息以进行修复。

当我们更进一步时,可靠性问题由监视和日志记录的当前状态下的许多其他症状组成。 这些是大多数人试图掩埋或完全避免的棘手问题。 但是在这篇文章中,我们将它们放在了焦点。

底线:不可避免地要对生产中出现的新错误进行故障排除和处理。

步骤2:关闭监控信息过载

一个好的做法是收集有关应用程序的所有信息,但这仅在度量标准有意义时才有用。 如果日志记录和度量标准遥测的可操作性只是事后的想法,则会产生更多的噪声。 即使它们产生漂亮的仪表板。

其中很大一部分是将异常和记录的错误滥用为应用程序控制流的一部分,从而以“正常”异常的悖论堵塞了日志。 您可以在我们这里发布的最新电子书中了解有关此内容的更多信息。

随着监视和数据保留成本的降低,问题开始转移到收集可行的数据并使之有意义。

底线:尽管逐渐变得更容易记录和报告所有内容,但错误根源发现仍然大部分是手动的,大海捞针越来越大,很难找到针头。

步骤#3:避免繁琐的日志分析

假设我们有一些错误,一个特定的事务有时会失败。 现在,我们必须在日志文件中找到有关它的所有相关信息。 是时候翻阅日志的方式了,或者使用诸如Splunk,ELK或其他日志 管理工具之类的可以使搜索更快的工具来处理不同的查询。

为了使此过程更容易,使用Takipi的开发人员可以将每个记录的错误,警告和异常的上下文扩展到导致它的源,状态和变量状态。 每条日志行都有一个链接附加到该链接,从而可以在Takipi中进行事件分析:

底线:手动筛选日志是一个繁琐的过程,可以避免。

步骤4:认识到生产日志级别不够详细

原木水平是一把双刃剑。 您登录生产的级别越多,您拥有的上下文就越多。 但是,额外的日志记录会产生开销,最好在生产中避免。 有时,您需要的其他数据将出现在“ DEBUG”或“ INFO”消息中,但是生产应用程序通常仅写入“ WARN”级消息或更高级别。

我们在Takipi中解决此问题的方法是使用最近发布的新功能,该功能使您能够查看线程中导致错误的最后250条日志语句。 即使它们没有在生产中写入日志文件。

等一下 无日志记录,无额外开销。 由于日志语句是直接在内存中捕获的,而不依赖于日志文件,因此我们能够在生产中进行详尽的描述,而不会影响日志大小或增加开销。 您可以在这里阅读有关它的更多信息,或者自己尝试 。

底线:从今天开始,您不仅限于WARN或更高级别的生产日志记录。

步骤#5:下一个说“无法复制”的人买了一轮饮料

推迟错误修复的最常见借口是“无法复制”。 缺少导致它的状态的错误。 不好的事情发生了,通常您首先会从实际用户那里听到它,并且无法重新创建它或在日志/收集的指标中找到证据。

从根本上讲,“无法复制”的隐藏含义是正确的。 如果您习惯于第一次听到用户的错误消息,则内部跟踪错误的方式可能有问题。 通过适当的监视,可以在实际用户报告错误之前识别并解决错误。

底线:停止复制“无法复制”。

步骤#6:打破日志语句重新部署周期

一种常见的臭名昭著且不幸的“无法复制”的解决方法是在生产中添加其他日志记录语句,并希望该错误再次发生。

在生产中。

搞乱真实用户。

那就是生产调试悖论。 发生错误时,您没有足够的数据来解决它(但您确实有很多杂音),添加了日志记录语句,进行了构建,测试(首先错过了该错误的同一测试),部署到生产环境,希望为使它再次发生,希望新数据足够或…重复。

底线:成功的监视策略的最终目标是防止此周期的发生。

步骤#7:APM +跟踪器+指标+日志=可见性受限

让我们提高一个等级。 我们已经介绍了日志和仪表板报告指标,现在是时候添加错误跟踪工具 和 APM了。

事实是,即使监视堆栈包括所有4类的解决方案,您进入应用程序错误的可见性也受到限制。 您将看到事务的堆栈跟踪,或者最多看到特定的预定义硬编码变量。 传统的监视堆栈在出现错误时无法查看应用程序的完整状态。

底线:在当今的通用监视堆栈中,有一个关键的缺失组件。 生产调试具有可变级别的可见性。

步骤#8:为分布式错误监控做准备

监视不会在单个服务器级别上停止,尤其是在微服务体系结构中,在一台服务器上形成的错误可能在其他地方引起麻烦。

尽管微服务提倡“关注点分离”原则,但它们还在服务器级别上引入了许多新问题。 在上一篇文章中,我们讨论了这些问题,并提供了可能的解决方案策略。

底线:任何监视解决方案都应考虑分布式错误,并能够对来自多个源的数据进行故障排除。

步骤#9:找到解决方法,以解决较长的故障排除周期

无论是警告问题还是仅是优先事项,对于大多数应用程序,在引入第一个错误之后,故障排除周期都需要数天,数周甚至数月的时间。 报告该错误的人可能无法访问或更糟,由于数据保留策略,相关数据可能长期未保存/滚动。

在这种情况下,即使在错误时刻冻结应用程序状态快照的能力(即使它来自多个服务/源)也至关重要,否则,重要数据可能会丢失。

底线:应避免较长的故障排除周期。

步骤#10:确认开发人员与运营者的困境

跟上发布周期的问题,我们所有人都在同一条船上,但是,开发人员希望更快地发布功能,而运营则希望保持生产环境的稳定。

短的功能周期和长的故障排除周期根本不会在一起。 两者之间应该保持平衡。 监视是一项团队运动,并且工具必须知道如何相互交谈。 例如,在Takipi,您可以获得有关Slack,Pagerduty或Hipchat的警报,并直接打开JIRA凭单,其中包含所有可用的错误分析数据。

底线:协作工作流加快了问题解决的速度。

步骤#11:有希望

现代开发人员工具正在采取重大措施来改善当前的监视状态。 无论是在日志,应用程序性能管理领域还是在进行中的新类别。

底线:密切注意工具生态系统的发展以及其他公司的最佳实践。

步骤#12:宣传

监视是软件开发不可分割的一部分,让我们继续进行讨论吧!

我们希望您对当前监视状态的一些主要问题感到满意/概述。 监控还有其他问题让您彻夜难眠吗?

请随时在下面的评论部分中分享它们。

翻译自: https://www.javacodegeeks.com/2016/08/12-step-program-realizing-java-monitoring-flawed.html

实现Java监视的12个步骤程序存在缺陷相关推荐

  1. java实现资源监视器_实现Java监视的12个步骤程序存在缺陷

    java实现资源监视器 Java监视的当前状态最大的问题是什么? 生产中的错误很像喝醉的短信. 您只有在事情已经发生之后才意识到出了点问题. 发短信日志通常比应用程序错误日志更有趣,但是--两者可能同 ...

  2. 制作模拟器JAVA程序,java游戏模拟器【突破步骤】

    喜欢使用电脑的小伙伴们一般都会遇到win7系统java游戏模拟器的问题,突然遇到win7系统java游戏模拟器的问题就不知道该怎么办了,其实win7系统java游戏模拟器的解决方法非常简单,按照 1: ...

  3. java端到端_Java应用程序性能监控:复杂分布式应用程序的端到端性能

    java端到端 通过从您的应用程序学习企业APM产品,发现更快,更有效的性能监控. 参加AppDynamics APM导览! 在最复杂和分布式环境中端到端监视Java应用程序性能-专注于业务事务. 自 ...

  4. Java后台微信点餐小程序开发最新版笔记,Springboot+Mysql+Freemarker+Bootstrap+微信小程序实现扫码点餐小程序,包含语音提示,微信消息推送,网页管理后台

    由于之前的Java后台微信点餐小程序有些知识点过时了,所以今天重新出一版,把里面过时的知识点更新下 前五章是部署笔记,后面是知识点的详细讲解,大家可以先看部署笔记,部署起来后,再跟着详细知识学习. 第 ...

  5. java项目制作成可安装exe程序

    java项目制作成可安装exe程序 文章目录 java项目制作成可安装exe程序 1.制作可安装的exe程序步骤 2. IDEA项目导出jar包 2.1. 打开project Structure 2. ...

  6. java计算机毕业设计基于微信小程序的药店药品销售管理系统APP

    项目介绍 随着信息技术和网络技术的飞速发展,人类已进入全新信息化时代,传统管理技术已无法高效,便捷地管理信息.为了迎合时代需求,优化管理效率,各种各样的管理系统应运而生,各行各业相继进入信息管理时代, ...

  7. 基于java+SpringBoot+HTML+Mysq+微信小程序+小说阅读网站

     详细功能设计:请点击下面链接查看 基于java+SpringBoot+HTML+Mysq+微信小程序+小说阅读网站_哔哩哔哩_bilibili 源码+论文获取: 源码+论文获取请私信获取 基于Spr ...

  8. java -version cmd_java如何运行步骤cmd?Java执行cmd命令方法有哪些?

    写好一个java程序之后,我们的最终目的就是可以正确的运行程序,如果程序运行正确了,那么代码也就没有什么问题了,可是java如何运行步骤cmd?接下来,我们就来给大家讲解一下这方面的内容. 1.首先用 ...

  9. 【JVM】Java对象创建的流程步骤

    · 本文摘要 · 罗列Java创建对象的各种方式: · 讲解Java对象创建的流程步骤: 一.Java创建对象的各种方式 · 1. 用关键字new,老少皆知的方法:StringBuffer sb = ...

最新文章

  1. SecureCRT连接虚拟机
  2. python调用其他文件中的函数或者类
  3. Spark on K8S 的现状与挑战
  4. 3D打印技术在医疗领域能做些什么?帮助精确完成手术
  5. 信息学奥赛一本通 2027:【例4.13】三角形
  6. 网页制作 网页下拉菜单HTML+CSS制作
  7. 以太网协议 | ARP协议详解-ARP报文结构解析
  8. php telnet 交换机,华为S2700交换机配置Telnet
  9. 钛灵科技入驻中国视界,共筑人工智能视觉产业新高地
  10. java源码系列:HashMap底层存储原理详解——5、技术本质-原理过程-算法-取模会带来一个什么问题?什么是哈希冲突?为什么要用链表?
  11. 关于新光源建设的一些想法
  12. 多台Linux服务器时钟同步
  13. 敏捷与结构性模块化(二)
  14. 倍福mySQL通讯_C#和倍福PLC之间的通讯控制
  15. selenium下Edge()配置错误问题
  16. 基于域名的恶意网站检测
  17. XStream的分析
  18. 服务器配置地址不正确,网络连接配置不正确IP地址是否正确网络存在问题..._网络编辑_帮考网...
  19. CadSoftTools Web CAD SDK 14.1.0.51184 Crack
  20. 深海迷航创造模式火箭怎么飞_深海迷航火箭怎么发射说什么没关 | 手游网游页游攻略大全...

热门文章

  1. Class.forName()和ClassLoader.getSystemClassLoader().loadClass()区别
  2. 关于Java类加载双亲委派机制的思考(附面试题)
  3. Jsoup代码解读之六-parser(下)
  4. Java 面试题经典 77 问
  5. (十三)RabbitMQ使用详解
  6. 已知两个链表A和B分别表示两个集合,其元素递增排列。请设计算法求出两个集合A和集合B的差集(近由在A中出现而不再B中出现的元素所构成的集合),并以同样的形式存储,同时返回该集合的元素个数。
  7. ssm使用全注解实现增删改查案例——DeptServiceImpl
  8. 2016蓝桥杯省赛---java---C---10(密码脱落)
  9. 2015蓝桥杯省赛---java---C---9(打印大X)
  10. 字符串暴力匹配算法+思路分析