应当如何面对线上的异常/故障

看起来毫无意义的一个问题,碰到线上异常/故障如何面对,排查解决了不就好了,但是这真的只是第一层。

最近在想“消防”这个词语很有意思,它其实是两层意思:

  • “消”是消除问题
  • “防”是防止问题

即“消防”这个词语表达的意思应该是先消除问题再防止相同的问题再次发生。其实线上的异常/故障也是同样的道理,我们应当先及时止血,把问题处理掉,然后深挖问题,探究根因,举几个例子:

  • 假设是某段代码的空指针异常导致的,那么是否考虑加强Code Review,或者使用findbugs插件去自动扫描代码中可能的异常?
  • 假设是线上某个配置修改导致的,那么是否今后变更的修改必须有人双重检查一遍才可以修改?
  • 假设是本地内存中某些值因为系统重启丢失导致的,那么是否引入定时任务,定时把值写入本地内存中?
  • 假设是某段代码逻辑没测试到导致的,那么是否可以反思总结为什么这段逻辑没有测试到,未来的测试应该如何改进?

根据我过往的经验,太多公司、太多团队处理线上的问题仅仅满足于把问题处理完就完事,忽略了对问题的复盘,这对团队/对公司的发展都是不利的。

什么是真正的技术能力

之前加了几个技术微信群,看到很多技术朋友在兴高采烈地讨论各种源码,spring源码我彻底撸了一遍、最近深入学习了dubbo底层实现方式,当然曾经的我也是这样的,记得学习volatile的时候一直挖到了volatile在硬件层面上的实现方式,但是这真的说明技术能力强吗?从今天的思考去看这个问题,我认为这更多反应的是一个人的学习能力、钻研能力以及对技术的热情,除此之外再体现不出太多其他东西了。

这个话题,可能是这一年思考的最多个的一个点,钻研是好事,但是实际上大多时候的深入钻研并不在实际工作中有用,且研究得越深,忘得越快,因为研究得越深,那么这个技术点关联的技术点就越多,边边角角的忘了,核心的东西不容易串起来。那么什么是真正的技术能力,我画一张图概括一下:

简而言之,技术能力 = 解决问题的能力,那么同样都在解决问题,大家之间的技术高低又有什么区分呢?我认为有以下几个层级:

  • 第一层级,解决当下问题
  • 第二层级,以优雅且可复用的方式解决当下问题
  • 第三层级,解决的问题不仅仅能满足当下,还能满足未来一段时间

其实从这个角度上来看,不同的技术能力,在工作过程中区分度是很明显的:

  • 写的代码是否存在异常风险,多线程运行下是否存在线程安全问题,某段代码是否会导致内存泄露
  • 写的代码是否优雅可复用,设计的框架是否足够符合开闭原则,代码结构层次是否清晰明了
  • 针对特定的场景,技术选型、库表结构设计是否足够合理,今天你设计的框架是只能用一年,还是未来三年五年都可以持续使用
  • 来了一个大的需求,就比如做一个App的会员体系功能好了,是否可以在充分分析需求后,精确将需求划分为几个特定的子模块并梳理清楚模块之间的关系

越厉害的人,在代码设计与开发过程中,越能看到想到一些别人看不到想不到的问题,这叫做高屋建瓴;当代码运行出现问题的时候,有人1小时排查出问题,有人1分钟发现问题,这叫做举重若轻。

因此我认为解决问题的能力才是技术能力的真正体现,这一年对技术的探究我也从研究源码更多的转变去学习设计模式、去学习分布式环境下各种NoSql的选型对比、去学习使用Lambda让代码更简洁,往真正在实际工作中解决问题的方向去努力。

另外,抛开这个点,这两天我在思考,还有一个体现技术能力的点,就是学习能力。现实中的全栈是很少的,互联网这个行业的程序员的方向通常有几类:

  • 服务端
  • 前端
  • 移动端
  • AI
  • 嵌入式
  • 大数据

在同一类中,基础知识、基本概念、思维方向是一致的,更多可能差异在开发工具、语言上,我精通Java,但是如果明天有一个需求,使用nodejs、scala、go更好,那么是否可以快速学习、快速上手?甚至明天有一个需求需要写前端代码,是否可以快速开发、无bug上线?

所以,解决问题的能力 + 学习能力,是我认为真正的技术能力,不过说到底,学习能力某种程度上也只是为了解决问题而已。

不要轻易造轮子

曾几何时,当我们看着github上这么多优秀的源代码的时候,默默立誓,这辈子我一定要写出一个牛逼的框架,开源在网上。

曾几何时,公司招聘的时候,技术负责人激情满满地介绍着公司内部自研了多少系统并在线上投入使用。

很多对技术有追求的朋友,进入一家公司可能时时刻刻在寻找机会去做一些自己造轮子的事情,但是就如同前面所说的,衡量真正好技术的标准就是能否实实在在地解决问题,自己造轮子风险高、周期长,且需要长时间的验证、排坑才能达到比较好的效果。

随便举几个例子,在互联网发展的今天:

  • 数据库连接池有dbcp、c3p0、druid
  • 本地缓存有ehcache、要用中心缓存有redis、tair
  • 服务化有dubbo、跨语言可以用thrift
  • 分布式任务调度可以考虑schedulex
  • 搜索可以选es、solr
  • 更高级一点图片存储可以用七牛、im可以用融云/环信、音视频这块声网做得比较成熟,所有这些都提供了各个开发版本的sdk,接入简单

只要你有的技术方面的需求,绝大多数业界已经有了成熟的解决方案了,根本不需要去专门自己搞一套。因此我认为轻易一定不要造轮子,如果一定要造轮子,那么请想清楚下面几个问题:

  • 你要做的事情是否当前已经有了类似解决方案?
  • 如果有,那么你自己做的这一套东西和类似解决方案的差异点在哪里?假设不用你这套,基于已有的解决方案稍加改造是否就能达到目的?
  • 如果没有,那么为什么之前没有?是你们公司这种场景是独一无二的?还是这种场景对应的解决方案根本就是不可行的所以之前没人去搞?

如果想清楚了这些问题,那么就去干吧。

关注软技能的成长

这个点之前没有写到,深感遗憾,文章发表之后一直想要补充进来,因为关注软技能的成长是我这一年除了技术思维转变以外成长最大的地方。

我们是一个技术人没错,技术是我们每个人的立身之本,但是在工作中我们又不是单纯与代码打交道:

  • 我们有PD,需要向他们了解需求的整体交互
  • 我们有业务,需要全面了解需求的背景
  • 技术团队内部,我们需要相互之间沟通进度,交流技术方案、设计方案
  • 技术团队外部,我们需要对相互之间的交互方式,上下游进度不理想如何去推动
  • 出了问题,我们需要知道对外应当怎么说,对内应该怎么做
  • 有一个想法,应当如何以正确的方式去落地,而不是我有一个想法直接说也不说、讨论也不讨论干就完事了

凡此种种,都需要经历和成长,曾经我也以为程序员只要把代码写好就好了,来了阿里,才深刻地感觉到写代码真的只是工作的一部分(可能50%?)而已。

我相信无论你在50个人的小公司还是在5000个人的大公司,身处3个人的技术团队还是30个人的技术团队,没有一个人是单兵作战的,这个行业对技术人的要求从单纯的技术要求已经越来越往综合素质去靠,所以,关注对自己软技能的,相信无论对当下还是对未来,百利而无一害。

去提升看问题的高度

过去有太多人在我的公众号或者博客下反馈了一个问题:在这个公司,整天做着增删改查的工作,对自己一点都没有提高。

对于这种看法,说难听点就是四个字----目光短浅。我们看:

如果以普通的视角去看,那么一颗树那也就只是一棵树而已,但是如果跳脱出目前的视角,站在更高的角度去看,它其实是森林的一部分。你的主管并不是因为他是你的主管所以他就应该你比更高瞻远瞩,而是因为他看问题的高度比你更高、想得更远、做得更深,所以才成为了你的主管。

把这个问题说得实际点:

  • 假设今天你负责的是一个系统,那么你仅仅是把这个系统的基本原理搞懂了?还是可以把上下游有几个系统、每个系统之间如何调用、依赖方式都理顺?
  • 假设今天你负责的是一块业务,那么你仅仅把自己负责的功能点弄清楚了?还是你可以从最上游开始,到你负责的系统,再到最下游,都思考得非常透彻?

今天与其在抱怨没有机会、抱怨公司对自己能力没有提升,为什么不去思考机会为什么降临在别人头上不降临在你头上?为什么别人可以从小公司写着一样的增删改查走向BAT而你年复一年还在小公司写着增删改查?当你真正能转变自己的思维模式,跳脱出现在的圈子往更高一个层次去看问题、去提升自己,我相信总会有发光发热的一天的。

同样在阿里巴巴,马老师思考自然、思考环保、思考人类的发展,你的主管思考团队未来的方向和打法,我们在思考如何把某个客户需求完整落地,这就是高度,你未必能想到马老师想的,但是你可以对标层级高一点的人,一步一步尝试往他们的高度去靠。

总而言之:眼界决定高度,多看、多想、多保持好奇心、多问几个为什么,久而久之自然就迈上了一个新的台阶。

学会总结

需求、项目的复盘是非常重要的一部分内容,然而我之前见过的太多团队、太多Leader,只顾着一个迭代接着一个迭代,一个版本接着一个版本,只满足于把需求做好,而忽略了总结的重要性。

我认为大到项目、小到需求,如果在完成之后缺乏总结那么某种程度上来说是失败的,可以总结的点非常多:

  • 通过这个项目/需求,是否吃透了某一块业务,搞懂了来龙去脉
  • 通过这个项目/需求,是否充分理解了公司某个技术框架/基础组件的用法
  • 在整个项目的设计上,有哪些做的不好的地方
  • 在整个项目的开发(针对程序员而言),是否踩了坑,犯了低级的错误
  • 在整个项目的进度把控上、人员安排上、上下游协调上,是否存在不足之处
  • 经历了某次大促的值班,是否对可以熟练使用公司的监控工具,遇到突发事件,是否快速有效地进行了解决

任何工作一定对个人都是有提升的,但是不会总结的人,在每个项目/需求中成长的东西都是散的,久而久之就忘了。通过充分的总结之后,犯过的错误我们不会二次再犯,理清楚的业务的来龙去脉铭记在心,对自己是一种提升,分享给别人对别人也是很大的帮助。

失败者失败的原因各有不同,成功者的做事方式总是相似的,从宏观角度去看,我认为总结就是成功者之所以能成功,很重要一个原因。

作者:五月的仓颉
原文链接:阿里一年,聊聊我成长了什么 - 五月的仓颉 - 博客园

造轮子是什么意思_聊聊在阿里工作一年的收获,什么是真正的技术能力?相关推荐

  1. 造轮子是什么意思_精炼:我造轮子的秘诀

    过去的几年里,我一直在打造各式各样的编程相关的工具.这些工具有的是用于指导软件开发工作,有的是用来进行编程学习,还有的纯粹是为了提升技术而写的.在我写了越来越多的工具,接触了越来越多的工具思路之后.我 ...

  2. 造轮子是什么意思_程序员发文质疑阿里天启为kpi项目,重复造轮子,阿里回应:诽谤...

    前言: 曹丕在<典论·论文>中说到,"文人相轻,自古而然".中国自古就有文人相轻的传统,文人相轻真没有什么要紧的,就像是小夫妻似的斗斗气拌拌嘴,然后还可以理直气壮地拿稿 ...

  3. 造轮子是什么意思_程序员为什么热衷于造轮子,升职加薪吗?

    作者:小傅哥 博客: https://bugstack.cn- 沉淀.分享.成长,让自己和他人都能有所收获! 一.前言 哪个架构师没造过轮子? 你想过这样一件事吗? 是先具备能力在安排职位,还是先安排 ...

  4. 校验输入框的内容不能重复_答应我,用了这个jupyter插件,别再重复造轮子了

    以下文章来源于Python大数据分析 ,作者费弗里 1 简介 在使用Python.R等完成日常任务的过程中,可能会经常书写同样或模式相近的同一段代码,譬如每次使用matplotlib绘制图像的时候可以 ...

  5. json转string工具_不要再重复造轮子了,这款开源工具类库贼好使!

    Hutool是一个小而全的Java工具类库,它帮助我们简化每一行代码,避免重复造轮子.如果你有需要用到某些工具类的时候,不妨在Hutool里面找找.本文总结了平时常用的16个工具类,希望对大家有所帮助 ...

  6. 个人网站开发之前端首次造轮子_篇一【前端大作业】【gowork.fit】

    文章目录 一,前言 二,开发目的 三,页面样式 四,顶部导航栏 五,最后 一,前言 最近有一个需求:我采用了纯原生前端,没有使用框架,从0到1达到了百分百原创代码,作为主后端开发的我,前端开发技术非常 ...

  7. 动手造轮子:实现一个简单的基于 Console 的日志输出

    动手造轮子:实现一个简单的基于 Console 的日志输出 Intro 之前结合了微软的 Logging 框架和 Serilog 写了一个简单的日志框架,但是之前的用法都是基于 log4net.ser ...

  8. 动手造轮子:实现一个简单的依赖注入(二) --- 服务注册优化

    动手造轮子:实现一个简单的依赖注入(二) --- 服务注册优化 Intro 之前实现的那版依赖注入框架基本可用,但是感觉还是不够灵活,而且注册服务和解析服务在同一个地方感觉有点别扭,有点职责分离不够. ...

  9. 动手造轮子:实现简单的 EventQueue

    动手造轮子:实现简单的 EventQueue Intro 最近项目里有遇到一些并发的问题,想实现一个队列来将并发的请求一个一个串行处理,可以理解为使用消息队列处理并发问题,之前实现过一个简单的 Eve ...

最新文章

  1. 转载:有关SQL server connection Keep Alive 的FAQ(3)
  2. 让 ScrollViewer 的滚动带上动画
  3. Linux高负载下优化MYSQL(一)
  4. 当我们在谈深度学习时,到底在谈论什么(三)--转
  5. ifstream 打开中文路径乱码问题处理
  6. 安装kerberos报错 error: command 'gcc' failed with exit status 1
  7. python 当前时间减一个月_python排序了解一下
  8. 官网MySQL下载速度慢的解决方法(5分钟内搞定)
  9. 从零实现深度学习框架——理解正则化(一)
  10. 124. PHP 性能分析
  11. Linux下安装HP打印机的驱动程序
  12. 一套完整的网络视频监控系统设计方案
  13. Xmind 8思维导图使用方法
  14. PS 羽化工具使用
  15. 鸿蒙系统学习系列 | 上手HarmonyOS十大必看指南!
  16. 数据分析,把握商机 关键词采集工具助你挖掘潜在客户
  17. 关于echarts自定义合并中国地图分区展示的问题
  18. 提笔忘字低龄化 电脑难辞其咎
  19. YOYO 软件下载及8个使用技巧
  20. telnet -测试端口号

热门文章

  1. 华为云企业级Redis:集群搭载多DB,多租隔离更降本
  2. 掌握这20个JS技巧,做一个不加班的前端人
  3. Spring中部署Activiti流程定义的三种姿势
  4. 【开发记录】Linux常用命令记录(一)
  5. 补习系列(7)-springboot 实现拦截的五种姿势
  6. js html转义字符串,js中html拼接特殊字符转义
  7. Django使用Python操作数据库 --Django 1.8.2 文档(中文)部分笔记
  8. java web inf_Java Web中如何访问WEB-INF下的XML文件
  9. 2020年7月4日 随机过程大作业
  10. LaTeX设置参考文献条目行距以及条目内行距的方法