运维,哎,多么沉重的话题,初创公司的运维,哎,还能愉快的聊天吗?

初创公司的运维,如今其实兼技术支持、系统管理员(SA)、网管、网络工程师、研发工程师、架构师,干着这些看似不相干甚至矛盾的工作。

他们的具体工作?

  • 在办公室中安装系统、帮同事排除机器故障
  • 在机房插网线、搬机器、拆服务器箱子
  • 天天盯着N个监控屏幕、8小时一动不动盯着流量图
  • 在 BOSS、开发工程师、网络/系统工程师、DBA 中间跑来跑去进行沟通
  • 在夜半三更收到服务器监控系统的警报,起床赶到机房,节假日陪女朋友收到报警也得赶到机房(当然更多的是没女朋友)

。。。。。。初创公司有那种整天斗地主,麻将下棋的吗?(还缺人吗,会打麻将的那种)

上面这些是有一定规模的公司运维的工作,当然初创公司同样的工作也是要运维来做的,而且不乏一人当多人用,即使是这样,当出现下面这些问题或需求时,怎么淡定呢?

  • 系统升级,如升级成 centos7 换成了 systemd,不少运维脚本都得重写
  • 业务上加了中间件,需要迅速监控上
  • 研发,运营,QA,产品经理都找你要业务数据,用户数据,测试数据等
  • 监控的数据要高度可视化,BOSS 一眼也能看懂
  • 业务层面的数据也需要一同监控,运营需要的用户信息也想可视化。。。。

于是找个大的 Zabbix/Nagios 框架,不停的写脚本,进行后期维护,图表不好看,那再接上 Graphite,这些如果熟悉还好,不熟悉的话还得先花一个月(?)去学习,而且规模大了一个人也不一定搞定的了,,,,但作为一个初创企业/团队,需要这么麻烦吗,真的需要弄这么大一个轮子吗,真的需要配备专门的人力去做这么这些事吗,毕竟公司一共就这几个人。。。。。

解放人力或者说把人用在更重要的地方(不是说运维不重要)才是现在公司应该采取的策略,现在市场上有那么多监控软件,找到自己适合的就要用啊啊啊啊啊,把一般运维的工作分散,服务器托管,用第三方工具,例如:

  • IDC 机房改成云服务器,安全也有保障,还提供免费的流量等监控
  • 对海量日志信息进行收集存储,并提供实时搜索功能,辅助快速定位故障
  • 通过第三方 APM 产品进行性能分析,故障诊断,缓慢代码定位等自动化运维任务
  • 收集服务数据,只要有线上服务在运行,服务数据流经过的所有节点产生的数据,都要采集、存储和分析起来,供不同的运维场景使用
  • 业务数据,运营数据通过直接 SDK/API 倒入实时显示图表的工具上,使得所有数据可视化
  • 设置监控告警,实现应用软件、中间件、数据库、主机、网络、存储、云资源的全方位监控告警
  • 所有数据统一平台,谁想看什么数据都有

运维的本质——可视化,当你把应用所用的所有服务器数据,业务层数据,日志等都监控起来,都有相应的可视化的数据,出现问题都有据可查,或者根据已有数据做趋势预测,设置报警,出现问题时第一时间知道(网站反应慢了第一个发现的是运维而不是用户),公司不管哪个部门需要的数据都可以放在一起看,简直完美!

硬广来袭,非战斗人员迅速撤离~~~

作为次时代系统监控工具,数据处理平台 Cloud Insight 完全能够解决上述问题,目前已经做到:

  • 一键部署,40s完成 Linux/Windows/Docker 系统服务器监控
  • 简单配置,支持30+ 数据库,中间件组件监控
  • 支持 SDK(API 开发中) 自定义上传时间序列数据
  • 仪表盘,自定义你的个人风格仪表盘
  • 告警/事件流,针对全指标设置报警策略

hostmap 等功能还在完善中,功能那么多,放哪张图好呢,好纠结。。。放张仪表盘展示 SDK 自定义上传数据的吧!

已经有很多初创公司选择 Cloud Insight,因为部署简单迅速,支持的组件也多,可以自定义上传数据,有技术支持来解决问题,有一批(注意这个词是「批」)开发人员在不断增加功能,还有什么理由不用呢?

好啦,回答一下标题的问题:初创公司谁来当你们的运维?当然是 Cloud Insight 啦。。。

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。想技术文章,请访问 OneAPM 官方技术博客。

本文转自 OneAPM 官方博客

转载于:https://www.cnblogs.com/oneapm/p/5367262.html

初创公司谁来当你们的运维相关推荐

  1. 从零搭建一个自动化运维体系

    作者简介: 胥峰,著有畅销书<Linux运维最佳实践>.译著<DevOps:软件架构师行动指南>,资深运维专家,有 11 年运维经验,在业界颇具威望和影响力.2006 年毕业于 ...

  2. 2022爱分析·IT运维厂商全景报告 | 厂商征集

    "十四五"规划纲要指出,未来将培育壮大人工智能.大数据.区块链.云计算.网络安全等新兴数字产业,随着国家信息化建设的逐渐深入,信息系统已成为企业核心竞争力的重要组成部分,作为信息系 ...

  3. 陌陌运维主管:我们是如何搞定600+设备的初创公司办公室网络环境的 | 36氪

    陌陌运维主管:我们是如何搞定600+设备的初创公司办公室网络环境的 | 36氪 陌陌运维主管:我们是如何搞定600+设备的初创公司办公室网络环境的 | 36氪 陌陌运维主管:我们是如何搞定600+设备 ...

  4. 传统运维团队转型应该注意哪些问题?

    2018年已经接近尾声,回顾这一年,国内企业都在进行数字化转型,大家越来越关注如何提升效率.在这一过程中,颠覆性的IT技术正在加速落地:容器技术.Kubernetes的使用已经越来越普及,云计算和大数 ...

  5. 智能化运维最佳实践-自动化

    伴随着互联网以及大数据时代的到来,IT信息系统已经成为最重要的数据载体和信息来源, IT系统在企业内部的重要性日益突出:但是随着企业信息化程度的提高.IT环境规模的扩大和IT环境复杂度的增加.行业内服 ...

  6. Linux运维-服务器系统篇

    Linux运维-服务器系统篇 开篇导读: 本篇博文是此系列教程的第二课,在这一课中将大概的介绍一下服务器上的操作系统,了解一下它的基本概念和发展历程. 服务器系统的概念和作用 如何理解服务器操作系统? ...

  7. 运维团队能力建设的另一思路

    笔者在专栏前面的文章里曾描述过广义的运维服务体系,而运维服务是通过团队中每位成员来具体落实的,它是团队能力输出的一个综合结果. 那么如何搭建一个优秀的团队才能输出高质量.稳定.可靠的运维能力呢? 角色 ...

  8. 从携程瘫痪事件看运维的85条军规

    1) 承载能力优先 --随后再进行优化 -- 不遵守这条规则必定带来故障停机时间.不要在故障停机时间的压力下进行优化--要先集中精力提高承载能力. 2) 以Postgres为例,一定要确保你的每一个网 ...

  9. 电商大数据平台运维案例

    技术栈 数据流向 平台规模 差异化,隔离化 YARN: https://baike.baidu.com/item/yarn/16075826?fr=aladdin 今天先到这儿,希望对您在系统架构设计 ...

最新文章

  1. cd: mkdir: rmdir: rm
  2. 面试官:CAP都搞不清楚,别跟我说你懂微服务!
  3. 使用UrlRewrite时修改form的action属性问题
  4. 【JavaMail-收取邮件】
  5. Qt Creator在属性之间添加绑定
  6. 图像处理程序,在状态栏显示图像尺寸
  7. CF1083(Round #526 Div. 1) 简要题解
  8. Dart 语言入门基础(一)
  9. java 制作圆形按钮_Java制作圆形按钮
  10. Mac OS X 内核Rootkit开发指南(转)
  11. 牛牛的旅游纪念品 动态规划背包问题
  12. HZOI20190903模拟36 字符,蛋糕,游戏
  13. Smartbi报表工具的学习笔记,如何学好报表分析?
  14. 使用UE4创建一个简单真实的地球(一)
  15. vue设置页面背景色
  16. 2021-01-20
  17. [斜率优化] 特别行动队 commando
  18. nginx 如何将 https 请求转发到 http
  19. 一文科普区块链技术:未来注定将颠…
  20. 如何使用graphpad做柱形图_Graphpad Prism 8作图教程(2):XY图的属性设置

热门文章

  1. Google服务完整清单
  2. .NET支持的泛型约束
  3. GNU C之__attribute__
  4. JavaScript语言精粹JSON解析器源码阅读
  5. javaweb项目中发布webservices服务
  6. [剑指Offer] 59.按之字形顺序打印二叉树
  7. 78. Subsets
  8. 图标和文字对齐的方法
  9. puppet原理及配置
  10. Dynamics CRM2013/2015 检索实体属性的两种方式