Netflix 这家公司不知道你有没有听说过,《纸牌屋》这样的风靡全球的原创剧就是他们出品的。但我了解这家公司,还是从一个介绍他们公司文化的 PPT 开始的,那个 PPT 的第一句就写着,“我们只招成年人,并愿意为大家支付行业的最高薪资”,如果你想看这个 PPT,可以在视频号给小盖私信。

因为这周六小盖要和 Netflix 的资深架构师徐振中老师直播连麦,所以又开始看这家公司的故事了。不看不知道,一看吓一跳,原来这公司这么厉害。这周真的强烈推荐大家一定要看下这场直播,我们可以一起了解世界顶级的技术组织在技术、架构、组织和文化方面的创新。

下面是极客时间老师杨波总结的 Netflix 比较牛逼的点,你可以先看看。直播的话,点击下方红色按钮就可以预约了。小盖请这位老师费了老大功夫,估计一年就这一次了。

1、微服务很多公司(eBay、Amazon、BAT)都有,甚至比 Netflix 做得更早,但 Netflix 大概是大规模生产级微服务做得最杰出的。100s 范围的微服务,1000s 范围的每日生产变更,10,000s 范围的实例,1,000,000s 范围的活跃客户数,1,000,000,000s 范围的度量。但是只有 10s 范围的运维工程师,没有自己的数据中心 NOC,应该算微服务 DevOps 的最高境界了。

2、Netflix 微服务技术栈的核心组件基本上都是开源的。Pivotal 在 2~3 年前把 Netflix 开源的这摊东西封装一下改头换面,再拼凑一些其它东西(配置中心,调用链监控等)就变成了 Spring Cloud。现在大家耳熟能详的 Zuul 网关,Eureka 服务发现注册中心,Hystrix 熔断限流,Archaius 配置等组件,Netflix 在 2012 年左右就都开源出来了。

3、开放开源是 Netflix 的一种竞争战略。Netflix 为啥热衷于要搞开源?第一,他们想将自己的解决方案建立为行业标准和最佳实践。第二,开源可以帮助建立 Netflix 技术品牌,这有利于他们雇佣、留住和吸引顶级工程师。第三,Netflix 可以从共享生态中获得反馈输入并受益。

4、大致在 09 年左右, Netflix 就开始启动上公有云战略(当然背后也是吃了自建数据中心的苦头),应用逐步向 AWS 迁移,这个过程一共持续了将近 5 年,到 15 年的时候,迁移完毕,全部应用上到 AWS。09 年左右的 AWS 还不太成熟,别说当时,即使现在也没有几个大公司不掂量一下敢提全部迁移公有云的战略。

5、Netflix 在 AWS IaaS 的基础上封装打造了自己的 PaaS 云平台服务 (大部分组件开源),包括平台运行时服务 (Eureka、Zuul、Edda、Atlas),平台库和框架 (Karyon/Ribbon、Hystrix、RxJava、Governator、Servo、Archaius、Astyanax),平台大数据和缓存服务 (Cassandra/ES/Hadoop Platform as a Service、EVCache、S3)。平台工具和服务 (Asgard/Aminator、SimianArmy/ChaosMonkey、ICE),这些都某种意义上代表了硅谷的技术风向标。

6、业内最近开始提出云原生架构的理念,Pivotal 是这个理念的主要推动者(背后主要是要推它的 Cloud Foundry 产品)。其实 Netflix 在 2013 年就提出了 Cloud Native 理念,而且它的整个平台 (AWS IaaS + PaaS) 就是云原生的。

7、Netflix 原来用 Oracle 等传统 SQL 数据库,但是受到扩展性挑战。公司架构管理层大胆颠覆性提出使用 Cassandra NoSQL 作为主要的持久化化存储机制,Netflix 在 2012 年就做到大部分数据存放 Cassandra 和 S3 等非关系数据库上。这个架构决策也是非常大胆有魄力,一般没有几个公司敢这么干的。Cassandra 本质上是一种 KV 数据库,更像 sorted map 存储,不支持事务,不支持 join。在 CAP 理论中,Cassandra 是展现 AP 特性,无中心分散式高可用,天然支持跨数据中心数据同步,这大概是 Netflix 最看重的特性。Cassandra 是读慢写快的特性(一般数据库是读快写慢),Netflix 大量使用 Memcached 做缓存补偿。

8、近年容器技术大火,大家都在谈不可变基础设施的理念,本质就是镜像部署。Netflix 在 2012 年前就已经实现镜像部署,发布的单位是 AMI(Amazon Machine Image) 镜像,通过持续交付工具 Asgard(现在升级版叫 Spinnaker)直接将镜像推到 AWS 云中部署,支持蓝绿(需要至少两倍虚机),灰度和金丝雀等部署模式。

9、Netflix 的发布管道叫 Paved Road,就是平台团队铺好的路,由提交,构建,AMI 镜像烘焙 (Image Baking) 和发布四个阶段组成。金丝雀发布之后,系统会自动生成金丝雀健康报告和分数(背后需要统计上千个 metrics + 复杂智能算法),达到一定的分数,比如 80 分,才能继续 roll out。这个也称发布自动刹车。

10、Netflix 大胆提出反脆弱架构的理念。为了让你的系统更加健壮,不是将它们严格保护起来,而是主动随机性地的增加一些破坏性测试,逼迫研发人员做好高可用。Netflix 从周一至周五,上午 9 点到下午 3 点,混乱猴子军团会随机杀生产实例,这个叫 Chaos Monkey,还有增加延迟的 Latency Monkey。

11、Netflix 的技术这么牛逼,但它是没有技术 CTO 职位的,只有首席产品 CPO,工程团队和产品团队的 VP 都向 CPO 汇报。这样做更多是为了产品导向,便于技术和产品沟通合作,避免两边扯,避免业务驱动还是技术驱动的悖论,大家都是产品驱动。Netflix 把它称为 BusDevOps 组织架构。

12、Netflix 也没有独立的运维团队,架构 + 中间件 + 运维 + 大数据闭环统称为云平台工程 (Cloud and Platform Engineering) 团队,一个 VP 总负责,更好地对接 DevOps 文化。Netflix 的产品导向文化非常浓厚,连平台工程团队开源出来的产品都是整整齐齐的,PaaS 云平台是整个云平台工程团队最大的产品输出。

13、无论公司兴衰,始终支付市场最高工资。不用多解释,这大概是 Netflix 最有霸气底气和牛逼的一点。据我在米国的同学讲,去 Netflix 基本是硅谷顶薪,博士毕业去给开了超过 30 万美金的年薪(这还是前几年的行情)。一般进去难,去了留下来也不容易,不胜任的被客客气气劝退的有。能留下来的一般也不跳,因为再跳也没有更高的待遇了。

怎么样,震惊不?虽然我们并不在 Netflix 工作,也没法建立 Netflix 那样的文化,但他山之石,可以攻玉,Netflix 的很多技术、架构、组织和文化思路值得我们学习和借鉴。8 月 21 日,周六,早上 9 点 30 分,小盖会连麦他们的资深架构师来聊聊具体的细节,记得预约。

Netflix这公司居然没有运维,也没有CTO相关推荐

  1. Acrel-3000WEB电能管理系统运用互联网和大数据技术,为电力运维公司和售配电公司提供变电所运维云平台

    1 引言 2015年国务院发布<中共中央.国务院关于进一步深化电力体制改革的若干意见>(中发[2015]9号),简称"电改9号文".而本次新电改的重点是"三放 ...

  2. 电能管理系统运用互联网和大数据技术,为电力运维公司和售配电公司提供变电所运维云平

    Acrel-3000WEB电能管理系统在扬州某年产3GW高性能太阳能光伏组件项目 安科瑞 崔远航 摘要:在信息时代,电力信息系统的应用促迚了电力企业的収展,增强了电力系统运行的安全性与稳定性,对满足用 ...

  3. 没有运维的公司,如何选择服务器?公司一定需要运维吗?

    我们知道有很多中小企业是没有自己专职的运维人员的,特别是创业初期小公司,为了节约成本往往是不配置运维岗位.那么这些企业,该选择什么类型的服务器使得维护量最小?还有就是公司一定需要运维吗? 没有运维的公 ...

  4. 公司题库-运维方向-2018-04-26-待续

    运维工程师题库 数据库主从原理 LVS 原理 解释什么是nginx反向代理 zabbix监控哪些参数 DNS原理 主从架构,主服务宕机如何处理 主从架构,从服务宕机如何处理 nginx 和apache ...

  5. 什么公司需要Linux运维,为什么企业会需要Linux运维?Linux入门!

    提及Linux,很多人或许都会疑惑Linux是什么?为什么企业需要Linux运维岗位?关于大家的疑问小编一一为大家解答. 什么是Linux? 在我们的日常生活当中,接触到最多的就是Windows操作系 ...

  6. 虚拟vr设计公司降低企业运维成本

    随着新一轮科技**和产业变革的蓬勃发展,虚拟现实技术逐步走向成熟,拓展了人类感知能力,改变了产品形态和服务模式.中国正致力于实现高质量发展,推动新技术.新产品.新业态.新模式在各领域广泛应用,提供虚拟 ...

  7. 某公司职称系统运维流程

    A公司应用我公司职称软件已有三年.每年职称两个系列评审.一个工程系列,一个经济系列.工程是三个环节,分别为1:小组投票,2:组间投票,3:全体评审会:经济系列评审多了一个小组答辩环节. 评审过程一般分 ...

  8. 从自来水公司到社会工作者再做运维,我深耕 IT 一线的这 8 年

    作者 | 邓伟斌 出品 | CSDN博客 前尘往事 云破月来 在想着该如何下笔的时候,时光倒流到2013年10月21日,其实,在进IT行业前,金鱼哥还有一段插曲,当年离开自来水公司时,所从事工作的并不 ...

  9. 在创业公司,不懂运维的程序员如何兼顾公司的运维工作

    我是一名创业公司的Java开发工程师,公司没有运维团队,由程序员负责代运维. 公司的产品几乎都是部署在阿里云上,项目存在需要频繁改动并经常上线发布的情况.但通过Jenkins本地构建然后再发布到阿里云 ...

最新文章

  1. 下面我将随机抽取一名幸运女生,XXXXX
  2. 使用curl下载上传ftp
  3. Linux下getopt()函数的简单使用
  4. sql server 游标的使用方法
  5. QT 010 Qt 4.2 在线手册含UML图解释 User's Guide Documentation
  6. mysql中设置字符,MySQL 修改默认字符集
  7. java编写api取数据_Java 8 API 示例:字符串、数值、算术和文件
  8. CSDN博文写作规范文档
  9. html版权信息c怎么写,网页设计添加版权的语句肿么写
  10. 重启PocketPC移动设备
  11. 微信小游戏开发实战教程15-关卡编辑器的制作以及关卡分享功能的实现
  12. python牛顿法算立方根_使用牛顿法迭代求平方根与立方根
  13. [vue-router] Named Route ‘Layout‘ has a default child route. When navigating to this named route (:t
  14. 双屏下微信截屏错位解决办法
  15. line-height详解
  16. 使用Python玩转高等数学(2):幂函数
  17. python数字转换成中文大写_python初学者笔记(2):阿拉伯数字转换成中文大写
  18. “System.NullReferenceException”类型的异常在 App_Web_j2s3gau3.dll 中发生,但未在用户代码中进行处理的Bug解决方案
  19. STATIC和静态分析的必要性
  20. Android基础入门教程——2.5.1 Toast(吐司)的基本使用

热门文章

  1. 为什么php动态语言,动态语言静态化
  2. Linux之SSH协议知识点总结
  3. 简述sed、grep和parted的速查表
  4. mysql/mariadb命令如何获取帮助
  5. 单片机怎么用回调函数在不同文件之间传递数据
  6. html建立复选框,创建一个像html复选框一样的div
  7. 关于AttributeError: module ‘numpy‘ has no attribute ‘integer‘的解决方法
  8. 带花树[一般图最大匹配模板]
  9. php自动轮播图代码,JavaScript如何实现动态轮播图效果?(代码示例)
  10. 绘制图形可以使用什么python数据库_用Matplotlib如何绘制3D图形