晓查 栗子 方驭洋 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

一位曾经的谷歌工程师,花费两年时间,辛苦整理了一份清单。

这个名为“xg2xg”的清单,原本是这位前谷歌工程师(ex-Googler),为所有离职的谷歌工程师写的一份“厂外”生存指南。

但实际上,这个大全实打实地也成为了一份最佳开发工具大全

所有的程序员,都能受益于此。

美国网友对这个大全给予了很高的评价:这份清单中列出的开源软件,不仅解决了硅谷大厂前员工的难处,也能为其他所有码农解除困惑。

在这套大全的指导下,任何一个工程师,都能获得类似在谷歌内部写代码的体验。xg2xg上线仅仅一天就登上趋势榜,收获2500+星!

清单其中大部分替代软件是Google开源的项目,或者是受谷歌论文的启发,由开源软件基金会自己做的第三方实现。即使你从来没进过Google工作,也在享受着Google工程师们带来的福利。不禁让人感叹“谷歌拯救世界”。

下面就让我们一起来看看这份清单吧。

开发工具一览

这份清单总共有两部分,前半部分介绍的是码农常用的开发工具,包括核心技术、基础设施、服务、开发运维等;后半部分则面向非技术人员。

核心技术工具

大数据处理工具

Google内部工具:MapReduce;
替代品:Apache Hadoop、Spark

想要在上千台机器组成的大集群上、并行处理上TB级别的海量数据集,就要用到这类大规模数据处理工具了。

MapReduce,就是这类工具的先驱。Jeff Dean等人2004年提出了这个分布式计算架构,最早在Google内部用来处理大规模数据的并行计算。Jeff Dean还亲自为它撰写过使用指南。

而Apache Hadoop这个开源替代品,也是根据Jeff Dean当年的论文自行实现而成,能提供与MapReduce文件系统类似的功能。

如果想要更快的数据处理速度,还有Apache Spark供你选择。相对于Hadoop的MapReduce会在运行完工作后将中介数据存放到磁盘中,Spark使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。

序列化工具

Google内部:Protocol Buffer;
外部替代品:Protobuf、Thrift、Avro

这一组工具用于结构化数据序列化,上面这些,都是xml替代品,比它更小、更快、也更简单。

Protocol Buffer和Protobuf都是Google开发的序列化格式(Serialization Format),github上可以找到这个项目的源代码。

比起XML和JSON,Protobuf 更小、更快,也更简洁,很适合做数据存储或 RPC 数据交换格式。只需要定义一次数据结构,就可以利用各种不同语言或者从各种不同数据流中对结构化数据进行轻松读写。

完全撇开Google,也不是就没有别的选择了。其他厂商也有类似的序列化方案。

比如Facebook开发的Thrift ,它与Protobuf基本一样。

Avro 同样也有schema(也就是程序中结构化数据的定义),但是实现方式跟 Protobuf 和 Thrift 有很大区别。

由于数据不需要额外的标注,Avro 在序列化大量相同的数据时会比 Protobuf 和 Thrift 更有效率。不过在编码大量变化的数据时,因为schema会随数据一同存储,Avro的效率会退化到 JSON 和 MessagePack 的级别。

看来在核心技术工具上,重回人间的前Google人还是有许多不错的选择的。

基础设施

大型集群管理系统

Google内部:Borg;外部替代品:Kubernetes、Apache Mesos、HashiCorp Nomad

大型集群管理系统用于管理云平台中多个主机上的容器化的应用。

Borg是Google内部的大型集群管理系统,现如今应用最广泛的服务编配系统Kubernetes就脱胎于Borg。

Borg 让开发者能够不必操心资源管理的问题,做到跨多个数据中心的资源利用率最大化。

没有Borg十五年的经验,也就不会有Kubernetes。虽然作者把它放在开源/真实世界这一栏里,但事实上Kubernetes也是由Google设计并参与开发的。

Kubernetes使用Go语言编写, 是一个大而全的解决方案,服务调度、网络、存储、安全通通一手抓,而且本身的架构也非常好,在上面做二次开发非常容易。

HashiCorp Nomad同样是一个比较常见的开源调度程序,架构简单,能将资源管理器和调度程序的功能集成到一个系统中。Nomad也是分布式的,高可用且易操作。但显然Kubernetes的功能会更丰富。

至于Mesos,它仅仅是一个调度系统,无法直接使用,要配合各种 Mesos framework 来实现各类功能。

存储

当然,Google内部工具也不是所有的都能找到完美的替代品。

至少在存储这件事情上,就有网友不赞同原作者观点。他认为这份清单在一定程度上具有误导性,某些替代品根本达不到Google内部工具的水平。

比如将Colossus和HDFS对比是在开玩笑,相比之下,HDFS就像是一个玩具。要说对比,它智能和十年前已经退役的GFS相当。

但HDFS恐怕是开源软件中Colossus最好的替代品,对于“通用,大型,分布式文件系统”的使用情况,很难找到有比HDFS更好的了。

其他开发工具

列表中还有服务、开发运维、安全等工具的替代品清单,由于篇幅限制,我们不再一一介绍,有需求的同学可以自取。全部工具的下载链接请参阅文末的GitHub地址。

还有什么福利

如果你不是工程师,上面那些工具大概就用不上了。不过,只要是个公司或者团队,总会有IT和运营需求。

比如说,饭总是要吃的

很多网友看了这份清单,最感兴趣的就是这一项:

离开Google的人类,再也找不回免费食堂。

毕竟,“中午吃什么”的哲学问题,每次想起来都是折磨。

羡慕的时候,可以用以下口令来安慰自己:

公司有吃的,还不是为了让你们多点时间工作?

如果你觉得这一条说服力不够,还可以跟一句补充说明:

Google最初是为什么提供免费食物的?就是山景城总部周围吃的选择太少了,开车出去吃来回要一小时。对,就是想让员工省下时间好好上班。

吃,只是IT/运营章节的第一条。

后面,还有梗图生成器Memegen

工作太辛苦的时候,可以皮一下:

 当没有GPU的人,遇到了Google Colab

对此,甚至有人呼吁:

如果Google全家桶把Memegen收了就好了。

所以,这个章节并没有和工作相关的资源么?

看看完整列表的话,还是能找到的:

有一些必要的小工具。

比如,CODEOWNERS可以用来指定哪些用户来审查代码,1Password是个密码管理器。

也有一些同学,没在上面找到自己需要的答案,便直接提问了:

Google这样的大厂,公司内部wiki用的是什么啊? 我们公司用的是Quip,它就是个黑洞,文档一进去就出不来了。

然后,有热心人士回答了这个问题:

虽然不知道Google用的什么,但Confluence是很常用的。

xg2xg项目地址:
https://github.com/jhuangtw-dev/xg2xg

最佳开发工具大全!前谷歌工程师两年打造“厂外生存指南”,登上GitHub热榜相关推荐

  1. 谷歌EfficientNet缩放模型,PyTorch实现出炉,登上GitHub热榜丨Demo可用

    郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 谷歌上个月底提出的EfficientNet开源缩放模型,在ImageNet的准确率达到了84.1%,超过Gpipe,已经是当前的stat ...

  2. 快递员要失业?两位前谷歌工程师研发出自动驾驶汽车只送货不载人

    一家名叫Nuro.ai的新公司在自动驾驶汽车技术上提出了一种完全不同的概念.但与目前遍布全球的自动驾驶初创公司不一样的是,Nuro的重点并不是以现有车型为基础打造自动驾驶出租车或自动驾驶卡车,而是设计 ...

  3. 前谷歌工程师差点因为不知道贝叶斯公式被拒

    (点击上方公众号,可快速关注) 编译:伯乐在线 - 飞哥的咖啡 http://blog.jobbole.com/113652/ 为什么程序员找不到工作:4 个恐怖故事 [伯乐在线导读]:当求职被拒时, ...

  4. 高通平台开发工具大全, 百分之九十的工具都可以下载

    高通平台开发工具大全, 百分之九十的工具都可以下载 高通骁龙(Qualcomm Snapdragon)是全球领先移动处理器芯片生产厂商,高通旗下骁龙处理器产品划分为四大阶级:骁龙800.骁龙600.骁 ...

  5. GitHub 热榜:中国博士开发可交互全球疫情地图,登上柳叶刀!

    点击上方"视学算法",选择"星标"公众号 重磅干货,第一时间送达 转自量子位,作者郭一璞 一个多月前,当你被困在家里无法出门的时候,可能每天早上第一件事就是看看 ...

  6. GitHub热榜第一:中国博士用 ArcGIS Dashboard开发可交互全球疫情地图,登上《柳叶刀》!...

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng AI博士笔记系列推荐: 博士笔记 | ...

  7. 清华大学计算机陈立杰,陈立杰:婉拒谷歌、获清华特奖,95后登上全球计算机顶尖舞台...

    原标题:陈立杰:婉拒谷歌.获清华特奖,95后登上全球计算机顶尖舞台 沉迷游戏=学业荒废?陈立杰或许是个例外.今年3月15日,理论计算机科学领域最顶级的国际会议STOC 2019会议上,陈立杰斩获Dan ...

  8. 把命令行玩成“迷你谷歌”:可搜索、计算,还能翻译 | GitHub热榜

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 还在用浏览器打开谷歌.百度 ...

  9. 谷歌ALBERT模型V2+中文版来了:之前刷新NLP各大基准,现在GitHub热榜第二

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 作者:十三.发自.凹非寺 转自:量子位(QbitAI),未经允许不得二次转载 比BER ...

最新文章

  1. Fib(兔子问题)python实现多种方法
  2. EMC助力广东福彩中心容灾系统建设
  3. textarea 在浏览器中固定大小和禁止拖动
  4. 定题信息服务是从什么角度_格木教育谢浩浩:事业单位综合应用概念分析题之角度界定技巧...
  5. vb6实现union数据结构_数据结构与算法——并查集(不相交集合)
  6. JavaScript 数组详解
  7. Spring Aware接口
  8. Java单例模式优化写法
  9. 创建一个Java :: Geci生成器
  10. 第一百零四期:搞清这些陷阱,NULL和三值逻辑再也不作妖
  11. TIM SWEENEY:引擎及图形学的未来
  12. (转)在编写Spring框架的配置文件时,标签无提示符的解决办法
  13. 杭电4561 连续最大积
  14. Flat-Lattice-Transformer项目经验教训
  15. 陌上花开(三维偏序)(cdq分治)
  16. 基于RV1126平台imx291分析 --- 回顾之前的注册
  17. python三菱modbus解密_Modbus PLC攻击分析:Python和Mbtget读写PLC
  18. 菜鸟学习C++之Console Application
  19. python编辑器怎么放大字体_增大python字体的方法步骤
  20. ROSDUCT:通过rosbridge在本地公开远程ROS主题、服务和参数

热门文章

  1. 网易OpenStack部署运维实战
  2. Ubuntu下架设FTP服务器(转)
  3. 无边框窗体的移动(winform/wpf)
  4. PCL点云库用贪婪投影三角法网格化实现点云的表面重建
  5. c++ Boost库之boost::bind学习
  6. linux命令之创建符号连接-ln
  7. Tomcat 安装与使用
  8. Verilog读写文件
  9. 4kyu Sum by Factors
  10. swift添加下拉刷新_React Native自定义下拉刷新组件