扫码参与CSDN“原力计划”

作者 | 村中少年
来源 | CSDN原力计划获奖作品

现在有越来越多的公司都参与了开源,其背后有各自的目的所在,姑且不予讨论。本文是从多个方面分析各大公司在开源上的投入情况。由于全世界绝大多数的开源项目都有发布到Github上,因此本文将会基于GitHub的数据进行分析。2019还没有结束,本文先回顾一下2018年的各项指标,从以下几个方面进行分析:

  • 2018哪些主要的公司参与了GitHub开源贡献

  • 2018这些主要的公司分别有多少人参与了GitHub开源贡献

  • 2018这些主要的公司分别参与贡献了多少个开源项目

  • 2018年这些主要的公司贡献的开源项目中,有哪些是比较有代表性的

  • 2018年这些主要的公司在的开源项一些代表性的项目中,都有多少人参与

  • 2018这些主要的公司参与贡献的所有项目累计star数量是多少


相信通过以上的这些指标,就能够大致大判断出每个公司在GitHub上的贡献情况。

OK,关于如何获取Github上所有相关仓库数据,相信看过我一系列分析GitHub开源文章的同学都已经知道,再啰嗦一下,链接见这里。当然自己可以写SQL语句查询,但是发现fh大神已经将这些数据过滤存储到2018_top_contributors数据表中。站在巨人的肩膀上,没有必要再重复的查询,我们直接分析一下该表即可,如下图是我截取的表中包含国内BAT三家公司排名的部分数据,作为概览:


当然其编写的SQL语句(Details部分)还是有点小复杂,感兴趣的可以自行学习下,具体的SQL过滤语句我就不多说的。

原理背景知识

如果你使用过git的话,一般会要求你配置用户名和邮箱,做为commit提交时候的用户记录。因此可以根据邮箱名统计该用户属于哪个公司。比如microsoft.com可以作为微软公司内部邮箱标识,google.com可以标识谷歌,amazon.com可以标识亚马逊,国内例如alibaba-inc.com可以标识阿里,baidu.com可以标识百度。因为公司参与开源项目也是有目的,有的是未来的一个布局,有的可能仅仅是公司内部的KPI考核。因此以公司邮箱提交的代码往往表示的是这个公司支持的开源,也可以看做该公司的在开源的贡献。但是有的大公司所推出的公共邮箱服务需要注意,往往是以个人名义参与项目时候的用户信息会填写如gmail.com,outlook.com,yahoo.com,hotmail.com,qq.com,163.com,foxmail.com,126.com这些公共邮箱,不能作为公司的统计。

主要公司有多少人参与了GitHub开源的贡献

下图是2018年度公司GitHub上贡献人数超过30人的前20名。


哪些主要的公司参与了GitHub开源贡献

可以看到上表一共统计出了95个公司,业界知名的公司都有包括,以下是这95个公司按照员工投入数量的排名词云图:

1. 如果按照员工数量的排名,2018自微软员工参与GitHub开源的最多,共计1717名用户参与了push活动。当然还包括谷歌,redhat,ibm等诸多公司。

2. 可以看到前二十名的公司都有超过100人参与了2018年年度的GitHub开源贡献,说明在开源上各大公司还是投入了相当多的人力。

3. 百度,阿里,腾讯,在Github开源中投入了100+的人力,排名也很接近,不排除各家之间暗自竞争。

4. 在我以前的文章中也总是提到伯克利这个学校在所有的教育机构中,github上的投入排名位居榜首。

这些主要的公司分别参与贡献了多少个开源项目

投入的人力是一方面的指标,参与项目的数量也可以作为一个参考,如下表:


1. 如果按照每个公司参与的项目数量排序的话,谷歌公司共计参与了1543个项目,微软参与了1295个项目,远远领先于其他公司。

2. dependabot出现在了前十名,并且员工个数如此至少,基本上平均每个人参与了很多的项目。

3. 如果计算每个项目上各个公司平均投入了多少人力,会发现基本都是1。也就是说每个项目都是一个人在维护。

但是如果按照每个人平均参与的项目数量进行排名,则会得到下图所示的结果:

可以发现,排名靠前的都是一些不太出名的机构和公司。这个指标是否可以说明一个问题:虽然像google这样的大公司参与了很多的开源项目,但是很多的项目可能并没有参与实质性的贡献,可能只是提交了一些注释等方面的解释性信息。

这些主要的公司贡献了哪些比较出名的开源项目

由于每家公司都参与了很多的开源项目,比如微软和谷歌2018年度都参与了上千个开源项目,不可能罗列出所有的项目。同时上述分析了,其参与的很多项目有的并不是主要贡献人员。因此需要选取一些比较具有代表性项目。统计每个公司参与的所有项目2018年度star数量,用以表征这个项目的火爆程度,并选取star数量最多的前三名,如下图:


1. 通常来说这种火热的项目背后都是某个大公司支持的,如果某个公司的员工参与进来,说明该项目对于该公司具有一定的价值。

2. 比如微软2018参与的所有项目中,最火的包括了自家的vscode以及TypeScript。

3. google参与的项目中也有自家的tensorflow,以及目前主推的flutter等,投入人力数量可见其重视程度。

4. rehat参与的kubernetes虽然不是自家的产品,但是rehat在kubernetes的贡献仅次于其发布者google,只有两个人倒是出乎意料。

5. FB的react以及pytorch都是当下火热的项目,也是其当家开源产品,而且都投入了不少的人力。

6. 其实你会发现一个现象,就是各个公司前三的项目,重合的概率非常的小,说明各公司还都是专注自己的领域。因为一旦一个微软帐号贡献了tensorflow,那么top3中就有tensorflow,因为该项目的star数是很多的。

由于篇幅有限,无法将每个公司参与的具有代表性的开源项目一一列举,我这里面绘制了这95家公司每一家所贡献项目中star数排名前3名的项目词云,并按照2018年的star数量统一排名,如下图:

可以看到上述词云基本能够反映出时下火热的技术方向,包括可以flutter、react、tensorflow、pytorch、kubernetes、vscode、node等项目,其实也是说明了技术的导向基本是这些大公司推动的。

如果按照每个项目各公司参与人数排名,绘制得到的词云图如下:

1. 可以看到很多项目投入的人数基本相差不大,因为投入最多的edx-platform项目为66人,其他的主流项目基本都在20+。

2. 投入的人数较多可以说明的是该项目目前还在频繁迭代中已经公司的重视程度。更多内容可以查看2018_top_contributors数据表。

2018这些主要的公司参与贡献的所有项目累计star数量是多少?

每家公司参与项目所有累计的star数量前20如下表:

95家公司每家公司参与项目在2018年度所有累计的star数量排名词云:

1. 因为star数量表示的是一个项目的火爆程度,这个排名我觉的可以用来衡量一家公司在开源领域的影响力。

2. 像google在2018年贡献的所有项目star总量为858566,微软为418351,FB为298144,数量非常之大,是否可以说明这些公司在引领开源。

3. 国内的BAT也都排进前20,说明国内企业的影响力在进一步提高。

综上来说,目前开源领域还是以微软,谷歌,rehat等公司贡献较多,这些贡献也意味着未来一些领域的话语权。

技术的道路一个人走着极为艰难?

一身的本领得不施展?

优质的文章得不到曝光?

别担心,

即刻起,CSDN 将为你带来创新创造创变展现的大舞台,

扫描下方二维码,欢迎加入 CSDN 「原力计划」!


精彩推荐

开幕倒计时15天|2019 中国大数据技术大会(BDTC)即将震撼来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读。6.6 折票限时特惠(立减1400元),学生票仅 599 元!

推荐阅读
  • 用Go重构C语言系统,这个抗住春晚红包的百度转发引擎承接了万亿流量

  • 日均350000亿接入量,腾讯TubeMQ性能超过Kafka

  • 从基本组件到结构创新,67页论文解读深度卷积神经网络架构

  • MobileNets进化史

  • 假如有人把支付宝存储服务器炸了

  • 小米 9 年,雷军开启 AIoT 与 5G 超级互联网时代

  • 揭秘支撑双 11 买买买背后的硬核黑科技

  • 智链万源CEO董宁:企业数字化建设迫在眉睫 | 链人物

  • 他的公司1年令比特币暴跌数次,上榜福布斯捐10亿美元的跨界传奇


  • 你点的每个“在看”,我都认真当成了AI

Google、微软、阿里、腾讯、百度这些大公司在GitHub上开源投入排名分析 | CSDN原力计划...相关推荐

  1. 各大公司在GitHub上开源投入排名分析

    现在有越来越多的公司都参与了开源,其背后有各自的目的所在,姑且不予讨论.本文是从多个方面分析各大公司在开源上的投入情况.由于全世界绝大多数的开源项目都有发布到Github上,因此本文将会基于GitHu ...

  2. 全面分析阿里数据中台,小白也能看懂 | CSDN原力计划

    扫码参与CSDN"原力计划" 作者 | yuanziok 来源 | CSDN原力计划获奖作品 数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享,2015年阿里提出&qu ...

  3. Google是如何做Code Review的?| CSDN原力计划

    作者 | 帅昕 xindoo 编辑 | 屠敏 出品 | CSDN 博客 我和几个小伙伴一起翻译了Google前一段时间放出来的Google's Engineering Practices docume ...

  4. 各大集团技术团队社区-微软-阿里-腾讯-百度-美团

    百度AI社区:http://ai.baidu.com/forum/topic/list/169 阿里云栖社区:https://yq.aliyun.com/articles/ 美团技术团队:https: ...

  5. 大公司在Github的开源代码

    最近开始学着使用github,对于我这个菜鸟来说看懂这个英文网站已经很不容易.网上无意看到一篇文章,感觉很好,现转载.希望自己有时间有能力去读读开源代码,也希望不仅仅是用别人的东西,自己可以为开源贡献 ...

  6. 各大公司在github的开源代码

    Alibaba(阿里巴巴):阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人,于1999年在中国杭州创立. https://github.com/alibaba 例如 ...

  7. Google 是如何做 Code Review 的?| 原力计划

    作者 | 帅昕 xindoo 责编 | 屠敏 出品 | CSDN 博客 我和几个小伙伴一起翻译了Google前一段时间放出来的Google's Engineering Practices docume ...

  8. 百度阿里腾讯杀入语音识别,这家公司靠什么对抗巨头

    原标题:百度阿里腾讯杀入语音识别,这家公司靠什么对抗巨头 云知声CEO黄伟 一家语音识别的人工智能公司,想利用算法+数据,将线上和线下服务打通,押宝物联网. 撰稿|王宇寒 摄影|蒲东峰 2016年3月 ...

  9. 瞄准汽车云,字节云业务走向“阿里腾讯百度”化?

    字节跳动被媒体报道进军云计算已经过去了一个季度.现在,更多的信息披露出来. 36氪报道,在从亚马逊云和京东云等公司招募人员的同时,字节已经推出汽车云业务,涵盖了云计算三大层面的服务,并且正与一家新造车 ...

最新文章

  1. 南开大学教授:科研开源的行动倡议!
  2. 桂林哪些职校可以学计算机,桂林市有几个中等职业学校
  3. js和css被屏蔽了,拦截器 Filter ,js、css、image等静态资源不被拦截解决方案
  4. 不要被约束的意思_俗话说:“娶妻不娶颧骨高,嫁汉不嫁连眉梢”,到底什么意思?...
  5. qaxwidget传递参数到html,记一次QT使用QAxWidget打开.html文件调用显示离线百度地图不能缩放,自定义图片不能显示解决方法...
  6. 手把手教你上手Git并上传项目到GitHub官网
  7. python append函数 循环_Python中循环后使用list.append数据被覆盖问题的解决
  8. 下载应用 ipa 包,不妨试试这款开源工具
  9. pytdx 获取板块指数_板块指数指标详解 通达信源码指标
  10. win7sp1怎么共享计算机,win7怎么升级到sp1?win7可以直接升级win7 sp1版本吗
  11. oracle去空格和换行,ORACLE 中去回车、空格、TAB的函数
  12. 大厂面经丨Nginx 面试 40 问
  13. 人工智能帮你生成中意的名字
  14. java使用knn实现mnist_java使用knn实现mnist - 百度学术
  15. 中小企业外贸软件ERP平台搭建介绍
  16. 大数据-玩转数据-MaxCompute 字符串函数
  17. C++学习笔记(十)——String类
  18. OPTEE学习笔记 - AArch64 RPC(一)
  19. 163邮箱开通后到期怎么续费?收费邮箱续费指南
  20. ArcGIS 要素转面 消除重叠

热门文章

  1. [原创]Gerrit中文乱码问题解决方案分享
  2. xtrabackup2.4 备份Precona5.6数据库,做增量备份与还原
  3. C#不错的扩展工具类
  4. [给12306支招]取消车票预订-采用全额预售(充值)
  5. html图片缩放6,四款css 图片按比例缩放实例(兼容ie6,7,firefox)
  6. Python标准库介绍
  7. Matlab使用笔记
  8. 遗传算法中的选择操作
  9. Asp.Net Core 入门(一)——Program.cs做了什么
  10. 特征工程:特征生成,特征选择(三)