专访腾讯云沙开波:从无到有,打造全球领先调度系统
“以前每个周末都去跑跑步、打打球,现在回家就是接接小孩,随着年龄的增长,很多爱好都丢了。”
\\\\
沙开波——腾讯云计算产品总监,从一名基础架构组的程序员,到如今腾讯云计算产品总监,这已是他在腾讯的第9个年头。
\\\\
在腾讯云内部,他是著名的腾讯云大规模调度系统VStation的技术负责人,同事们喜欢称他“老沙”。
\\
\\
VStation是腾讯云自主研发的革命性虚拟化平台,承载了腾讯云 CVM 后台的整体集群管理与系统调度。VStation为腾讯云 CVM 业务的爆发式增长提供了坚实的技术基础,目前,单集群可以调度10万台计算机。
\\\\
时间回到2009年,初入腾讯的沙开波,就职于腾讯B2(Business2)研发部的基础架构组,也就是大家熟知的QQ空间、QQ会员、Q钻等业务基础架构组的一位程序员。沙开波表示:“2009年5月份来到腾讯,那个时候还没有腾讯云这个业务。”
\\\\
“我还是比较偏技术的,自己对技术这块也比较感兴趣,当一个技术难点被解决后,成就感会瞬间爆表,我觉得每个做技术的应该都有这样的感觉。”
\\
从2009年对云尝试,到2011年正式投入,再到2013年正式开放,最后到今天的成果,沙开波是腾讯云成长的见证人,而伴随腾讯战略、腾讯云逐渐走向成熟,沙开波也逐渐从技术走向了管理。
\\\\
自从他从技术走向管理,更大的精力是需要放在业务规划、整体技术架构、以及人才梯队建设、执行效率等上面。“虽然现在已经很少写代码,但是我并不担心淘汰或者落伍,最起码,现在同事问我一些技术层面问题,我还能解决,”老沙笑着说。
\\\\
5千节点是一道坎,10万节点的技术难度可想而知
\\\\
从技术转向管理,沙开波并不认为这是他技术人生的转折点。然而,当一个“吹毛求疵”的“技术宅”走上管理岗,会擦出什么样的火花?腾讯云分布式调度系统VStation的成绩足以说明。
\\\\
“我们研究了国内外主要的大规模调度系统,不要说单集群10万,就是几千节点,一般的调度系统都很容易出现问题。”
\\\\
大家熟悉的OpenStack项目就是如此。要管理10万级别的计算机这样大规模的调度系统,国内外没有任何已有的系统和资料可以参考。对于腾讯云来说,只有从零开始,而且要做就做到最好。
\\\\
技术上,5000节点是一道大的门槛, 业界知名的Google、Amazon云平台都遇到过大规模停机的事情,很多问题你是无法预料到的。只有经历大规模部署,有些问题才会出现,所以背后的技术难度可想而知。
\\\\
“从开始决定做这个系统之后,我们就从各个技术小组抽调了10来个人,联合攻坚。前后1-2个月时间,就把系统做出来了,这个系统背后的每一条代码都是我们自己从无到有开发出来的。”沙开波介绍说。
\\\\
“我的个性是这样的,只要有一个事情放在那个地方没有解决的话,就会白天想、晚上想。”按照沙开波的描述,出身技术的他本身就是一个技术狂,或者说是工作狂。通常情况下,一个任务布置下来,两个星期交付都没有问题,但沙开波却一定要尽可能两天把它搞出来,然后留更多的时间去完善。
\\\\
“我们的目标是5秒创建虚拟机”,VStation再进化
\\\\
腾讯云分布式调度系统VStation通过消息压缩、镜像缓存、快照回滚等系列优化实践,实现了生产吞吐率从数百台 /分钟到数万台 /分钟、平均创建时间由 300秒下降到 30秒以下的惊人蜕变。
\\\\
在谈到VStation升级问题时,沙开波非常兴奋,并表示腾讯云内部的目标“希望虚拟机在5秒到10秒之间就可以创建出来,并希望通过软硬结合的方式,降低虚拟化带来性能损耗的问题。”
\\\\
从30秒降到10秒以内,对于技术来说又是一次质的飞跃。沙开波深知,这个计划如果完成,对于整个腾讯云技术来说,将是又一次洗礼,但是这个没有退路。
\\\\
创建速度快,意味着用户体验更好。站在用户的立场,如果能够快速的帮助企业创建出来,这不仅仅是时间的问题,更多的是对用户业务上的帮助。“我们在团队里一直强调,我们做弹性计算,首先计算要能弹,能快速地去交付给用户,如果创建一个机器需要几分钟,一个小时才能拿到的话,这不叫云计算!”
\\\\
关于创建速度的问题,沙开波直言不讳:“从目前来看,我们的创建速度非常有竞争力,即便和国内外更早布局云计算的公有云厂商对比,我们也有足够的自信。”
\\\\
另外,云计算最开始考虑的是如何把计算或网络跟物理机解耦,其中虚拟化技术起到了关键的作用。但不可否认,云变成一个基础设施的时候,虚拟化虽占尽优势,但却增加了性能上的损耗,其中包括网络、存储等等。
\\\\
而在采访中,沙开波也表示这也是腾讯云所关注的问题。“我们正在做一些软硬结合的工作,来降低虚拟化带来性能损耗的问题,不论是网络还是存储,我们最终目标还是弹性的计算,希望用户可以按需获得媲美物理计算资源的弹性云计算资源。”
\\\\
用户是最好的“裁判员”,“靠近”才能明晰方向
\\\\
2015年,马化腾在给合作伙伴的一封信中提到:“一切以用户价值为依归,自始至终,用户、员工都是我们的两条生命线。”
\\\\
而在沙开波的眼中,用户才是最好的“裁判员”,所有的技术升级和突破,归根结底就是要让技术普惠化,让技术为人所用。
\\\\
不可否认的一条市场定律,“需求才是生产力”。或许正是沙开波想法的诠释。据了解,腾讯云产品的优先级是基于客户的需求来的,很多产品和技术都是来自于客户实际的想法以及真实的诉求。
\\\\
另外,基于“以用户价值为依归”的理念,沙开波也正在带领团队走近用户。“今年从上到下希望离用户更近一点,也多跟客户去聊,了解客户的诉求和需求”。他透露这是2018年重点要去改变的方向。
\\\\
正如沙开波口中“裁判员”的说法,一个产品团队产品做得好和不好,客户的评价往往是最中肯、实用的。在谈及工作中遇到的问题、以及如何解决问题的时候,沙开波描述了他们解决问题的思路。
\\\\
“先去帮助客户去解决问题,虚心接受客户的吐槽,之后再优化产品。”
\\\\
以这样的工作理念,沙开波在腾讯已经走过了9年的时间。目前,在沙开波眼中腾讯云还在不断“闯关升级”,但可以肯定的是,未来在千万个具备匠人精神的“沙开波”努力下,腾讯云将会更茁壮,为用户带来更多的价值。
专访腾讯云沙开波:从无到有,打造全球领先调度系统相关推荐
- 腾讯云联合图元科技打造新一代城市“运管服平台”,助力城市治理智慧化
3月9日,腾讯云联合图元科技共同发布新一代城市运行管理服务平台解决方案.双方将充分发挥产业互联网创新能力和智慧城管领域理解能力,持续助力城市治理科学化.精细化.智能化,促进城市高质量发展. 自住建部提 ...
- 腾讯云轻量应用服务器搭建即时通信 IM系统
我们如果想要搭建一个自己的即时通信系统,实现与好友的单聊或者创建群聊,这里推荐大家使用腾讯云的即时通信IM产品,部署十分简单,并且提供了免费版套餐可供试用.下面为大家介绍如何使用腾讯云轻量应用服务器搭 ...
- VANSI打造全球领先的区块链数字资产交易平台
区块链技术在过去几年实现大幅发展,而以比特币.以太坊为代表的,基于区块链底层技术的数字货币市场也经历了爆炸式的发展.截止2018年1月31日,全球可交易的数字货币已超过1500种,经济体量超过5000 ...
- 中国联通与成都携手,合作打造全球领先的大数据平台
近日中国联通大数据有限公司与四川省成都市高新区正式签署了中国联通成都国际大数据智能产业基地项目合作协议,双方合作打造全球领先的大数据平台. 根据双方签署的协议,大数据智能产业基地项目将着力于高新区大数 ...
- 万达电影携手神策数据 数据赋能打造全球领先电影生活生态圈
近日,万达电影宣布与大数据分析服务公司神策数据正式签约. 双方将在夯实数据基础.深化大数据技术和用户行为分析在电影连锁院线的应用等方面开展合作,促进科技产品与服务创新,为消费者提供全生态链的智慧生活场 ...
- 专访腾讯云谢岳峰:只做连接器,五大措施支持渠道伙伴成长
7月5日,腾讯云+未来峰会在深圳举行,面对现场1100多位与会嘉宾,腾讯公司董事会主席兼首席执行官马化腾表示,云是"互联网+"基础设施的第一要素.作为基础设施的云如何才能支持全产业 ...
- 独家专访腾讯云CTO王慧星:云技术变革上下二十年
以下文章来源于InfoQ ,作者InfoQ 发展十余年,腾讯云技术演进的底层变迁逻辑是什么?低代码会不会是云计算下一个风口?未来十年,开发者面对的技术世界是什么样子? 本期 C 位面对面,我们有幸邀请 ...
- 解决企业数字化“历史遗留问题”,低代码具备天然优势 | 专访腾讯云微搭骆勤
据Gartner机构预测,到2025年,企业70%的新应用将会通过低代码或者无代码技术进行开发.还有数据显示,2020年中国的低市场规模已经达到19亿元,而到2024年,低代码市场将达到百亿量级. 左 ...
- AI技术实践|用腾讯云智能文本图像增强打造一个掌上扫描仪
在日常生活.工作中, 受限于拍照技术.拍摄条件等制约,得到的文本图像往往存在光照不均.角度倾斜.文字模糊等情况.这种低质量的文本图像不仅不利于保存和后续研究,也不利于光学字符识别.为了解决以上问题,特 ...
最新文章
- IPython、python shell(command line)、pycharm,python,python IDLE的区别是什么?
- 【 ML 】Newton – Raphson Iteration Procedure of TOA - Based Positioning Simulation
- 【LeetCode】414.第三大的数
- Java计算两个程序运行时间
- 大分区表高并发性能提升100倍?阿里云 RDS PostgreSQL 12 解读
- LeetCode Solutions : Reorder List
- 20211109:DC综合的一些简单概念理解记录
- OpenCV距离变换函数:distanceTransform()介绍
- Laravel5中基于jQuery实现分层级的类目树结构方法
- PHP连接 SQLSERVER 注意事项(经典中的经典)
- NOIP2017 D2T1 奶酪
- IT成长日记(二)——打印机硒鼓重置
- JavaScript笔记
- 任正非对姚安娜是劝退式支持吗
- linux删除缓存文件swp,Vi下删除SWP文件
- 贷超、贷超分销系统 贷超分销模式 简介
- 计算机职业生涯测评,皮纹检测职业版——职业生涯规划指南测评系统
- JavaScript 判断是否是数字 isFinite() Number.isFinite()
- Leetcode 300-最长递增子序列
- Oracle根据当前时间获取最近5年,最近6个月,最近30天的时间
热门文章
- JavaScript中的load事件的作用_史上最全的web前端面试题汇总及答案JavaScript之二(二)...
- python 销量预测模型_如何做电商的销量预测模型?
- gtk linux 升级_需要在Ubuntu上更新GTK(10.04)
- 联想杜比音效_联想小新15 2020锐龙版开售
- 【Spring MVC学习】WebApplicationContext初始化的三种方式
- xampp python linux,Ubuntu的XAMPP着运行python脚本
- clob存base64文件存不进去_Kafka 和 RocketMQ 底层存储之那些你不知道的事
- 前端图片上坐标连线_平面上三角形“四心”的解析建模
- html5游戏变速,深入游戏变速底层原理以及内核变速的实现
- oracle和arcgis优势,Oracle spatial 使用的一些感受